JP2022114742A - サーバ装置、通信端末装置及び表示方法 - Google Patents

サーバ装置、通信端末装置及び表示方法 Download PDF

Info

Publication number
JP2022114742A
JP2022114742A JP2021011160A JP2021011160A JP2022114742A JP 2022114742 A JP2022114742 A JP 2022114742A JP 2021011160 A JP2021011160 A JP 2021011160A JP 2021011160 A JP2021011160 A JP 2021011160A JP 2022114742 A JP2022114742 A JP 2022114742A
Authority
JP
Japan
Prior art keywords
conversation
session
communication terminal
terminal device
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021011160A
Other languages
English (en)
Inventor
弘 乙幡
Hiroshi Oppata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2021011160A priority Critical patent/JP2022114742A/ja
Publication of JP2022114742A publication Critical patent/JP2022114742A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】複数の通信端末装置の間で複数の会話が行われている場合に、他の通信端末装置のユーザが参加したい会話を容易に選択することを可能とするサーバ装置を提供する。【解決手段】音声取得部130は、複数の通信端末装置の間で行われている1つ以上の会話セッションそれぞれの音声データを取得する。文字情報生成部140は、取得されたセッション音声データを用いて、対応する会話セッションの会話の内容を文字列で示す文字情報を生成する。表示制御部160は、通信端末装置が参加することを許可されることによって参加可能な会話セッションを列挙し、会話セッションそれぞれに対応する文字情報を示す参加可能セッション選択リストを、対応する通信端末装置に表示させるための制御を行う。【選択図】図3

Description

本発明は、サーバ装置、通信端末装置及び表示方法に関する。
近年、ネットワークを介して互いに離れた地点に設けられた複数の通信端末装置の間で会話を行うことが可能となっている。このような遠隔で会話を行うシステムでは、会話の参加者が1つの場所に集まる必要はなく、各参加者は、各々の席又は自宅等にいながら、会話に参加することができる。
このような技術に関連し、特許文献1は、会話環境とミーティング実施形態とを単一のアプリケーション内に含むユーザ体験を提供するシステムを開示する。システムは、ユーザによって選択される環境によって決まる、会話スレッドまたはミーティングのリストを表示する選択枠を含む。ユーザは、ミーティングおよび会話の検索を行うことが可能になる。
特表2012-519452号公報
遠隔で複数の会話が行われている場合、会話に参加していない通信端末装置のユーザがどの会話に参加するかを選択することは難しい。ここで、特許文献1にかかる技術では、単にミーティング等の会話名を含むリストを表示し、そのリストからユーザに選択させる。このような技術では、ユーザは、実際の会話の内容が分からないので、そのユーザが参加したい会話であるのか判断することが困難である。したがって、特許文献1にかかる技術では、ユーザが参加したい会話を選択することは困難である。
上記課題に鑑み、本発明は、複数の通信端末装置の間で複数の会話が行われている場合に、他の通信端末装置のユーザが参加したい会話を容易に選択することを可能とするサーバ装置、通信端末装置及び表示方法を提供することを目的とする。
本発明にかかるサーバ装置は、通信ネットワークに接続されたサーバ装置であって、複数の通信端末装置の間で行われている1つ以上の会話セッションそれぞれの音声データを取得する音声取得部と、取得された前記音声データを用いて、対応する前記会話セッションの会話の内容を文字列で示す文字情報を生成する文字情報生成部と、前記会話セッションのうち第1の通信端末装置が参加を許可されている1つ以上の会話セッションのいずれに参加するかを選択するために当該会話セッションそれぞれに対応する前記文字情報の少なくとも一部を示すリストを当該第1の通信端末装置に表示させるための制御を行う表示制御部と、を有する。
また、本発明にかかる通信端末装置は、複数の他の通信端末装置の間で行われている1つ以上の会話セッションのうち当該通信端末装置が参加を許可されている1つ以上の会話セッションそれぞれの音声データを取得する音声取得部と、取得された前記音声データを用いて、対応する前記会話セッションの会話の内容を文字列で示す文字情報を生成する文字情報生成部と、前記会話セッションのいずれに参加するかを選択するために当該会話セッションそれぞれに対応する前記文字情報の少なくとも一部を示すリストを表示する表示部と、を有する。
また、本発明にかかる表示方法は、通信ネットワークにおいて、複数の通信端末装置の間で行われている1つ以上の会話セッションそれぞれの音声データを取得し、前記取得された音声データを用いて、対応する前記会話セッションの会話の内容を文字列で示す文字情報を生成し、前記会話セッションのうち第1の通信端末装置が参加を許可されている1つ以上の会話セッションのいずれに参加するかを選択するために当該会話セッションそれぞれに対応する前記文字情報の少なくとも一部を示すリストを当該第1の通信端末装置に表示させるための制御を行う。
本発明によれば、複数の通信端末装置の間で会話が行われている場合に、他の通信端末装置のユーザが参加したい会話に容易に参加することを可能とするサーバ装置、通信端末装置及び表示方法を提供することができる。
実施の形態1にかかる遠隔会話システムを示す図である。 実施の形態1にかかる通信端末装置の構成を示す図である。 実施の形態1にかかるサーバ装置の構成を示す図である。 実施の形態1にかかるセッション管理部によって管理されるセッション情報を例示する図である。 実施の形態1にかかるリスト生成部によって生成される参加可能セッションリストを例示する図である。 実施の形態1にかかる遠隔会話システムで情報が送受信される状態を例示する図である。 通信端末装置で表示される参加可能セッション選択リストを例示する図である。 実施の形態1にかかるサーバ装置によって行われる処理を示すフローチャートである。 実施の形態2にかかる遠隔会話システムを示す図である。 実施の形態2にかかる通信端末装置の構成を示す図である。 実施の形態2にかかる通信端末装置によって行われる処理を示すフローチャートである。
(実施の形態1)
以下、実施形態について、図面を参照しながら説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
図1は、実施の形態1にかかる遠隔会話システム1を示す図である。遠隔会話システム1は、複数の通信端末装置30と、サーバ装置100とを有する。通信端末装置30は、遠隔で行われる会話のセッション(会話セッション)に参加し得るユーザごとに設けられ得る。なお、会話セッションは、2以上の通信端末装置30が参加して遠隔で行われている会話(遠隔会話)の1つ1つの単位である。複数の通信端末装置30と、サーバ装置100とは、互いにネットワーク12を介して通信可能に接続されている。ネットワーク12は、通信ネットワークであって、有線であってもよく、無線であってもよく、有線と無線の組み合わせであってもよい。ネットワーク12は、インターネットであってもよいし、LAN(Local Area Network)であってもよい。遠隔会話は、例えば、遠隔会議、ウェブ会議、ウェブミーティング、オンラインミーティング、オンライン会議などである。
通信端末装置30は、例えば、ユーザが所有しているコンピュータである。通信端末装置30は、例えば、パソコン(PC:Personal Computer)、及び、スマートフォン又はタブレット端末等の携帯端末である。通信端末装置30は、ユーザが会話セッションに参加する際に、ユーザの発した音声を示す音声データ(ユーザ音声データ)を、ネットワーク12を介してサーバ装置100に送信する。また、通信端末装置30は、会話セッションに参加しているユーザの音声を示す音声データ(セッション音声データ)を、ネットワーク12を介してサーバ装置100から受信する。そして、通信端末装置30は、セッション音声データに対応する音声を、その通信端末装置30のユーザが聴取可能に出力する。
サーバ装置100は、例えば、サーバ等のコンピュータである。サーバ装置100は、1つ以上の会話セッションを管理する。サーバ装置100は、各参加者の通信端末装置30から音声データを受信して、複数の通信端末装置30に送信する。なお、この場合、サーバ装置100は、音声データを送信した通信端末装置30には、その音声データを送信しなくてもよい(他の実施の形態でも同様)。なお、実施の形態1において、用語「音声」は、情報処理における処理対象としての、「音声を示す音声データ」も意味し得る。
図2は、実施の形態1にかかる通信端末装置30の構成を示す図である。通信端末装置30は、主要なハードウェア構成として、制御部32と、記憶部34と、通信部36と、インタフェース部38(IF:Interface)を有する。制御部32、記憶部34、通信部36及びインタフェース部38は、データバスなどを介して相互に接続されている。
制御部32は、例えばCPU(Central Processing Unit)等のプロセッサである。制御部32は、制御処理及び演算処理等を行う演算装置としての機能を有する。記憶部34は、例えばメモリ又はハードディスク等の記憶デバイスである。記憶部34は、例えばROM(Read Only Memory)又はRAM(Random Access Memory)等である。記憶部34は、制御部32によって実行される制御プログラム及び演算プログラム等を記憶するための機能を有する。また、記憶部34は、処理データ等を一時的に記憶するための機能を有する。記憶部34は、データベースを含み得る。
通信部36は、サーバ装置100等の遠隔会話システム1を構成する装置と通信を行うために必要な処理を行う。通信部36は、通信ポート、ルータ、ファイアウォール等を含み得る。インタフェース部38は、例えばユーザインタフェース(UI)である。インタフェース部38は、キーボード、タッチパネル又はマウス等の入力装置と、ディスプレイ又はスピーカ等の出力装置とを有する。インタフェース部38は、ユーザ(オペレータ)によるデータの入力の操作を受け付け、ユーザに対して情報を出力する。また、インタフェース部38は、入力装置として、マイクロフォン等の集音装置、及び、カメラ等の撮像装置を有し得る。また、インタフェース部38の少なくとも一部は、通信端末装置30と物理的に一体である必要はない。インタフェース部38の少なくとも一部は、通信端末装置30と、有線又は無線によって接続されていてもよい。
また、通信端末装置30は、構成要素として、ユーザ音声取得部42、ユーザ音声送信部44、音声受信部46、及び、音声出力部48を有する。また、通信端末装置30は、構成要素として、リスト要求送信部50、リスト受信部52、リスト表示部54、選択処理部56、参加要求送信部60、及び、参加処理部62を有する。これらの構成要素は、上述したハードウェア構成によって実現されてもよいし、ソフトウェアによって実現されてもよい。
ユーザ音声取得部42、ユーザ音声送信部44、音声受信部46及び音声出力部48は、通信端末装置30が会話セッションに参加している場合に動作し得る。一方、リスト要求送信部50、リスト受信部52、リスト表示部54、選択処理部56、参加要求送信部60及び参加処理部62は、通信端末装置30が会話セッションに参加していない場合に動作し得る。あるいは、リスト要求送信部50、リスト受信部52、リスト表示部54、選択処理部56、参加要求送信部60及び参加処理部62は、通信端末装置30が現在参加している会話セッションから離脱して別の会話セッションに参加し直す場合に動作し得る。
ユーザ音声取得部42は、遠隔会話の参加者である通信端末装置30のユーザの発した音声を取得する。ユーザ音声取得部42は、インタフェース部38である集音装置によって音声を取得してもよい。ユーザ音声送信部44は、取得されたユーザの音声(ユーザ音声データ)を、ネットワーク12を介して、サーバ装置100に送信する。ユーザ音声送信部44は、通信部36によって音声を送信してもよい。
音声受信部46は、遠隔会話に参加している複数のユーザの音声(セッション音声データ)を、ネットワーク12を介して、サーバ装置100から受信する。音声受信部46は、通信部36によって音声を受信してもよい。音声受信部46は、セッション音声データを、ストリーミングデータとして受信してもよい。音声出力部48は、複数のユーザの音声(セッション音声データ)を、通信端末装置30のユーザが聴取可能に出力する。音声出力部48は、インタフェース部38であるスピーカによって音声を出力してもよい。
リスト要求送信部50は、参加可能セッション選択リストをサーバ装置100に要求するための信号(リスト要求)を、ネットワーク12を介して送信する。リスト要求送信部50は、通信部36によってリスト要求を送信してもよい。ここで、参加可能セッション選択リストとは、通信端末装置30が参加することを許可されることによって参加可能な会話セッションを列挙したリストである。なお、通信端末装置30が参加可能な会話セッションとは、通信端末装置30のユーザが参加可能な会話セッションということもできる。参加可能セッション選択リストは、通信端末装置30が参加するための会話セッションを選択するためのリストである。ここで、参加可能セッション選択リストは、会話セッションの会話の内容を文字列で示している。参加可能セッション選択リストの詳細については後述する。リスト要求は、少なくとも、通信端末装置30又はユーザの識別情報を含む。
リスト受信部52は、リスト要求に応じてサーバ装置100から送信されたリスト表示指示を、ネットワーク12を介して受信する。なお、リスト表示指示は、参加可能セッション選択リストを表示させるための信号(命令)である。リスト受信部52は、通信部36によってリスト表示指示を受信してもよい。
リスト表示部54は、受信されたリスト表示指示により、参加可能セッション選択リストを表示する。リスト表示部54は、インタフェース部38であるディスプレイによって、参加可能セッション選択リストに対応する画像を表示してもよい。ここで、リスト表示部54は、後述するように、サーバ装置100による制御によって、参加可能セッション選択リストを表示する。
選択処理部56は、参加可能セッション選択リストに列挙された会話セッションから、通信端末装置30が参加する会話セッションを選択するための処理を行う。選択処理部56は、インタフェース部38である入力装置(タッチパネル又はマウス等)に対するユーザの操作に応じて、会話セッションを選択してもよい。
参加要求送信部60は、選択された会話セッションに参加するための信号(命令)である参加要求を、ネットワーク12を介して、サーバ装置100に送信する。参加要求送信部60は、通信部36によって参加要求を送信してもよい。参加要求は、少なくとも、通信端末装置30又はユーザの識別情報と、会話セッションの識別情報とを含む。参加処理部62は、サーバ装置100による制御によって、参加要求に対応する会話セッションに通信端末装置30が参加するための処理を行う。
図3は、実施の形態1にかかるサーバ装置100の構成を示す図である。サーバ装置100は、主要なハードウェア構成として、制御部102と、記憶部104と、通信部106と、インタフェース部108とを有する。制御部102、記憶部104、通信部106及びインタフェース部108は、データバスなどを介して相互に接続されている。
制御部102は、例えばCPU等のプロセッサである。制御部102は、解析処理、制御処理及び演算処理等を行う演算装置としての機能を有する。記憶部104は、例えばメモリ又はハードディスク等の記憶デバイスである。記憶部104は、例えばROM又はRAM等である。記憶部104は、制御部102によって実行される制御プログラム及び演算プログラム等を記憶するための機能を有する。また、記憶部104は、処理データ等を一時的に記憶するための機能を有する。記憶部104は、データベースを含み得る。
通信部106は、通信端末装置30等の他の装置とネットワーク12を介して通信を行うために必要な処理を行う。通信部106は、通信ポート、ルータ、ファイアウォール等を含み得る。インタフェース部108は、例えばユーザインタフェース(UI)である。インタフェース部108は、キーボード、タッチパネル又はマウス等の入力装置と、ディスプレイ又はスピーカ等の出力装置とを有する。インタフェース部108は、オペレータによるデータの入力の操作を受け付け、オペレータに対して情報を出力する。
実施の形態1にかかるサーバ装置100は、構成要素として、セッション管理部110、リスト生成部120、及び、リスト格納部122を有する。また、サーバ装置100は、構成要素として、リスト要求受信部124、音声取得部130、文字情報生成部140、履歴記憶部150、表示制御部160、参加要求受信部170、及び、参加制御部172を有する。なお、サーバ装置100は、物理的に1つの装置で構成されていなくてもよい。この場合、上述した各構成要素は、物理的に別個の複数の装置によって実現されてもよい。
なお、上述した各構成要素は、例えば、制御部102の制御によって、プログラムを実行させることによって実現できる。より具体的には、各構成要素は、記憶部104に格納されたプログラムを、制御部102が実行することによって実現され得る。また、必要なプログラムを任意の不揮発性記録媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。これらのことは、後述する他の実施の形態においても同様である。
また、各構成要素は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組み合わせ等により実現してもよい。また、各構成要素は、例えばFPGA(field-programmable gate array)又はマイコン等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。これらのことは、後述する他の実施の形態においても同様である。
セッション管理部110は、現在実行されている会話セッションの管理を行う。具体的には、セッション管理部110は、会話セッションごとに、その会話セッションに参加している通信端末装置30からユーザ音声データを受信する。また、セッション管理部110は、会話セッションごとに、その会話セッションに参加している通信端末装置30にセッション音声データを送信する。これにより、セッション管理部110は、会話セッションを実行する。なお、セッション管理部110は、ミキシング処理を行って、複数のユーザの音声が同時に発せられた場合にそれぞれの音声が途切れないように合成する処理を行った上で、セッション音声データを送信してもよい。セッション管理部110は、通信部106によって、音声データを送受信する。また、セッション管理部110は、会話セッションごとに、会話セッションに参加している通信端末装置30及び参加可能な通信端末装置30を示すセッション情報を管理してもよい。
図4は、実施の形態1にかかるセッション管理部110によって管理されるセッション情報を例示する図である。セッション情報は、セッションIDと、参加端末IDと、参加可能端末IDとを含む。セッションIDは、会話セッションの識別情報である。参加端末IDは、その会話セッションに現在参加している通信端末装置30の識別情報である。参加可能端末IDは、その会話セッションに現在参加していないが、参加する資格を有する通信端末装置30の識別情報である。ここで、「参加する資格を有する通信端末装置30」とは、例えば、その会話セッションに招待された通信端末装置30であるが、これに限定されない。さらに、会話セッションへの招待は、通信端末装置30の1つによって行われる。そして、招待を行う通信端末装置30は、招待される通信端末装置30を指定する指定情報をサーバ装置100に送信する。指定情報は、会話セッションの識別情報と、その会話セッションに参加を許可された通信端末装置30の識別情報とを含む。そして、その指定情報がセッション管理部110に登録されることで、会話セッションが開始される。セッション管理部110は、この指定情報に基づいて、図4に例示されたセッション情報を生成してもよい。例えば、図4の例では、セッション#1に関する指定情報は、端末A,端末B,端末C,端末D,及び端末Xを、参加が許可された通信端末装置30として指定している。また、セッション#2に関する指定情報は、端末E,端末F,端末G,端末H,端末X及び端末Yを、参加が許可された通信端末装置30として指定している。
また、図4の例では、セッションID「セッション#1」に参加している通信端末装置30の識別情報は、「端末A」、「端末B」、「端末C」及び「端末D」である。また、セッションID「セッション#1」に参加していないが参加可能な通信端末装置30の識別情報は、「端末X」である。また、セッションID「セッション#2」に参加している通信端末装置30の識別情報は、「端末E」、「端末F」、「端末G」及び「端末H」である。また、セッションID「セッション#2」に参加していないが参加可能な通信端末装置30の識別情報は、「端末X」及び「端末Y」である。
リスト生成部120(図3)は、通信端末装置30ごとに、参加可能セッションリストを生成する。ここで、参加可能セッションリストは、対応する通信端末装置30が参加可能な会話セッション(参加可能セッション)を列挙したリストである。例えば、リスト生成部120は、図4に例示したセッション情報を用いて、参加可能セッションリストを生成してもよい。具体的には、リスト生成部120は、指定情報に基づいて生成されたセッション情報から、通信端末装置30それぞれが参加可能な会話セッションを抽出することにより、参加可能セッションリストを生成してもよい。したがって、通信端末装置30が参加可能な会話セッションは、ある通信端末装置30によって送信された指定情報に基づいて抽出されると言える。参加可能セッションリストは、後述する参加可能セッション選択リストを生成するために使用され得る。つまり、リスト生成部120は、参加可能セッション選択リストを表示させるための情報である参加可能セッションリストを生成する。リスト格納部122は、リスト生成部120によって生成された参加可能セッションリストを格納する。
図5は、実施の形態1にかかるリスト生成部120によって生成される参加可能セッションリストを例示する図である。参加可能セッションリストは、通信端末装置30の識別情報である端末IDと、参加可能セッションIDとを含む。参加可能セッションIDは、対応する通信端末装置30が参加可能な会話セッションの識別情報を示す。
図5の例では、端末ID「端末X」の通信端末装置30が参加可能な会話セッションの識別情報は、「セッション#1」、「セッション#2」、「セッション#3」及び「セッション#4」である。また、端末ID「端末Y」の通信端末装置30が参加可能な会話セッションの識別情報は、「セッション#2」及び「セッション#3」である。
リスト要求受信部124は、通信端末装置30からリスト要求を受信する。リスト要求受信部124は、通信部106によってリスト要求を受信する。サーバ装置100は、受信されたリスト要求に応じて、そのリスト要求を送信した通信端末装置30が参加可能な会話セッションのリストを、その通信端末装置30に送信する。
なお、リスト生成部120は、リスト要求を送信した端末についてのみ、参加可能セッションリストを生成してもよい。例えば、リスト要求受信部124が端末ID「端末X」の通信端末装置30からリスト要求を受信した場合、リスト生成部120は、図5に例示した端末ID「端末X」の参加可能セッションリストのみを生成してもよい。
図6は、実施の形態1にかかる遠隔会話システム1で情報が送受信される状態を例示する図である。以下に示す説明では、適宜、図4~図6に示す例について説明する。図6に示す例では、図4に示した、通信端末装置30A~30D(端末A~端末D)が参加するセッションID「セッション#1」の会話セッションが実行されている。通信端末装置30A(端末A)は、通信端末装置30Aのユーザの音声を、サーバ装置100に送信する。通信端末装置30B(端末B)は、通信端末装置30Bのユーザの音声を、サーバ装置100に送信する。通信端末装置30C(端末C)は、通信端末装置30Cのユーザの音声を、サーバ装置100に送信する。通信端末装置30D(端末D)は、通信端末装置30Dのユーザの音声を、サーバ装置100に送信する。
また、通信端末装置30A(端末A)は、サーバ装置100から、セッション#1の音声(セッション音声データ)を受信する。同様に、通信端末装置30B~30D(端末B~端末D)は、サーバ装置100から、セッション#1に対応するセッション音声データを受信する。なお、各通信端末装置30は、そのユーザ以外の音声データで構成されるセッション音声データを受信してもよい。例えば、通信端末装置30Aは、通信端末装置30B~30Dのユーザの音声で構成されるセッション音声データを、サーバ装置100から受信してもよい。
また、図6に示す例では、セッションID「セッション#1」の会話セッションに参加していないがこの会話セッションに参加可能な通信端末装置30X(端末X)が、リスト要求を送信している。したがって、サーバ装置100は、通信端末装置30X(端末X;第1の通信端末装置)の参加可能セッション選択リストを、通信端末装置30X(端末X)に表示させる。このとき、後述するように、サーバ装置100は、通信端末装置30Xに、「セッション#1」の会話セッションの会話の内容を示す文字情報を送信する。
音声取得部130(図3)は、複数の通信端末装置30の間で行われている1つ以上の会話セッションそれぞれの音声データを取得する。具体的には、音声取得部130は、リスト要求を送信した通信端末装置30が参加可能な会話セッションのセッション音声データを取得する。さらに具体的には、音声取得部130は、リスト格納部122に格納されている参加可能セッションリストを参照して、対応する会話セッションのセッション音声データを取得する。さらに具体的には、通信端末装置30Xがリスト要求を送信したとすると、音声取得部130は、通信端末装置30Xに対応する参加可能セッションリストに含まれるセッションIDに対応する会話セッションのセッション音声データを取得する。例えば、音声取得部130は、セッション管理部110から、通信端末装置30Xが参加可能な会話セッションのセッション音声データを取得してもよい。音声取得部130は、通信端末装置30Xが参加可能な会話セッションのセッション音声データを、ストリーミングデータとして取得してもよい。
文字情報生成部140は、音声取得部130によって取得されたセッション音声データを用いて、対応する会話セッションの会話の内容を文字列で示す文字情報を生成する。図5の例において通信端末装置30Xからリスト要求が受信された場合、文字情報生成部140は、セッション#1,#2,#3,#4それぞれの会話セッションについて、会話セッションでなされている会話の内容を文字列で示す文字情報を生成する。ここで、「会話セッションの会話の内容」とは、議題、タイトル、表題、会議番号といった会話セッションを識別する情報ではない。「会話セッションの会話の内容」とは、会話セッションにおいて参加者が実際に行っている会話の具体的な内容を意味する。そして、「会話セッションの会話の内容」は、同じ会話セッションであっても、会話の進行につれて、時々刻々と変化し得る。つまり、「会話セッションの会話の内容」は、会話の進行に伴って更新され得る。
文字情報生成部140が、様々な方法によって、会話セッションの会話の内容を示す文字情報を生成することができる。例えば、第1の例として、文字情報生成部140は、セッション音声データを文字データ(テキストデータ)に変換する。これにより、文字情報生成部140は、セッション音声データの音声をそのまま文字列に変換した文字情報を生成する。つまり、第1の例における文字情報は、会話セッションにおける音声をそのまま文字列に変換したものに対応する。そして、第1の例における文字情報は、会話セッションにおける音声データを変換して得られた文字データを含む。文字情報生成部140は、例えば、音響分析及び音声認識処理等の処理を行って、音声データを文字データに変換してもよい。第1の例では、文字情報生成部140は、会話の進行に追従して、リアルタイムで、文字情報を生成する。したがって、第1の例における文字情報は、会話の進行に伴ってリアルタイムに更新されていく。
また、第2の例として、文字情報生成部140は、セッション音声データを文字データに変換する。また、文字情報生成部140は、会話の区切り又は会話中の文章の区切りを検出する。さらに、文字情報生成部140は、これらの区切りから最初の数文字(例えば10文字)のみの文字列で構成される文字情報を生成する。つまり、第2の例における文字情報は、会話セッションにおける会話を区切った各区間の最初の数文字に対応する。そして、第2の例における文字情報は、会話セッションにおける音声データを変換して得られた文字データの少なくとも一部を含む。第2の例では、文字情報生成部140は、会話又は文章の区切りごとに、文字情報を生成する。したがって、第2の例における文字情報は、会話の進行に伴って更新されていく。
なお、文字情報生成部140は、セッション音声データを文字データに変換した文字列(第1の例の文字情報に対応)を用いて、文章の区切りを検出してもよい。この場合、文章の区切りは、例えば句点又はピリオドに対応する箇所であり得る。また、文字情報生成部140は、自然言語処理等によって会話又は文章の区切りを示す言葉を検出することで、会話又は文章の区切りを検出してもよい。また、文字情報生成部140は、音声データを用いて話者の交代のタイミングを検出することで、会話の区切りを検出してもよい。また、文字情報生成部140は、音声データを用いて会話又は文章の区切りを示す音韻(語尾の上げ下げ等)を検出することで、会話又は文章の区切りを検出してもよい。また、文字情報生成部140は、音声データを用いて、発話のない状態(会話の「間」)を検出することで、会話の区切りを検出してもよい。
また、第3の例として、文字情報生成部140は、会話の要約を示す文字情報を生成してもよい。例えば、文字情報生成部140は、セッション音声データを文字データに変換した文字列(第1の例の文字情報に対応)を用いて、自然言語処理等によって会話の要約を生成してもよい。また、文字情報生成部140は、予め定められた文字数(例えば10~30文字)以内の要約を生成してもよい。ここで、文字情報生成部140は、予め定められた期間(例えば3~5分間)ごとに、会話の要約を生成してもよい。また、文字情報生成部140は、第2の例のように会話セッションにおける会話を区切った区間ごとに、会話の要約を生成してもよい。したがって、第3の例における文字情報は、会話の進行に伴って更新されていく。
履歴記憶部150は、各会話セッションの会話の履歴を示す履歴情報を記憶する。履歴情報は、会話セッションの識別情報と、文字情報生成部140によって生成された文字情報とが対応付けられた情報である。なお、履歴情報は、対応する文字情報が生成された時刻を含んでもよい。
表示制御部160は、参加可能セッション選択リストを、対応する通信端末装置30に表示させるための制御を行う。ここで、上述したように、参加可能セッション選択リストは、会話セッションに参加していない通信端末装置30が参加可能な会話セッションを列挙し、会話セッションそれぞれの会話の内容を示す文字情報を含むリストである。参加可能セッション選択リストは、通信端末装置30が参加するための会話セッションを選択するためのリストである。
表示制御部160は、通信端末装置30に対応する参加可能セッションリストと文字情報と履歴情報とを用いて、リスト表示指示を生成する。リスト表示指示は、通信端末装置30に参加可能セッション選択リストを表示させるための指示(信号)である。ここで、参加可能セッション選択リストは、通信端末装置30が参加可能な会話セッションを表示する。したがって、表示制御部160は、指定情報に基づいて抽出された、通信端末装置30が参加可能な会話セッションを、参加可能セッション選択リストに表示させるように、制御を行う。表示制御部160は、通信部106を用いて、リスト表示指示を、ネットワーク12を介して通信端末装置30に送信する。これにより、通信端末装置30のリスト表示部54は、参加可能セッション選択リストを表示する。このようにして、表示制御部160は、参加可能セッション選択リストを、通信端末装置30に表示させるための制御を行う。また、リスト表示指示は、通信端末装置30に、後述する図7に例示するように文字情報を表示させるための指示を含む。リスト表示指示は、データパケットの形式で、通信端末装置30に送信されてもよい。リスト表示指示は、文字情報と、対応する会話セッションの識別情報とを含む。
例えば、参加可能セッション選択リストは、通信端末装置30が参加可能な会話セッションそれぞれの選択ボタンと、対応する会話セッションの会話の内容を示す文字情報とを示す。そして、通信端末装置30において、表示された選択ボタンがユーザによってクリック又はタップ等の選択操作がなされることにより、その選択ボタンに対応する会話セッションが選択される。なお、文字情報は、横長の選択ボタンに重畳されて示されてもよい。また、参加可能セッション選択リストは、さらに、履歴情報を示してもよい。履歴情報は、例えば、通信端末装置30において、選択ボタンに対して右クリック操作又はロングタップ等のポップアップ画面表示操作がなされることによって、表示されてもよい。
図7は、通信端末装置30で表示される参加可能セッション選択リスト70を例示する図である。図7には、図5の例において通信端末装置30Xにおいて表示される参加可能セッション選択リストを例示する。参加可能セッション選択リスト70は、選択ボタン72と、文字情報74とを示す。図7の例において、文字情報74は、選択ボタン72に重畳されて示されている。また、通信端末装置30Xにおいて選択ボタン72を右クリックすると、その選択ボタン72に対応する会話セッションの履歴情報が表示される。
図7に例示する参加可能セッション選択リスト70は、選択ボタン72-1と、選択ボタン72-2と、選択ボタン72-3と、選択ボタン72-4とを示す。選択ボタン72-1は、セッション#1に対応する会話セッションの選択ボタンである。選択ボタン72-2は、セッション#2に対応する会話セッションの選択ボタンである。選択ボタン72-3は、セッション#3に対応する会話セッションの選択ボタンである。選択ボタン72-4は、セッション#4に対応する会話セッションの選択ボタンである。例えば、通信端末装置30Xにおいて、選択ボタン72-1にクリック等の選択操作がなされると、セッション#1の会話セッションが選択される。そして、通信端末装置30Xは、通信端末装置30Xの識別情報と会話セッションの識別情報「セッション#1」とを示す参加要求を、サーバ装置100に送信する。
また、図7に例示する参加可能セッション選択リスト70は、文字情報74-1と、文字情報74-2と、文字情報74-3と、文字情報74-4とを示す。文字情報74-1は、セッション#1に対応する会話セッションの文字情報である。文字情報74-2は、セッション#2に対応する会話セッションの文字情報である。文字情報74-3は、セッション#3に対応する会話セッションの文字情報である。文字情報74-4は、セッション#4に対応する会話セッションの文字情報である。
ここで、文字情報74が上述した第1の例にかかるものである場合、セッション音声データに対応する文字情報74は、例えば、会話の進行に合わせて、選択ボタン72上を右から左にスクロールするように表示される。この場合、表示制御部160は、文字情報74を通信端末装置30Xにストリーミング配信してもよい。表示制御部160は、文字情報74をストリーミング配信して選択ボタン72上をスクロールして表示させるためのリスト表示指示を、通信端末装置30Xに送信する。第1の例にかかる文字情報74を参加可能セッション選択リストに表示することによって、通信端末装置30Xのユーザは、会話セッションでなされている会話そのものを把握することができる。
また、文字情報74が上述した第2の例にかかるものである場合、会話の区間の最初の数文字を示す文字情報74が、選択ボタン72上に表示される。そして、会話が次の区間に進行したときに、次の区間の最初の数文字を示す文字情報が、選択ボタン72上に表示される。このようにして、選択ボタン72に表示される文字情報74が、会話の進行に伴って更新される。表示制御部160は、会話の区間の最初の数文字を示す文字情報74を選択ボタン72上に表示させるためのリスト表示指示を、通信端末装置30Xに送信する。そして、会話が次の区間に進行したときに、表示制御部160は、次の区間の最初の数文字を示す文字情報74を選択ボタン72上に表示させるためのリスト表示指示を、通信端末装置30Xに送信する。第2の例にかかる文字情報74を参加可能セッション選択リストに表示することによって、第1の例にかかる文字情報74の場合と比較して、サーバ装置100と通信端末装置30Xとの間の通信負荷を低減することができる。
また、文字情報74が上述した第3の例にかかるものである場合、会話のある区間の要約を示す文字情報74が、選択ボタン72上に表示される。そして、会話が次の区間に進行したときに、次の区間の要約を示す文字情報が、選択ボタン72上に表示される。このようにして、選択ボタン72に表示される文字情報74が、会話の進行に伴って更新される。表示制御部160は、会話の要約を示す文字情報74を選択ボタン72上に表示させるためのリスト表示指示を、通信端末装置30Xに送信する。そして、会話が進行して次の区間の要約が生成されたときに、表示制御部160は、次の区間の要約を示す文字情報74を選択ボタン72上に表示させるためのリスト表示指示を、通信端末装置30Xに送信する。第3の例にかかる文字情報74を参加可能セッション選択リストに表示することによって、通信端末装置30Xのユーザは、会話の要約つまり概要を容易に把握することができる。
なお、文字情報74は、選択ボタン72に重畳されて示されなくてもよい。例えば、文字情報74は、対応する会話セッションの選択ボタン72の近傍に示されてもよい。例えば、文字情報74-1は、選択ボタン72-1の下に示されてもよい。
参加要求受信部170(図3)は、参加可能セッション選択リストを表示するためのリスト表示指示を受信し会話セッションを選択した通信端末装置30から、参加要求を受信する。参加要求受信部170は、通信部106によって参加要求を受信する。
参加制御部172は、通信端末装置30によって参加可能セッション選択リストから選択された会話セッションに、この通信端末装置30を参加させるための制御を行う。具体的には、参加制御部172は、受信された参加要求で示される会話セッションに、参加要求で示される通信端末装置30を参加させるための制御を行う。例えば、図7の例で、通信端末装置30Xにおいてセッション#1の会話セッションが選択されると、参加制御部172は、通信端末装置30Xをセッション#1の会話セッションに参加させるための制御を行う。これにより、通信端末装置30Xは、セッション#1の会話セッションに参加することができる。
図8は、実施の形態1にかかるサーバ装置100によって行われる処理を示すフローチャートである。図8は、サーバ装置100で行われる表示方法、通信方法及び情報処理方法を示している。図8では、通信端末装置30X(端末X)に参加可能セッション選択リストを表示させる場合について説明する。サーバ装置100は、会話セッションを開始する(ステップS102)。具体的には、セッション管理部110は、会話セッションを開始して、会話セッションに参加している通信端末装置30との間で音声データを送受信する。
リスト生成部120は、通信端末装置30ごとに、参加可能セッションリストを生成する(ステップS104)。リスト要求受信部124は、通信端末装置30Xからリスト要求を受信する(ステップS106)。音声取得部130は、リスト要求の送信元である通信端末装置30Xが参加可能な会話セッションの音声データを取得する(ステップS108)。
文字情報生成部140は、S108の処理で取得された音声データを用いて、対応する会話セッションの会話の内容を文字列で示す文字情報を生成する(ステップS110)。表示制御部160は、文字情報を含む参加可能セッション選択リストを、通信端末装置30Xに表示させるための制御を行う(ステップS120)。参加要求受信部170が通信端末装置30Xから参加要求を受信すると(ステップS130のYES)、参加制御部172は、参加要求に対応する会話セッションに通信端末装置30Xを参加させるための制御を行う(ステップS132)。
実施の形態1にかかるサーバ装置100は、参加可能セッション選択リストを通信端末装置30に表示させるための制御を行うように構成されている。ここで、参加可能セッション選択リストに単に会話の議題等が示されているだけでは、会話セッションで実際にどのような会話が行われているかを把握することは、容易ではない。これに対し、本実施の形態では、参加可能セッション選択リストは、会話セッションの会話の内容に対応する文字情報を示す。通信端末装置30のユーザは、この参加可能セッション選択リストを見るだけで、現在実行されている会話セッションで実際に行われている会話の内容を、その会話セッションに参加していなくても、容易に把握することができる。したがって、通信端末装置30のユーザは、関心のある会話、つまり参加したい会話に、容易に参加することができる。
例えば、オンラインで学会等の講演が行われる場面で、同時に複数の講演が行われていることがある。このような場合に、どの講演を聴講するかを、容易に選択することができる。また、複数の講演を時間差で聴講する場合に、複数の講演を聴講するタイミングを、容易に計ることができる。
また、職場等では、他のメンバー同士が話をしている場合に、その会話が耳に入って、その会話に関心がある場合に、自分もその会話に加わることがある。しかしながら、在宅勤務等のテレワークを行っている場合などでは、そのような場面が発生する可能性が極めて低くなる。これに対し、本実施の形態では、他のメンバーが通信端末装置30を用いてネットワークを介して会話を行っている場合に、その会話の内容を把握して、その会話に参加することができるようになる。
また、実施の形態1にかかるサーバ装置100は、会話セッションにおける音声データを変換して得られた文字データの少なくとも一部を含む文字情報を通信端末装置30に表示させるための制御を行うように構成されている。ここで、音声データを文字データに変換することは、処理負荷が比較的低く、処理時間もそれほど要しない。したがって、このような構成により、比較的容易な処理によって、通信端末装置30のユーザは、参加していない会話セッションの会話の内容を把握することができる。
また、実施の形態1にかかるサーバ装置100は、会話セッションそれぞれの会話の履歴を前記リストに表示させるように構成されている。このような構成により、通信端末装置30のユーザは、参加していない会話セッションで過去になされた会話の内容を把握することができる。これにより、後から会話セッションに参加する場合に、参加する前の過去の会話の内容を踏まえて会話セッションに参加することができる。
(実施の形態2)
次に、実施の形態2について、図面を参照しながら説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。実施の形態2では、実施の形態1にかかるサーバ装置100の機能が各通信端末装置において実現され得る点で、実施の形態1と異なる。
図9は、実施の形態2にかかる遠隔会話システム2を示す図である。遠隔会話システム2は、複数の通信端末装置200と、サーバ装置101とを有する。通信端末装置200は、実施の形態1にかかる通信端末装置30に対応する。また、サーバ装置101は、実施の形態1にかかるサーバ装置100に対応する。複数の通信端末装置200と、サーバ装置101とは、互いにネットワーク12を介して通信可能に接続されている。なお、実施の形態2では、サーバ装置101を介さなくても通信端末装置30間で会話セッションが実行可能である場合、サーバ装置101はなくてもよい。
サーバ装置101は、例えば、サーバ等のコンピュータである。サーバ装置101は、1つ以上の会話セッションを管理する。サーバ装置101は、各参加者の通信端末装置200から音声データを受信して、複数の通信端末装置200に送信する。なお、サーバ装置101は、実施の形態1にかかるサーバ装置100が有するハードウェア構成を有してもよい。また、サーバ装置101は、構成要素として、実施の形態1にかかるサーバ装置100の、セッション管理部110、参加要求受信部170及び参加制御部172を有する。したがって、サーバ装置101の詳細な説明は省略する。
図10は、実施の形態2にかかる通信端末装置200の構成を示す図である。実施の形態1にかかる通信端末装置30と同様に、通信端末装置200は、主要なハードウェア構成として、制御部32と、記憶部34と、通信部36と、インタフェース部38を有する。通信端末装置200のハードウェア構成は、通信端末装置30と実質的に同様であるので、説明を省略する。
また、通信端末装置200は、構成要素として、ユーザ音声取得部42、ユーザ音声送信部44、音声受信部46、及び、音声出力部48を有する。また、通信端末装置200は、構成要素として、セッション検出部222、リスト生成部224、音声取得部230、文字情報生成部240、履歴記憶部250、表示制御部260を有する。また、通信端末装置200は、構成要素として、リスト表示部54、選択処理部56、参加要求送信部60、及び、参加処理部62を有する。これらの構成要素は、上述したハードウェア構成によって実現されてもよいし、ソフトウェアによって実現されてもよい。
ユーザ音声取得部42、ユーザ音声送信部44、音声受信部46、音声出力部48、リスト表示部54、選択処理部56、参加要求送信部60及び参加処理部62は、実施の形態1にかかるものと実質的に同様の機能を有するので、適宜、説明を省略する。なお、セッション検出部222、リスト生成部224、音声取得部230、文字情報生成部240、履歴記憶部250及び表示制御部260は、通信端末装置200が会話セッションに参加していない場合に動作し得る。以下の説明では、説明の対象である通信端末装置200(「自身の通信端末装置200」と称することがある)は会話セッションに参加しておらず、複数の他の通信端末装置200間で会話セッションが実行されている場合を想定する。
セッション検出部222は、他の通信端末装置200間で実行されており、自身の通信端末装置200が参加可能な会話セッションを検出する。具体的には、セッション検出部222は、自身の通信端末装置200が招待された会話セッションを検出する。例えば、セッション検出部222は、自身の通信端末装置200が受信した招待通知を検出することで、参加可能な会話セッションを検出してもよい。
リスト生成部224は、自身の通信端末装置200についての参加可能セッションリストを生成する。具体的には、リスト生成部224は、セッション検出部222によって検出された会話セッションを列挙した参加可能セッションリストを生成する。参加可能セッションリストは、参加可能な会話セッションの識別情報を含む。参加可能セッションリストは、図5に例示した、自身の通信端末装置200に関するものであってもよい。例えば、自身の通信端末装置200が端末Xであれば、参加可能セッションリストは、参加可能な会話セッションの識別情報として、「セッション#1」、「セッション#2」、「セッション#3」及び「セッション#4」を含む。
音声取得部230は、自身の通信端末装置200が参加可能な会話セッションの音声データ(セッション音声データ)を取得する。具体的には、音声取得部230は、サーバ装置101から、参加可能な会話セッションのセッション音声データを受信する。さらに具体的には、音声取得部230は、参加可能セッションリストに含まれるセッションIDに対応する会話セッションのセッション音声データを取得する。
文字情報生成部240は、音声取得部230によって取得されたセッション音声データを用いて、対応する会話セッションの会話の内容を文字列で示す文字情報を生成する。図5の例において、自身の通信端末装置200が端末Xである場合、文字情報生成部240は、セッション#1,#2,#3,#4それぞれの会話セッションについて、会話セッションでなされている会話の内容を文字列で示す文字情報を生成する。
文字情報生成部240の具体的な処理は、実施の形態1にかかる文字情報生成部140の処理と実質的に同様であるので、説明を省略する。
履歴記憶部250は、各会話セッションの会話の履歴を示す履歴情報を記憶する。履歴情報は、実施の形態1にかかるものと実質的に同様であるので、説明を省略する。
表示制御部260は、参加可能セッション選択リストを、リスト表示部54に表示させるための制御を行う。参加可能セッション選択リストは、実施の形態1にかかるものと実質的に同様である。したがって、参加可能セッション選択リストは、会話セッションに参加していない通信端末装置200が参加可能な会話セッションを列挙し、会話セッションそれぞれの会話の内容を示す文字情報を含むリストである。そして、参加可能セッション選択リストは、通信端末装置200が参加するための会話セッションを選択するためのリストである。表示制御部260は、リスト生成部224によって生成された参加可能セッションリストと文字情報と履歴情報とを用いて、リスト表示指示を生成する。
リスト表示部54は、リスト表示指示により、参加可能セッション選択リストを表示する。リスト表示部54は、インタフェース部38であるディスプレイによって、参加可能セッション選択リストに対応する画像を表示してもよい。リスト表示部54は、例えば図7に例示したような参加可能セッション選択リストを表示する。
選択処理部56は、ユーザの操作に応じて、参加可能セッション選択リストに列挙された会話セッションから、通信端末装置200が参加する会話セッションを選択する。参加要求送信部60は、選択された会話セッションに参加するための信号である参加要求を、ネットワーク12を介して、サーバ装置101に送信する。参加処理部62は、サーバ装置101による制御によって、参加要求に対応する会話セッションに通信端末装置200が参加するための処理を行う。これにより、通信端末装置200は、選択された会話セッションに参加する。そして、音声受信部46は、通信端末装置200が参加している会話セッションの音声を、サーバ装置101から受信する。また、ユーザ音声送信部44は、ユーザ音声データを、ネットワーク12を介して、サーバ装置101に送信する。
図11は、実施の形態2にかかる通信端末装置200によって行われる処理を示すフローチャートである。図11は、通信端末装置200で行われる表示方法、通信方法及び情報処理方法を示している。セッション検出部222は、自身の通信端末装置200が参加可能な会話セッション(参加可能セッション)を検出する(ステップS204)。リスト生成部224は、参加可能セッションリストを生成する(ステップS206)。
音声取得部230は、自身の通信端末装置200が参加可能な会話セッションの音声データを取得する(ステップS208)。文字情報生成部240は、S208の処理で取得された音声データを用いて、対応する会話セッションの会話の内容を文字列で示す文字情報を生成する(ステップS210)。リスト表示部54は、表示制御部260の制御により、文字情報を含む参加可能セッション選択リストを表示する(ステップS220)。
選択処理部56は、ユーザの操作に応じて、通信端末装置200が参加する会話セッションを選択する(ステップS230)。参加要求送信部60は、参加要求をサーバ装置101に送信する(ステップS232)。参加処理部62は、参加要求に対応する会話セッションに通信端末装置200が参加するための処理を行う(ステップS234)。
実施の形態2にかかる通信端末装置200は、会話セッションの会話の内容に対応する文字情報を示す参加可能セッション選択リストを表示するように構成されている。これにより、通信端末装置200のユーザは、現在実行されている会話セッションで実際の行われている会話の内容を、その会話セッションに参加していなくても、容易に把握することができる。したがって、実施の形態1と同様に、通信端末装置200のユーザは、関心のある会話、つまり参加したい会話に、容易に参加することができる。また、同様にして、実施の形態2にかかる通信端末装置200は、上述した実施の形態1にかかる効果を奏することができる。
なお、実施の形態2では、通信端末装置200は、文字情報を生成するために、全ての参加可能セッションの音声データを取得する必要がある。これに対して、実施の形態1では、サーバ装置100が文字情報を生成する。したがって、実施の形態1では、通信端末装置30が参加可能セッションの音声データを取得する必要はない。一方、実施の形態1では、サーバ装置100が通信端末装置30に文字情報を含むリスト表示指示を送信している。これに対して、実施の形態2では、通信端末装置200が文字情報を生成する。したがって、サーバ装置101が通信端末装置200に文字情報を含むリスト表示指示を送信する必要はない。ここで、文字情報のデータ量と音声データのデータ量とを比較すると、同じ情報量である場合、文字情報のデータ量の方が、音声データのデータ量よりもはるかに小さい。したがって、実施の形態1にかかる方法の方が、実施の形態2にかかる方法よりも、ネットワークにおける通信負荷を低減することができる。
(変形例)
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述したフローチャートにおける各処理の順序は、適宜、変更可能である。また、上述したフローチャートにおける各処理のうちの1つ以上は、省略され得る。
例えば、図8に示したフローチャートにおいて、S104の処理とS106の処理の順序は逆でもよい。この場合、リスト生成部120は、リスト要求を送信した端末についてのみ、参加可能セッションリストを生成してもよい。また、S130~S132の処理は省略されてもよい。つまり、通信端末装置が会話セッションに参加するための処理は、参加可能セッション選択リストを表示させる処理フロー(S104~S120)とは別の処理で行うようにしてもよい。言い換えると、上述した実施の形態では、参加可能セッション選択リストにおける選択ボタンを操作することによって会話セッションに参加することができるが、この機能を用いて会話セッションに参加する必要はない。通信端末装置は、元々通信端末装置が受信していた招待通知を用いて会話セッションに参加してもよい。図11に示したフローチャートにおいても同様に、S230~S234の処理は省略されてもよい。なお、参加可能セッション選択リストにおける選択ボタンを操作することによって会話セッションに参加できるようにすることで、通信端末装置は容易に会話セッションに参加することができる。
また、上述した実施の形態1では、サーバ装置100は、リスト要求を送信した通信端末装置に対して参加可能セッション選択リストを表示させるように制御を行うが、このような構成に限られない。つまり、サーバ装置100は、リスト要求受信部124を有していなくてもよい。この場合、サーバ装置100は、会話セッションに参加していない全ての通信端末装置に、その通信端末装置に対応する参加可能セッション選択リストを表示させるためのリスト表示指示を送信してもよい。なお、リスト要求を送信した通信端末装置に対して参加可能セッション選択リストを表示させることによって、どの会話セッションにも参加したいと望んでいないユーザの通信端末装置に、参加可能セッション選択リストを表示させることが抑制される。したがって、無駄な処理を行うことを抑制することができる。
また、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1,2 遠隔会話システム
12 ネットワーク
30 通信端末装置
42 ユーザ音声取得部
44 ユーザ音声送信部
46 音声受信部
48 音声出力部
50 リスト要求送信部
52 リスト受信部
54 リスト表示部
56 選択処理部
60 参加要求送信部
62 参加処理部
70 参加可能セッション選択リスト
72 選択ボタン
74 文字情報
100,101 サーバ装置
110 セッション管理部
120 リスト生成部
122 リスト格納部
124 リスト要求受信部
130 音声取得部
140 文字情報生成部
150 履歴記憶部
160 表示制御部
170 参加要求受信部
172 参加制御部
200 通信端末装置
222 セッション検出部
224 リスト生成部
230 音声取得部
240 文字情報生成部
250 履歴記憶部
260 表示制御部

Claims (6)

  1. 通信ネットワークに接続されたサーバ装置であって、
    複数の通信端末装置の間で行われている1つ以上の会話セッションそれぞれの音声データを取得する音声取得部と、
    取得された前記音声データを用いて、対応する前記会話セッションの会話の内容を文字列で示す文字情報を生成する文字情報生成部と、
    前記会話セッションのうち第1の通信端末装置が参加を許可されている1つ以上の会話セッションのいずれに参加するかを選択するために当該会話セッションそれぞれに対応する前記文字情報の少なくとも一部を示すリストを当該第1の通信端末装置に表示させるための制御を行う表示制御部と、
    を有するサーバ装置。
  2. 前記表示制御部は、複数の前記通信端末装置の1つによって送信され、前記会話セッションに参加を許可された前記通信端末装置を指定する指定情報に基づいて抽出された、前記第1の通信端末装置が参加を許可されている前記会話セッションを、前記リストに表示させるように、制御を行う、
    請求項1に記載のサーバ装置。
  3. 前記表示制御部は、前記取得された音声データを変換して得られた文字データの少なくとも一部を含む前記文字情報を前記会話セッションの選択ボタン上に重畳すると共に、会話の進行に伴って前記選択ボタン上に重畳される前記文字情報を更新するように、前記リストを前記第1の通信端末装置に表示させるための制御を行う、
    請求項1又は2に記載のサーバ装置。
  4. 前記表示制御部は、前記会話セッションそれぞれの会話の履歴を前記リストに表示させる、
    請求項1乃至3のいずれか1項に記載のサーバ装置。
  5. 通信端末装置であって、
    複数の他の通信端末装置の間で行われている1つ以上の会話セッションのうち当該通信端末装置が参加を許可されている1つ以上の会話セッションそれぞれの音声データを取得する音声取得部と、
    取得された前記音声データを用いて、対応する前記会話セッションの会話の内容を文字列で示す文字情報を生成する文字情報生成部と、
    前記会話セッションのいずれに参加するかを選択するために当該会話セッションそれぞれに対応する前記文字情報の少なくとも一部を示すリストを表示する表示部と、
    を有する通信端末装置。
  6. 通信ネットワークにおいて、
    複数の通信端末装置の間で行われている1つ以上の会話セッションそれぞれの音声データを取得し、
    前記取得された音声データを用いて、対応する前記会話セッションの会話の内容を文字列で示す文字情報を生成し、
    前記会話セッションのうち第1の通信端末装置が参加を許可されている1つ以上の会話セッションのいずれに参加するかを選択するために当該会話セッションそれぞれに対応する前記文字情報の少なくとも一部を示すリストを当該第1の通信端末装置に表示させるための制御を行う、
    表示方法。
JP2021011160A 2021-01-27 2021-01-27 サーバ装置、通信端末装置及び表示方法 Pending JP2022114742A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021011160A JP2022114742A (ja) 2021-01-27 2021-01-27 サーバ装置、通信端末装置及び表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021011160A JP2022114742A (ja) 2021-01-27 2021-01-27 サーバ装置、通信端末装置及び表示方法

Publications (1)

Publication Number Publication Date
JP2022114742A true JP2022114742A (ja) 2022-08-08

Family

ID=82743094

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021011160A Pending JP2022114742A (ja) 2021-01-27 2021-01-27 サーバ装置、通信端末装置及び表示方法

Country Status (1)

Country Link
JP (1) JP2022114742A (ja)

Similar Documents

Publication Publication Date Title
JP6575658B2 (ja) インタラクティブ・ホワイトボード機器の音声制御
CN105915436B (zh) 基于主题的即时消息隔离的系统和方法
EP3282669A2 (en) Private communications in virtual meetings
JP6632377B2 (ja) 仮想会議を管理するための方法およびシステム(仮想会議)
US9407866B2 (en) Joining an electronic conference in response to sound
US10403272B1 (en) Facilitating participation in a virtual meeting using an intelligent assistant
US10586131B2 (en) Multimedia conferencing system for determining participant engagement
KR102085383B1 (ko) 그룹 채팅 서비스를 이용하는 단말 및 이의 운용 방법
US20160134428A1 (en) User Device Evaluation for Online Meetings
US11562657B1 (en) Queuing for a video conference session
US10440327B1 (en) Methods and systems for video-conferencing using a native operating system and software development environment
US11115444B2 (en) Private communications in virtual meetings
US20160294892A1 (en) Storage Medium Storing Program, Server Apparatus, and Method of Controlling Server Apparatus
JP7400231B2 (ja) 通信システム、情報処理装置、通信方法およびプログラム
KR102217301B1 (ko) 개인 일정 및 라이프 스타일을 반영한 인공지능의 컨텍 제어
US20160142462A1 (en) Displaying Identities of Online Conference Participants at a Multi-Participant Location
JP2023093714A (ja) コンタクト制御プログラム、端末およびコンタクト制御方法
US9137029B1 (en) State and availability monitoring for customer support services for multimedia conferences
WO2021015948A1 (en) Measuring and responding to attention levels in group teleconferences
JP2009253625A (ja) 情報収集・テレビ会議実施制御装置、情報収集・テレビ会議実施制御方法、情報収集・テレビ会議実施制御プログラムおよびテレビ会議システム
JP2022114742A (ja) サーバ装置、通信端末装置及び表示方法
KR20210015379A (ko) 멀티미디어 콘텐츠 공유 방법 및 서버
US20240129432A1 (en) Systems and methods for enabling a smart search and the sharing of results during a conference
JP2019140517A (ja) 情報処理装置及びプログラム
JP6610076B2 (ja) 情報処理装置、情報処理システム、プログラム、及び記録媒体