JP2017118281A - プログラム及び遠隔会議方法 - Google Patents

プログラム及び遠隔会議方法 Download PDF

Info

Publication number
JP2017118281A
JP2017118281A JP2015250701A JP2015250701A JP2017118281A JP 2017118281 A JP2017118281 A JP 2017118281A JP 2015250701 A JP2015250701 A JP 2015250701A JP 2015250701 A JP2015250701 A JP 2015250701A JP 2017118281 A JP2017118281 A JP 2017118281A
Authority
JP
Japan
Prior art keywords
sound
terminal device
data
sound data
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015250701A
Other languages
English (en)
Other versions
JP6390607B2 (ja
Inventor
真利 杉浦
Shinri Sugiura
真利 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2015250701A priority Critical patent/JP6390607B2/ja
Publication of JP2017118281A publication Critical patent/JP2017118281A/ja
Application granted granted Critical
Publication of JP6390607B2 publication Critical patent/JP6390607B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】端末装置のユーザが聞き逃した他のユーザの発言内容を、遠隔会議の進行中に端末装置のユーザに認識させることが可能な、遠隔会議用のプログラムと遠隔会議方法を提供する。【解決手段】第一端末装置では、第一取得処理と第一送信処理と第二取得処理と第一ミキシング処理と再生処理が実行される。第一取得処理は、第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する処理である。第一送信処理は、第二端末装置で集音された第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を送信させる処理である。第二取得処理は、第二音データを取得する処理である。第一ミキシング処理は、第一音データと第二音データを合成した第一合成データを生成する処理である。再生処理は、第一合成データを再生し、第一合成音を出力させる処理である。【選択図】図3

Description

本発明は、第一端末装置と第二端末装置によるネットワークを介した遠隔会議において第一端末装置を制御するコンピュータに所定の処理を実行させるプログラムと、サーバ装置を制御するコンピュータに所定の処理を実行させるプログラムと、遠隔会議方法に関する。
ネットワークを介した遠隔会議に関する技術が提案されている。例えば、特許文献1には、通信会議システムに関する技術が開示されている。通信会議システムでは、次のような機能が実現される。即ち、音声の発言内容が文字データに変換され、話者が識別される。モニタ画面上に、文字データが表示される。文字データは、所望の時間遅延されてモニタ画面に表示される。
特開2008−160667号公報
複数の端末装置による遠隔会議の開催中に、他の端末装置のユーザの発言を聞き逃すことがある。特許文献1に開示の技術では、ユーザの発言を文字データに変換し、これに基づき文字を表示することで、聞き逃した発言の内容を認識することができる。但し、そのためには、文字を読む必要がある。遠隔会議では、例えば、各端末装置で撮影された映像データに対応する撮影画像及び/又は各端末装置で共有される資料画像の確認が必要になることがある。このような場合、撮影画像及び/又は資料画像を確認しつつ、更に、文字を読み、聞き逃した内容を認識することは、困難な作業であると思われる。発言を文字データとするためには、音声認識の処理が必要である。従って、映像データを用いる遠隔会議では、端末装置での処理負荷が高くなることもある。
本発明は、端末装置のユーザが聞き逃した他のユーザの発言内容を、遠隔会議の進行中に端末装置のユーザに認識させることが可能な、遠隔会議用のプログラムと遠隔会議方法を提供することを目的とする。
本発明の一側面は、ネットワークに接続された第一端末装置を制御するコンピュータに、前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、を実行させるプログラムである。
このプログラムによれば、第二端末装置で集音された第一タイミングの第一音と第二タイミングの第二音を含む第一合成音を出力させることができる。第一端末装置のユーザに、第一音を聞き取らせつつ、第二音を聞き取らせることが可能となる。
本発明の他の側面は、ネットワークに接続されたサーバ装置を制御するコンピュータに、前記ネットワークに接続された第一端末装置と、前記ネットワークに接続された第二端末装置と、前記ネットワークに接続された第三端末装置と、による前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第四音に対応する第四音データを取得する第四取得処理と、取得された前記第四音データを記憶部に記憶させる第一記憶処理と、前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第五音に対応する第五音データを取得する第五取得処理と、第一タイミングの前記第四音に対応する前記第四音データと、前記第一タイミングの前記第五音に対応する前記第五音データと、を合成した第二合成データを生成する第二ミキシング処理と、前記第二合成データを、前記第一端末装置へと送信させる第三送信処理と、前記第一端末装置から送信される、前記第一タイミングより前の第二タイミングの前記第四音に対応する前記第四音データの送信を要求する第二リプレイ要求を取得する第六取得処理と、前記第二リプレイ要求が取得された場合、前記第二タイミングの前記第四音に対応する前記第四音データを、前記第一端末装置に送信させる第四送信処理と、を実行させるプログラムである。
このプログラムによれば、第二端末装置で集音された第一タイミングの第四音に対応する第四音データと、第三端末装置で集音された第一タイミングの第五音に対応する第五音データによる第二合成データを、第一端末装置に送信させ、第二リプレイ要求に応じて、第二タイミングの第四音に対応する第四音データを、第一端末装置に送信させることができる。第一端末装置のユーザに、第一タイミングの第四音及び第五音を聞き取らせつつ、第二タイミングの第四音を聞き取らせることが可能となる。
本発明の更に他の側面は、ネットワークに接続された、第一端末装置と第二端末装置と第三端末装置とサーバ装置と、を含む遠隔会議システムで実行される遠隔会議方法であって、前記第一端末装置と前記第二端末装置と前記第三端末装置とによる前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第六音に対応する第六音データを取得する工程と、取得された前記第六音データを記憶する工程と、前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第七音に対応する第七音データを取得する工程と、第一タイミングの前記第六音に対応する前記第六音データと、前記第一タイミングの前記第七音に対応する前記第七音データと、を合成した第三合成データを生成する工程と、前記第三合成データを再生し、再生された第二合成音を出力する工程と、前記第一タイミングより前の第二タイミングの前記第六音の再生を要求するリプレイ要求を取得する工程と、前記リプレイ要求が取得された場合、前記第三合成データと、前記第二タイミングの前記第六音に対応する前記第六音データと、を合成した第四合成データを生成する工程と、前記第四合成データを再生し、再生された第三合成音を出力する工程と、を含む遠隔会議方法である。
この遠隔会議方法によれば、第二端末装置で集音された第一タイミングの第六音と、第三端末装置で集音された第一タイミングの第七音と、第二端末装置で集音された第二タイミングの第六音を含む第三合成音を出力させることができる。ユーザに、第一タイミングの第六音及び第七音を聞き取らせつつ、第二タイミングの第六音を聞き取らせることが可能となる。
本発明によれば、端末装置のユーザが聞き逃した他のユーザの発言内容を、遠隔会議の進行中に端末装置のユーザに認識させることが可能な、遠隔会議用のプログラムと遠隔会議方法を得ることができる。
遠隔会議システムの一例を示す図である。 遠隔会議画面の一例を示す図である。 音処理のフローチャートである。 変換処理のフローチャートである。 ミキシング処理のフローチャートである。 中継処理のフローチャートである。
本発明を実施するための実施形態について、図面を用いて説明する。本発明は、以下に記載の構成に限定されるものではなく、同一の技術的思想において種々の構成を採用することができる。例えば、以下に示す構成の一部は、省略し又は他の構成等に置換してもよい。他の構成を含むようにしてもよい。
<遠隔会議システム>
遠隔会議システム10の概略について、図1を参照して説明する。遠隔会議システム10は、図1に示すように、サーバ装置20と、端末装置を含む。図1では、3台の端末装置が図示されている。端末装置の台数は、実施される遠隔会議のシチュエーションに応じて変化する。実施形態では、3台の端末装置による遠隔会議を例として説明する。図1に図示された3台の端末装置のそれぞれを、端末装置41,42,43という。端末装置41,42,43は、同一の遠隔会議に出席しているユーザによってそれぞれ操作される。サーバ装置20と端末装置41,42,43は、ネットワーク90に接続されている。ネットワーク90は、例えば、インターネット又はローカルエリアネットワーク(LAN)のようなネットワークである。遠隔会議システム10では、端末装置41,42,43による遠隔会議は、サーバ装置20と端末装置41,42,43のそれぞれとの間でセッションが確立された状態で行われる。
サーバ装置20は、端末装置41,42,43の間を送受信されるデータを中継する。端末装置41,42,43の間を送受信されるデータとしては、映像データと音データが例示される。映像データは、端末装置41,42,43のそれぞれで撮影された撮影画像61(後述する図2参照)に対応するデータである。音データは、端末装置41,42,43のそれぞれで集音された音に対応するデータである。サーバ装置20は、端末装置41,42,43からそれぞれ送信された映像データを受信し、受信された各映像データを、その映像データの送信元の端末装置を除く端末装置に送信する。例えば、サーバ装置20は、端末装置42から送信された映像データを、端末装置42を除く端末装置41,43に送信する。但し、サーバ装置20は、端末装置41,42,43からそれぞれ送信された全ての映像データを、全ての端末装置41,42,43に送信するようにしてもよい。
サーバ装置20は、端末装置41,42,43からそれぞれ送信された音データを受信し、受信された複数の音データを合成する。実施形態では、サーバ装置20で、複数の音データを合成して生成された音データを、「合成データ」という。例えば、端末装置42,43からの音データを端末装置41に送信する場合、サーバ装置20は、端末装置42,43からの音データを合成し、前述の各音データを含む合成データを生成する。その後、サーバ装置20は、生成された合成データを、端末装置41に送信する。つまり、サーバ装置20は、端末装置41,42,43のうち、合成データの送信先となる端末装置からの音データを除く複数の音データを合成し、生成された合成データを、前述の送信先の端末装置に送信する。これに伴い、ユーザが自身が発した声を直接聞き取りつつ、自装置から出力される自身の声と同じ音が、重複して聞き取れるといった、事態の発生を防止することができる。サーバ装置20から端末装置41,42,43への映像データと合成データの送信は、公知の遠隔会議システムと同様、ストリーミング方式によって行われる。
この他、サーバ装置20は、資料データを中継する。資料データは、遠隔会議で用いられる資料画像62(後述する図2参照)に対応するデータである。遠隔会議システム10では、公知の遠隔会議システムと同様、端末装置41,42,43の間で同一の資料データに対応する資料画像62が共有された状態で、遠隔会議を進行することができる。サーバ装置20は、端末装置41,42,43のうちの何れか1台の端末装置から送信された資料データを、他の2台の端末装置に送信する。端末装置41,42,43では、資料データに対応する資料画像62が表示される。
サーバ装置20を介して実行される遠隔会議は、会議IDによって識別される。即ち、端末装置41,42,43による遠隔会議は、会議IDによって、サーバ装置20を介して実行される他の遠隔会議と識別される。会議IDによって識別される遠隔会議において、端末装置41,42,43は、端末IDにより識別される。実施形態では、端末装置41,42,43の各端末IDは、次の通りとする。端末装置41の端末IDは、「USER41」とする。端末装置42の端末IDは、「USER42」とする。端末装置43の端末IDは、「USER43」とする。
遠隔会議システム10では、所定のユーザによって、事前に遠隔会議の開催が予約される。予約は、サーバ装置20によって提供される所定のサイトに登録される。予約の際、例えば、遠隔会議の開催を、出席者に通知することができる。この通知は、例えば、電子メールを用いて行われる。即ち、電子メールの本文には、遠隔会議の開催日時と、サーバ装置20のURLが含められる。サーバ装置20のURLには、例えば、予約された遠隔会議を識別する会議IDに関する情報が含められる。
<サーバ装置>
サーバ装置20について、図1を参照して説明する。サーバ装置20は、CPU21と、記憶装置22と、RAM23と、通信部24を備える。CPU21と記憶装置22とRAM23と通信部24は、バス25に接続される。CPU21は、演算処理を実行する。記憶装置22は、コンピュータが読み取り可能な記憶媒体である。記憶装置22としては、ハードディスク及び/又はフラッシュメモリが例示される。この他、記憶装置22は、ROMを含むものであってもよい。記憶装置22には、各種のプログラムが記憶される。例えば、OS(Operating System)と各種のアプリケーションが記憶装置22に記憶される。記憶装置22に記憶されるアプリケーションには、サーバプログラムが含まれる。サーバプログラムは、所定のサーバ装置を、遠隔会議システム10におけるサーバ装置20として動作させる遠隔会議用のプログラムである。サーバプログラムには、後述する中継処理(図6参照)のプログラムが含まれる。
サーバプログラムは、記憶装置22に事前にインストールされる。事前のインストールは、例えば、半導体メモリ等のコンピュータが読み取り可能な記憶媒体に記憶されたサーバプログラムが、サーバ装置20の読取部(不図示)によって読み取られることで行われる。サーバ装置20が、例えば、光学ドライブ(不図示)を備えている場合、事前のインストールは、光学メディアに記憶されたサーバプログラムが、光学ドライブによって読み取られることで行われるようにしてもよい。この他、事前のインストールは、ネットワーク90に接続されるサーバ装置20とは別のサーバ装置のハードディスク等のコンピュータが読み取り可能な記憶媒体に記憶されたサーバプログラムが、通信部24で伝送信号として受信されることで行われるようにしてもよい。記憶装置22へのサーバプログラムのインストールについて、上述した何れの形態とするかは、諸事情を考慮して適宜決定される。コンピュータが読み取り可能な記憶媒体は、一時的な記憶媒体(例えば、伝送信号)を含まない、非一時的な記憶媒体であってもよい。非一時的な記憶媒体は、情報を記憶する期間に関わらず、情報を記憶可能な記憶媒体であればよい。
RAM23は、CPU21が各種のプログラムを実行する際に利用される記憶領域となる。RAM23には、処理の実行途中に、処理で利用される所定のデータ及び情報が所定の領域に記憶される。例えば、接続リストがRAM23に記憶される。但し、接続リストは、記憶装置22に記憶されるようにしてもよい。接続リストには、例えば、会議IDによって識別される遠隔会議において、セッションが確立されている端末装置41,42,43の端末IDが登録されている。サーバ装置20では、CPU21が記憶装置22に記憶されたOSと中継処理のプログラムを含むサーバプログラムを実行する等して、サーバ装置20を制御する。これにより、サーバ装置20では、各種の処理が実行される。
通信部24は、サーバ装置20をネットワーク90に接続し、ネットワーク90を介したデータ通信を行う。サーバ装置20では、通信部24を介して、端末装置41,42,43のそれぞれとの間で各種のデータが送受信される。通信部24は、例えば、イーサネット(登録商標)規格に適合するインターフェース回路である。通信部24によるネットワーク90への接続は、有線接続とされる。但し、通信部24によるネットワーク90への接続は、無線接続であってもよい。
サーバ装置20は、中継処理のプログラムを含むサーバプログラムが記憶装置22に記憶されている点が、公知のサーバ装置と相違する。但し、サーバ装置20は、ハードウェア的には、公知のサーバ装置と同じである。従って、サーバ装置20は、更に、公知のサーバ装置が備える構成を備える。
<端末装置>
端末装置41,42,43は、ネットワーク90を介した通信機能を有する同一又は同種の端末装置である。例えば、端末装置41,42,43は、パーソナルコンピュータ、スマートフォン又はタブレット端末である。実施形態では、端末装置41,42,43として、パーソナルコンピュータが例示されている(図1参照)。端末装置41,42,43の説明は、図1及び図2を参照しつつ、端末装置41を例として説明する。この説明では、図2に示す遠隔会議画面60は、端末装置41で表示されている遠隔会議画面とする。端末装置42,43は、次に説明する端末装置41が備える構成と同じ構成を備える。端末装置42,43では、図2に示す遠隔会議画面60と同じ態様の遠隔会議画面が表示される。
端末装置41は、CPU47と、記憶装置48と、RAM49と、表示部50と、操作部51と、スピーカ52と、通信部53と、接続インターフェース54を備える。CPU47と記憶装置48とRAM49と表示部50と操作部51とスピーカ52と通信部53と接続インターフェース54は、バス55に接続される。実施形態では、接続インターフェース54を「接続I/F54」と記載する。接続I/F54には、カメラ56とマイク57が接続される。
CPU47は、演算処理を実行する。記憶装置48は、コンピュータが読み取り可能な記憶媒体である。記憶装置48としては、ハードディスク及び/又はフラッシュメモリが例示される。この他、記憶装置48は、ROMを含むものであってもよい。記憶装置48には、各種のプログラムが記憶される。例えば、OSと各種のアプリケーションが記憶装置48に記憶される。記憶装置48に記憶されるアプリケーションには、クライアントプログラムが含まれる。クライアントプログラムは、所定の端末装置を、遠隔会議システム10における端末装置41,42,43として動作させる遠隔会議用のプログラムである。クライアントプログラムには、後述する音処理(図3参照)と変換処理(図4参照)とミキシング処理(図5参照)のプログラムが含まれる。
クライアントプログラムは、記憶装置48に事前にインストールされていてもよい。事前のインストールは、例えば、半導体メモリ等のコンピュータが読み取り可能な記憶媒体に記憶されたクライアントプログラムが、端末装置41の読取部(不図示)により読み取られることで行われる。端末装置41が、例えば、光学ドライブ(不図示)を備えている場合、事前のインストールは、光学メディアに記憶されたプログラムが、光学ドライブにより読み取られることで行われるようにしてもよい。この他、事前のインストールは、ネットワーク90を介して端末装置41に接続されるサーバ装置(サーバ装置20又は不図示のサーバ装置)のハードディスク等のコンピュータが読み取り可能な記憶媒体に記憶されたクライアントプログラムが、通信部53で伝送信号として受信されることで行われるようにしてもよい。クライアントプログラムは、遠隔会議への接続に際し、端末装置41がサーバ装置20にアクセスした場合に、サーバ装置20からネットワーク90を介して伝送信号として端末装置41に送信されてもよい。クライアントプログラムは、そのタイミングで、記憶装置48にインストールされるようにしてもよい。この場合、クライアントプログラムは、RAM49に記憶されてもよい。記憶装置48又はRAM49へのクライアントプログラムのインストールについて、上述した何れの形態とするかは、諸事情を考慮して適宜決定される。コンピュータが読み取り可能な記憶媒体は、一時的な記憶媒体(例えば、伝送信号)を含まない、非一時的な記憶媒体であってもよい。非一時的な記憶媒体は、情報を記憶する期間に関わらず、情報を記憶可能な記憶媒体であればよい。
RAM49は、CPU47が各種のプログラムを実行する際に利用される記憶領域となる。RAM49には、処理の実行途中に、処理で利用される所定のデータ及び情報が所定の領域に記憶される。端末装置41では、CPU47が記憶装置48に記憶されたOSと音処理と変換処理とミキシング処理を含むクライアントプログラムを実行する等して、端末装置41を制御する。これにより、端末装置41では、各種の処理が実行される。
表示部50は、例えば液晶ディスプレイである。表示部50には、各種の情報が表示される。表示部50には、遠隔会議画面60が表示される。遠隔会議画面60は、図2に示すように、撮影画像61と、資料画像62と、操作情報63と、報知情報64と、終了ボタン65を含む。
撮影画像61は、端末装置41,42,43のうちの何れかの端末装置で撮影された映像データに対応する画像である。図2では、端末装置42の撮影画像61と端末装置43の撮影画像61が例示されている。遠隔会議画面60では、自装置(端末装置41)の撮影画像61を表示することもできる。実施形態では、サーバ装置20は、端末装置41からの映像データを端末装置41に送信しない。従って、端末装置41では、自装置の撮影画像61は、自装置で撮影された映像データから直接表示される。但し、サーバ装置20が、端末装置41からの映像データを端末装置41にも送信する場合、端末装置41では、自装置の撮影画像61は、端末装置42,43の撮影画像61と同様、サーバ装置20から送信される映像データに従い表示される。
遠隔会議画面60では、撮影画像61の表示又は非表示を設定することができる。撮影画像61の表示又は非表示は、端末装置41,42,43の各撮影画像61に対して個別に設定することができる。図2に示す遠隔会議画面60に基づけば、端末装置41の撮影画像61は、非表示に設定され、端末装置42,43の撮影画像61は、表示に設定されている。遠隔会議画面60では、端末装置42,43の撮影画像61に対する表示の設定に従い、2個の撮影画像61が表示されている。
遠隔会議画面60では、表示に設定された撮影画像61と共にその撮影画像61に対応する端末IDが表示される。従って、図2では、端末装置42の撮影画像61と共に端末ID「USER42」が表示され、端末装置43の撮影画像61と共に端末ID「USER43」が表示されている。遠隔会議画面60において、端末装置42,43の各ユーザをそれぞれ含む撮影画像61及び/又は撮影画像61と共に表示される端末IDは、端末装置42,43に対応する相手先情報となる。即ち、端末装置41のユーザは、撮影画像61及び端末IDの一方又は両方に基づき、遠隔会議に出席している他のユーザを認識することができる。
操作情報63は、例えば、リプレイ要求の送信に対応する操作ボタンである。リプレイ要求は、操作情報63と関連付けられた撮影画像61及び端末IDの端末装置からサーバ装置20に送信された音データの送信を、サーバ装置20に対して要求する指示である。送信要求の対象となる音データは、次に記載のタイミングより前に、端末装置41,42,43のうちの何れかの端末装置で取得された音に対応する音データである。前述のタイミングは、現在、受信されている合成データの生成時に合成対象とされた、この合成データに含まれる音データに対応する音が取得されたタイミングである。操作情報63は、撮影画像61及び端末IDに関連付けられた状態で表示される。例えば、端末IDが「USER42」である端末装置42の撮影画像61と共に表示されている操作情報63は、次に記載のタイミングより前に、端末装置42で取得された音に対応する音データの送信を、サーバ装置20に対して要求するリプレイ要求の送信に対応する。前述のタイミングは、現在、受信されている合成データに含まれる端末装置42からの音データに対応する音が端末装置42で取得されたタイミングである。以下では、リプレイ要求に応じてサーバ装置20から送信される音データを、他の音データ(合成データ及び後述する再合成データを含む)と区別する場合、「リプレイデータ」という。
報知情報64は、リプレイ情報が取得されたことを示す情報である。端末装置41で表示される遠隔会議画面60を対象とした場合、リプレイ情報は、自装置で過去に取得された音に対応するリプレイデータが、サーバ装置20から端末装置42,43の何れかの端末装置に送信されていることを示す情報である。端末装置41のリプレイデータは、端末装置42,43の何れかの端末装置で、端末装置41の撮影画像61及び端末IDに関連付けられた操作情報63に対応する入力が受け付けられた場合に、サーバ装置20から送信される。リプレイ情報は、リプレイデータの送信先(リプレイ要求の送信元)である端末装置の端末IDを含む。実施形態では、報知情報64は、「リプレイ中」とされている。報知情報64は、撮影画像61及び端末IDに関連付けられた状態で表示される。例えば、端末装置42で端末装置41の撮影画像61及び端末IDに関連付けられた操作情報63が押下され、端末装置41のリプレイデータが、サーバ装置20から端末装置42に送信されているとする。この場合、端末装置41で表示中の遠隔会議画面60では、報知情報64が、図2に示すように、端末IDが「USER42」である端末装置42の撮影画像61と共に表示される。操作情報63が押下された端末装置の撮影画像61が非表示である場合、リプレイ情報の取得に応じて、操作情報63が押下された端末装置の撮影画像61及び/又は端末IDと報知情報64が、互いに関連付けられた状態で遠隔会議画面60の所定の領域に表示される。
終了ボタン65は、遠隔会議の終了に対応する操作ボタンである。端末装置41のユーザは、遠隔会議を終了する場合、終了ボタン65を押下する。この場合、遠隔会議は終了し、サーバ装置20との間で確立されたセッションは、切断される。
操作部51は、端末装置41に対する各種の指示等の入力を受け付ける。操作部51は、キーボード及びマウスを含む。詳細は省略するが、キーボード及びマウスへの各操作に対応する入力情報を生成する処理は、公知のパーソナルコンピュータで採用されている技術であり、端末装置41でも採用される。スピーカ52は、音を出力する音出力部である。スピーカ52での出力対象は、例えば、上述したサーバ装置20から送信される合成データに対応する合成音である。通信部53は、端末装置41をネットワーク90に接続し、ネットワーク90を介したデータ通信を行う。端末装置41では、通信部53を介してサーバ装置20との間で各種のデータが送受信される。通信部53は、例えば、イーサネット(登録商標)規格に適合するインターフェース回路である。通信部53によるネットワーク90への接続は、無線接続又は有線接続の何れであってもよい。
接続I/F54は、端末装置41に所定の装置を接続するインターフェースである。接続I/F54は、例えば、USB(Universal Serial Bus)ポートを含むインターフェースである。接続I/F54は、無線通信モジュールを含むものであってもよい。無線通信モジュールとしては、Bluetooth(登録商標)に対応した通信モジュールが例示される。接続I/F54に接続されたカメラ56は、外界像を撮影する。端末装置41は、カメラを内蔵する構成であってもよい。接続I/F54に接続されたマイク57は、外界音を集音する集音部である。例えば、マイク57は、端末装置41のユーザが発した音声を集音する。
端末装置41は、音処理と変換処理とミキシング処理を含むクライアントプログラムが記憶装置48又はRAM49に記憶されている点が、公知の端末装置と相違する。但し、端末装置41は、ハードウェア的には、公知の端末装置と同じである。従って、端末装置41は、更に、公知の端末装置が備える構成を備える。
<遠隔会議システムで実行される処理>
遠隔会議システム10で、端末装置41,42,43による遠隔会議が行われる場合、端末装置41で実行される音処理と変換処理とミキシング処理と、サーバ装置20で実行される中継処理について説明する。端末装置41では、操作部51を介して、サーバ装置20のURLを対象とした操作が入力される。この操作が入力された場合、CPU47は、クライアントプログラムを起動する。このプログラムの起動に伴い、端末装置41は、サーバ装置20にアクセスし、サーバ装置20との間でセッションを確立する。サーバ装置20との間でセッションを確立する場合に端末装置41で実行される手順は、公知の遠隔会議システムにおける手順と同様である。従って、これに関する説明は、省略する。
サーバ装置20との間でセッションが確立されることで、端末装置41は、会議IDによって識別される遠隔会議に参加した状態となる。即ち、端末装置41のユーザは、会議IDによって識別される遠隔会議が開催されるバーチャルな会議室に入室した状態となる。端末装置41では、サーバ装置20との間でセッションが確立されると、カメラ56で撮影された映像データとマイク57で集音された音に対応する音データが、通信部53からサーバ装置20に送信される。映像データと音データには、送信元を示す端末IDがそれぞれ含められる。例えば、端末装置41から送信される映像データと音データには、端末ID「USER41」が含められる。
サーバ装置20は、端末装置41,42,43との間でセッションが確立された場合、映像データを中継すると共に、所定の2台の端末装置からの音データを合成し、他の1台の端末装置に合成データを送信する。なお、端末装置41,42とセッションが確立され、端末装置43とはセッションが確立されていない場合、サーバ装置20から端末装置41に送信される合成データは、実質的には、端末装置42で集音された音に対応する音データであり、サーバ装置20から端末装置42に送信される合成データは、実質的には、端末装置41で集音された音に対応する音データである。即ち、前述した場合、サーバ装置20は、端末装置42からの音データを、そのまま端末装置41に送信し、端末装置41からの音データを、そのまま端末装置42に送信する。
端末装置41では、サーバ装置20との間でセッションが確立されると、表示部50に遠隔会議画面60が表示される。端末装置41では、サーバ装置20を経由して送信される、セッションが確立された端末装置(端末装置42,43の両方又は一方)からの映像データと合成データが、通信部53で受信される。表示部50に表示されている遠隔会議画面60では、受信された映像データに対応する撮影画像61が表示される。スピーカ52では、受信された合成データに対応する合成音が出力される。遠隔会議画面60では、撮影画像61に対して、その撮影画像61に対応する端末IDが表示される。更に、撮影画像61と端末IDに対する操作情報63が表示される。例えば、端末装置41では、CPU47は、撮影画像61と端末IDと操作情報63の表示指令を表示部50に出力する。これに伴い、表示部50には、例えば、図2に示すような遠隔会議画面60が表示される。但し、資料データが取得されていない場合、資料画像62は、表示されない。
遠隔会議を終了させる場合、端末装置41では、操作部51が操作され、終了ボタン65が押下される。この場合、端末装置41では、セッションを切断する手順が、サーバ装置20との間で実行される。セッションの切断によって、端末装置41での遠隔会議は、終了する。サーバ装置20との間のセッションを切断する場合に端末装置41で実行される手順は、公知の遠隔会議システムにおける手順と同様である。従って、これに関する説明は、省略する。
以下では、サーバ装置20と端末装置42,43との間でも、セッションが確立されているとする。端末装置42,43でも、端末装置41と同様、以下に説明する、音処理と変換処理とミキシング処理が実行される。従って、端末装置42,43でも、端末装置41と同様、遠隔会議画面60が表示され、合成データに対応する合成音と後述する再合成データに対応する再合成音が出力される。映像データを対象とする処理に関する説明は、公知の遠隔会議システムと同様であるため、省略する。
<音処理>
端末装置41で実行される音処理について、図3を参照して説明する。音処理は、サーバ装置20とのセッションが確立されたタイミングで開始される。CPU47は、リプレイ操作が受け付けられたかを判断する(S11)。リプレイ操作は、操作部51を介して遠隔会議画面60に含まれる操作情報63を押下する操作であり、操作部51によって受け付けられる。CPU47は、リプレイ操作の受け付けに応じて操作部51から出力される指令が取得された場合、リプレイ操作が受け付けられたと判断する。CPU47は、リプレイ操作と共に、押下された操作情報63が関連付けられた端末IDを取得する。リプレイ操作が受け付けられていない場合(S11:No)、CPU47は、処理をS15に移行する。
リプレイ操作が受け付けられた場合(S11:Yes)、CPU47は、リプレイ要求と要求元端末IDと要求先端末IDを送信させる(S13)。要求元端末IDは、リプレイ要求の送信元の端末装置の端末IDである。要求先端末IDは、S11でリプレイ操作と共に取得された端末IDである。要求元端末IDと要求先端末IDは、例えば、リプレイ要求に含まれてもよい。リプレイ要求と要求元端末ID及び要求先端末IDの送信先は、サーバ装置20とされる。CPU47は、リプレイ要求と要求元端末IDと要求先端末IDの送信指令を通信部53に出力する。送信指令に従い、リプレイ要求と要求元端末IDと要求先端末IDが、通信部53からサーバ装置20へと送信される。その後、CPU47は、処理をS15に移行する。
S15でCPU47は、合成データを取得する。合成データは、サーバ装置20から送信され、通信部53で受信される。CPU47は、通信部53を介して合成データを取得する。取得された合成データは、RAM49の領域Aに記憶される。続けて、CPU47は、リプレイデータが取得されたかを判断する(S17)。リプレイデータは、後述する図6のS79でサーバ装置20から送信される。リプレイデータが取得されていない場合(S17:No)、CPU47は、処理をS23に移行する。
上記では説明を省略したが、遠隔会議システム10において、端末装置41,42,43では、集音された音をA/D変換した波形データがエンコードされて音データが生成され、サーバ装置20に送信される。エンコードの方式としては、G.722.1とSpeexとOPUSが例示される。サーバ装置20では、端末装置41,42,43からの各音データがデコードされ、デコードされた状態で音データが合成されて合成データが生成される(後述する図6のS73参照)。その後、サーバ装置20では、合成データがエンコードされ、上述したように、所定の端末装置へと送信される。CPU47は、S15で取得されたエンコードされた合成データをデコードし、デコードされた合成データを、RAM49の領域Aに記憶させる。
リプレイデータが取得された場合(S17:Yes)、CPU47は、変換処理を実行する(S19)。リプレイデータは、通信部53で受信される。CPU47は、通信部53を介してリプレイデータを取得する。取得されたリプレイデータは、RAM49の領域Bに記憶される。サーバ装置20からのリプレイデータは、合成データと同様、エンコードされた状態である。そのため、CPU47は、エンコードされたリプレイデータをデコードし、デコードされたリプレイデータを、RAM49の領域Bに記憶させる。変換処理は、取得されたリプレイデータの再生に影響する状態を、第一状態から第二状態へと変換する処理である。変換処理に関する説明は、後述する。その後、CPU47は、ミキシング処理を実行する(S21)。詳細は後述するが、ミキシング処理では、合成データ(S15参照)とリプレイデータ(S17:Yes参照)が合成され、新たな合成データが生成される(後述する図5のS55参照)。実施形態では、ミキシング処理で新たに生成される合成データを、「再合成データ」という。再合成データは、RAM49の領域Cに記憶される。ミキシング処理に関するこの他の説明は、後述する。S21を実行した後、CPU47は、処理をS23に移行する。
S23でCPU47は、再生処理を実行する。再生処理の対象は、RAM49の領域Aに記憶された合成データ(S15参照)又はRAM49の領域Cに記憶された再合成データ(S21参照)とされる。S17が否定されていた場合(S17:No)、CPU47は、RAM49の領域Aに記憶された合成データを再生し、再生された合成音の出力指令をスピーカ52に出力する。S17が肯定されていた場合(S17:Yes)、CPU47は、RAM49の領域Cに記憶された再合成データを再生し、再生された再合成音の出力指令をスピーカ52に出力する。これに伴い、スピーカ52から合成音又は再合成音が出力される。
S23を実行した後、CPU47は、リプレイ情報が取得されたかを判断する(S25)。リプレイ情報は、後述する図6のS81でサーバ装置20から送信され、通信部53で受信される。CPU47は、通信部53を介してリプレイ情報を取得する。リプレイ情報が取得された場合(S25:Yes)、CPU47は、報知情報64を表示させる(S27)。CPU47は、取得されたリプレイ情報に含まれる端末IDを特定する。CPU47は、報知情報64の表示指令を表示部50に出力する。表示指令では、特定された端末IDに一致する端末IDと共に表示されている撮影画像61の領域の所定の位置が指定される。表示部50では、表示指令に従い、報知情報64が、前述した撮影画像61と重ね合わされた状態で表示される(図2参照)。リプレイ情報が取得されていない場合(S25:No)又はS27を実行した後、CPU47は、処理をS11に戻す。その後、CPU47は、再度、S11以降の処理を実行する。音処理は、サーバ装置20とのセッションが切断されるまで継続される。
<変換処理>
図3のS19で実行される変換処理について、図4を参照して説明する。変換処理は、デコードされた状態のリプレイデータを対象として実行される。CPU47は、RAM49の領域Bに記憶されたリプレイデータ(図3のS17:Yes参照)を、RAM49の領域Dに記憶させる(S31)。RAM49の領域Bに記憶されたリプレイデータは、RAM49の領域Dに記憶された後、RAM49の領域Bから消去される。続けて、CPU47は、速度変換処理を実行する(S33)。速度変換処理は、RAM49の領域Dに記憶されたリプレイデータを対象として実行される。速度変換処理は、リプレイデータのテンポを変換させる処理である。ここで、テンポの変換は、再生速度の変換に対応する。再生速度の変換とは、変換されたリプレイデータを再生した場合に、リプレイデータの再生に必要な時間が、変換前と比較して変化することを意味する。例えば、リプレイデータの再生速度を速くさせる場合、リプレイデータは、時間方向に間引かれた状態へと変換される。速度変換処理としては、例えば、タイムストレッチと称される公知の変換処理を採用することができる。従って、速度変換処理に関するこの他の説明は、省略する。
次に、CPU47は、振幅変換処理を実行する(S35)。振幅変換処理は、RAM49の領域Dに記憶された速度変換処理後のリプレイデータを対象として実行される。振幅変換処理は、速度変換処理後のリプレイデータのボリューム(dB)を増幅させる処理である。振幅変換処理は、リプレイデータの振幅を増幅させる公知の処理を採用することができる。従って、振幅変換処理に関するこの他の説明は、省略する。振幅変換処理に伴い、RAM49の領域Dには、この処理の実行前のリプレイデータと比較し、ボリューム(dB)が増幅されたリプレイデータが記憶される。このリプレイデータは、デコードされた状態のままとされる。S35を実行した後、CPU47は、変換処理を終了する。
<ミキシング処理>
図3のS21で実行されるミキシング処理について、図5を参照して説明する。ミキシング処理は、デコードされた状態の合成データ及びリプレイデータを対象として実行される。CPU47は、RAM49の領域Aに記憶された合成データ(図3のS15参照)を、RAM49の領域Cに記憶させる(S41)。RAM49の領域Aに記憶された合成データは、RAM49の領域Cに記憶された後、RAM49の領域Aから消去される。CPU47は、再合成データにおける合成データの音チャネルを、第一チャネルに設定する(S43)。例えば、再合成データがステレオのデータである場合、第一チャネルは、左右の音チャネルのうちの一方の音チャネル(例えば、右チャネル)である。
続けて、CPU47は、第一減衰処理を実行する(S45)。第一減衰処理は、RAM49の領域Cに記憶された合成データを対象として実行される。第一減衰処理は、合成データのボリューム(dB)を減衰させる処理である。第一減衰処理における減衰比率は、第一比率とされる。第一比率については、後述する。第一減衰処理は、上述した振幅変換処理と同様、公知の処理を採用することができる。従って、第一減衰処理に関するこの他の説明は、省略する。
次に、CPU47は、RAM49の領域Dに記憶された変換処理後のリプレイデータ(図4のS35参照)を、RAM49の領域Cに記憶させる(S47)。RAM49の領域Dに記憶された変換処理後のリプレイデータは、RAM49の領域Cに記憶された後、RAM49の領域Dから消去される。CPU47は、再合成データにおけるリプレイデータの音チャネルを、第二チャネルに設定する(S49)。例えば、再合成データがステレオのデータである場合、第二チャネルは、左右の音チャネルのうちの他方の音チャネル(例えば、左チャネル)である。続けて、CPU47は、第二減衰処理を実行する(S51)。第二減衰処理は、RAM49の領域Cに記憶された合成データを対象として実行される。第二減衰処理は、合成データのボリューム(dB)を減衰させる処理である。第二減衰処理における減衰比率は、第二比率とされる。
第一減衰処理(S45参照)での第一比率と第二減衰処理の第二比率の関係は、「第一比率>第二比率」とされる。第一比率と第二比率の関係は、「第一比率+第二比率=100%」としてもよい。例えば、第一比率は75%で、第二比率は25%とされる。第一減衰処理と第二減衰処理は、処理対象となるデータが相違するが、技術的には同一の処理である。第二減衰処理は、上述した振幅変換処理と同様、公知の処理を採用することができる。従って、第二減衰処理に関するこの他の説明は、省略する。
S51を実行した後、CPU47は、再合成データを生成する(S53)。CPU47は、RAM49の領域Cに記憶された、第一減衰処理後の合成データと第二減衰処理後のリプレイデータを合成する。このとき、合成データの音チャネルは、S43で設定された第一チャネルとされる。リプレイデータの音チャネルは、S49で設定された第二チャネルとされる。S53の実行後、合成データとリプレイデータは、RAM49の領域Cから消去され、RAM49の領域Cには、再合成データが記憶される。再合成データを生成する処理としては、複数の音データを合成する公知の処理を採用することができる。従って、再合成データの生成に関するこの他の説明は、省略する。S53を実行した後、CPU47は、ミキシング処理を終了する。
<中継処理>
サーバ装置20で実行される中継処理について、図6を参照して説明する。中継処理は、端末装置41,42,43のうちの何れかの端末装置とセッションが確立されたタイミングで開始される。実施形態では、上述した通り、端末装置41,42,43の全てとセッションが確立されているとする。CPU21は、端末装置41,42,43のうちの何れかの端末装置から送信された音データを取得する(S61)。音データは、通信部24で受信される。CPU21は、通信部24を介して音データを取得する。CPU21は、上述した通り、取得された音データをデコードする。取得された音データは、デコードされた状態で、RAM23の所定の領域に記憶される。
CPU21は、S61と後述するS63〜S71の各処理を、セッションが確立されている端末装置41,42,43のそれぞれに対応させて実行する。即ち、サーバ装置20と端末装置41,42,43の間でセッションが確立されている場合、CPU21は、S61〜S71を3回繰り返す。例えば、1サイクル目のS61では、CPU21は、端末装置41からの音データを取得し、その後、S63〜S71を順次実行する。1サイクル目のS71を実行した後、CPU21は、処理をS61に戻し、2サイクル目のS61で端末装置42からの音データを取得し、S63〜S71を順次実行する。2サイクル目のS71を実行した後、CPU21は、再度、処理をS61に戻し、3サイクル目のS61で端末装置43からの音データを取得し、S63〜S71を順次実行する。CPU21は、セッションが確立されている端末装置の数分、S61〜S71を実行した後、処理をS73に移行する。
従って、中継処理では、RAM23に、接続リストに登録された端末ID毎に、音データを記憶する領域が確保される。実施形態では、端末装置41からの音データが記憶されるRAM23の領域を、「領域E」という。端末装置42からの音データが記憶されるRAM23の領域を、「領域F」という。端末装置43からの音データが記憶されるRAM23の領域を、「領域G」という。領域Eは、端末ID「USER41」に関連付けられる。領域Fは、端末ID「USER42」に関連付けられる。領域Gは、端末ID「USER43」に関連付けられる。例えば、取得された音データが端末ID「USER42」を含む音データである場合、この音データは、デコードされてRAM23の領域Fに記憶される。
S61を実行した後、CPU21は、S61で取得された音データが無音状態の音データであるかを判断する(S63)。音データが無音状態であるかは、例えば、次のようにして判断される。判断対象とされる音データは、デコードされた状態の音データ(波形データ)である。無音状態は、取得された音データの振幅値が基準時間連続して基準値未満である状態に対応する。換言すれば、無音状態でない状態(有音状態)は、取得された音データの振幅値が基準時間連続して基準値以下とならない状態に対応する。基準時間は、例えば、ユーザが発言している場合の1音1音の間隔を考慮して予め決定される。基準値は、例えば、ユーザが、発言していると判断できる音のボリュームを考慮して予め決定される。基準値を、無音状態又は有音状態の何れとするかは、諸条件を考慮して適宜決定される。基準時間と基準値は、中継処理のプログラムに登録されている。解析される音データの振幅値としては、全ての周波数の波形の振幅値が解析の対象とされる。但し、特定の帯域の周波数の波形の振幅値を解析の対象としてもよい。特定の帯域としては、人が発する声の周波数帯域が例示される。この場合、取得された音データが音声以外の音が集音された音に対応する音データであった場合に、無音状態であると判断することができる。
音データが無音状態でない場合(S63:No)、CPU21は、この音データを記憶装置22の所定の領域に記憶させる(S65)。実施形態では、端末装置41からの音データが記憶される記憶装置22の領域を、「領域H」という。端末装置42からの音データが記憶される記憶装置22の領域を、「領域I」という。端末装置43からの音データが記憶される記憶装置22の領域を、「領域J」という。領域Hは、端末ID「USER41」に関連付けられる。領域Iは、端末ID「USER42」に関連付けられる。領域Jは、端末ID「USER43」に関連付けられる。例えば、取得された音データが端末ID「USER42」を含む音データである場合、この音データは、記憶装置22の領域Iに記憶される。既に記憶済みの音データがある場合、新たに記憶される今回の音データは、記憶済みの音データと結合するようにしてもよい。この場合、今回の音データの結合位置は、記憶済み音データの終端とされる。記憶装置22の領域H,I,Jに記憶された音データは、後述するS79でリプレイデータとして送信される。実施形態では、記憶装置22の領域H,I,Jに記憶された、要求元端末IDの端末装置に送信される前の音データについても、「リプレイデータ」という。S65におけるリプレイデータの記憶先は、RAM23としてもよい。
音データが無音状態である場合(S63:Yes)、CPU21は、記憶装置22の所定の領域に記憶された音データを消去する(S67)。消去対象となる音データは、取得された音データに含まれる端末IDに対応する音データである。例えば、取得された音データが端末ID「USER43」を含む音データである場合、記憶装置22の領域Jに記憶されている音データは、消去される。
S65又はS67を実行した後、CPU21は、リプレイ要求が取得されたかを判断する(S69)。リプレイ要求は、上述した図3のS13で送信され、通信部24で受信される。このとき、通信部24では、要求先端末IDと要求元端末IDも受信される。CPU21は、通信部24を介してリプレイ要求と要求先端末IDと要求元端末IDを取得する。続けて、CPU21は、リプレイ要求に従い、取得された要求先端末IDを接続リストに登録する(S71)。CPU21は、リプレイ要求と共に取得される要求元端末IDに一致する接続リストに登録されている端末IDに関連付けて、要求先端末IDを登録する。
CPU21は、セッションが確立されている端末装置41,42,43の数分(3回)、S61〜S71を実行した後、処理をS73に移行する。S73でCPU21は、合成データを生成する。合成データは、RAM23の領域E,F,Gに記憶された音データのうちの2個の音データを合成して生成される。例えば、CPU21は、RAM23の領域F及び領域Gに記憶された端末装置42,43からの音データを合成し、端末装置41に送信される合成データを生成する。生成された合成データは、RAM23の領域Kに記憶される。領域Kに記憶される合成データには、送信先となる端末装置の端末ID(前述した例に基づけば、端末ID「USER41」)が関連付けられる。S73の実行後、RAM23の領域E,F,Gに記憶された音データは、領域E,F,Gから消去される。S73では、S63で無音状態と判断(S63:No)される音データについては、合成対象から除外するようにしてもよい。この場合、端末装置41,42,43に対応させて3回繰り返されるS61で取得された音データが、全て無音状態である場合、S73及び後述するS75は、スキップされる。合成データを生成する処理としては、複数の音データを合成する公知の処理を採用することができる。従って、合成データの生成に関するこの他の説明は、省略する。
続けて、CPU21は、合成データを送信させる(S75)。合成データの送信先は、セッションが確立されている端末装置41,42,43とされる。CPU21は、端末ID「USER41」が関連付けられた端末装置41への合成データの送信指令を通信部24に出力する。CPU21は、端末ID「USER42」が関連付けられた端末装置42への合成データの送信指令を通信部24に出力する。CPU21は、端末ID「USER43」が関連付けられた端末装置43への合成データの送信指令を通信部24に出力する。前述した各送信指令に従い、合成データが、通信部24から端末装置41,42,43へと順次送信される。送信に際し、合成データは、エンコードされる。S75の実行後、合成データは、RAM23の領域Kから消去される。
次に、CPU21は、接続リストに要求先端末IDが記憶されているかを判断する(S77)。CPU21は、接続テーブルにアクセスする。要求先端末IDが登録されている場合(S77:Yes)、CPU21は、リプレイデータを送信させる(S79)。CPU21は、接続テーブルから、セッションが確立されている端末装置41,42,43の端末ID「USER41,42,43」とこれら端末IDに関連付けられた要求先端末IDを特定する。リプレイデータの送信先は、接続テーブルで、要求先端末IDが関連付けられた端末IDの端末装置とされる。CPU21は、記憶装置22の領域H,I,Jのうち、要求先端末IDに一致する端末IDに関連付けられた記憶装置22の領域に記憶されているリプレイデータを読み出す。続けて、CPU21は、読み出されたリプレイデータの送信指令を通信部24に出力する。送信指令に従い、リプレイデータが、通信部24から、送信先として設定された端末装置へと送信される。送信に際し、リプレイデータは、エンコードされる。
続けて、CPU21は、リプレイ情報を送信させる(S81)。リプレイ情報には、S79で特定された要求先端末IDが関連付けられた端末ID(要求元端末ID)が含められる。リプレイ情報の送信先は、S79で特定された要求先端末IDの端末装置に設定される。CPU21は、リプレイ情報の送信指令を通信部24に出力する。送信指令に従い、リプレイ情報が、通信部24から送信先として設定された端末装置へと送信される。要求先端末IDが登録されていない場合(S77:No)又はS81を実行した後、CPU21は、処理をS61に戻す。その後、CPU21は、再度、S61以降の処理を実行する。中継処理は、全ての端末装置41,42,43とのセッションが切断されるまで継続される。
<実施形態の効果>
実施形態によれば、次のような効果を得ることができる。この説明では、端末装置41,42,43による遠隔会議に関する内容は、端末装置41を主体として記載する。
(1)遠隔会議システム10で実施される端末装置41,42,43による遠隔会議において、サーバ装置20では、端末装置41,42,43から順次送信される音データが取得される(図6のS61参照)。順次取得される端末装置41からの音データは、記憶装置22の領域Hに繰り返して記憶され、順次取得される端末装置42からの音データは、記憶装置22の領域Iに繰り返して記憶され、順次取得される端末装置43からの音データは、記憶装置22の領域Jに繰り返して記憶される(図6のS65参照)。サーバ装置20では、例えば、端末装置42,43からの音データを合成した合成データが生成され、この合成データが、端末装置41に送信される(図6のS73、S75参照)。
端末装置41では、遠隔会議画面60に、端末装置42の撮影画像61及び端末ID「USER42」に関連付けて操作情報63が表示され、端末装置43の撮影画像61及び端末ID「USER43」に関連付けて操作情報63が表示される(図2参照)。端末装置41では、操作部51を介した操作情報63の押下に伴い、リプレイ操作が受け付けられた場合、リプレイ要求と要求元端末IDと要求先端末IDがサーバ装置20に送信される(図3のS11:Yes、S13参照)。サーバ装置20では、リプレイ要求と共に取得される要求先端末IDに対応するリプレイデータが、端末装置41に送信される(図6のS79参照)。端末装置41では、リプレイデータが取得され、合成データとリプレイデータを合成した再合成データが生成される(図3のS17:Yes、図5のS53参照)。端末装置41では、再合成データが再生され、合成データに対応する合成音とリプレイデータに対応する音を含む再合成音が、スピーカ52から出力される(図3のS23参照)。
そのため、遠隔会議システム10では、例えば、端末装置41で、端末装置42,43でそれぞれ現在取得されている最新の音と、端末装置42,43の何れかの端末装置で過去に取得された音を、同時に出力させることができる。端末装置41のユーザに、端末装置42,43の各ユーザの現在の発言内容を認識させつつ、端末装置41のユーザが聞き逃した端末装置42,43の何れかのユーザの過去の発言内容を、認識させることができる。実施形態におけるリプレイ要求は、端末装置41で、端末装置42,43の何れかの端末装置で過去に取得された音が出力される点を考慮すると、次のような指示ということもできる。即ち、リプレイ要求は、最新の音が取得されたタイミングより前に端末装置42,43のうちの何れかの端末装置で取得された過去の音の再生を要求する指示ということもできる。
(2)端末装置41では、リプレイデータが取得された場合、変換処理が実行される(図3のS17:Yes、S19及び図4参照)。変換処理では、リプレイデータは、速度変換処理によって再生速度が速くなる状態へと変換される(図4のS33参照)。そのため、再合成データを対象とした再生処理(図3のS23参照)において、リプレイデータに対応する音の再生時間を短くすることができる。端末装置41のユーザに、聞き逃した端末装置42,43の何れかのユーザの過去の発言内容を、迅速に認識させることができる。
(3)端末装置41では、リプレイデータが取得された場合、ミキシング処理が実行される(図3のS17:Yes、S21及び図5参照)。ミキシング処理では、合成データは、第一比率だけ減衰され、リプレイデータは、第二比率だけ減衰される(図5のS45、S51参照)。第二比率は、第一比率より小さな値とされる。第一比率だけ減衰された合成データと第二比率だけ減衰されたリプレイデータが合成され、再合成データが生成される(図5のS53参照)。その際、合成データの音チャネルは、第一チャネルとされ、リプレイデータの音チャネルは、第二チャネルとされる(図5のS43、S49参照)。そのため、再合成データを対象とした再生処理(図3のS23参照)において、リプレイデータに対応する音を、第一チャネルから出力される合成データに対応する合成音より大きなボリュームで、第二チャネルから出力させることができる。端末装置41のユーザに、聞き逃した端末装置42,43の何れかのユーザの過去の発言内容を、スムーズに認識させることができる。
(4)例えば、端末装置42から、リプレイ要求と要求元端末ID「USER42」と要求先端末ID「USER41」が送信され、サーバ装置20で、これらが取得された場合、サーバ装置20では、端末装置41に、リプレイ情報が送信される(図6のS81参照)。端末装置41では、リプレイ情報の取得に応じて、報知情報64が表示される(図3のS27参照)。その際、報知情報64は、取得されたリプレイ情報に含まれる端末ID「USER42」と共に表示されている撮影画像61の領域の所定の位置に表示される(図2参照)。そのため、端末装置41のユーザに、端末装置42で、自身の発言内容が聞き直されていることを報知することができる。
(5)サーバ装置20では、取得された音データが無音状態であるかが判断され、音データが無音状態でない場合、音データが、記憶装置22の領域H,I,Jのうち、音データに含まれる端末IDに対応する領域に記憶される(図6のS63:No、S65参照)。これに対して、取得された音データが無音状態である場合、それまでに記憶された音データが消去される(図6のS63:Yes、S67参照)。そのため、リプレイ要求に応じて送信される音データを、無音状態ではない音データとすることができる。音データの記憶を、無音状態から無音状態までの期間とすることができる。
<変形例>
実施形態は、次のようにすることもできる。以下に示す変形例のうちの幾つかの構成は、適宜組み合わせて採用することもできる。以下では、上記とは異なる点を説明することとし、同様の点についての説明は、適宜省略する。
(1)上記では、サーバ装置20で、合成データが生成され、生成された合成データが、端末装置41,42,43に適宜送信される(図6のS73、S75参照)。サーバ装置20は、音データを合成することなく、取得された音データを、音データの送信元以外の端末装置に送信するようにしてもよい。例えば、サーバ装置20は、端末装置42,43からの音データを、合成することなく、端末装置41に送信する。この場合、図6の中継処理では、S63〜S79は省略される。
端末装置41,42,43では、次のような処理が実行される。ここでは、端末装置41を例として説明する。端末装置41では、サーバ装置20から送信される端末装置42,43からの2個の音データが、受信される。CPU47は、通信部53を介して前述の2個の音データを取得する。CPU47は、取得された各音データをデコードし、デコードされた各音データを対象として、図6のS63〜S67に対応する処理を実行する。CPU47は、リプレイ操作が受け付けられた場合(図3のS11:Yes参照)、自装置の記憶装置48の所定の領域から、操作情報63が関連付けられた端末IDの音データを取得し(図3のS17:Yes参照)、上記同様、S19以降の処理を実行する。CPU47は、自装置の端末ID(上記に準じて「要求元端末ID」という)と、操作情報63が関連付けられた端末ID(上記に準じて「要求先端末ID」という)を含むリプレイ情報を、サーバ装置20に送信する。
サーバ装置20では、CPU21は、通信部24を介して、このリプレイ情報を取得する。続けて、CPU21は、リプレイ情報を送信させる。リプレイ情報の送信先は、要求先端末IDの端末装置とされる。この端末装置では、リプレイ情報に含まれる要求元端末IDに従い、図3のS27が実行される。
(2)上記では説明を省略したが、遠隔会議システム10では、公知の遠隔会議システムと同様、端末装置41,42,43のそれぞれに対して、所定の役割が設定される。役割としては、主催者と発表者と参加者が例示される。これら3つの役割について、主催者は最上位の役割であり、発表者と参加者は、主催者より下位の役割である。発表者は、参加者より上位の役割である。図6のS63では、例えば、判断条件となる基準時間及び/又は振幅値の基準値は、役割に応じて適宜変更するようにしてもよい。例えば、上位の役割程、基準時間を長く設定するようにしてもよい。この他、無音状態であるかに関わらず、一定時間、音データを記憶するようにしてもよい。この場合も、前述した一定時間は、役割に応じて変更するようにしてもよい。例えば、上位の役割程、音データを長い時間記憶させるようにしてもよい。
(3)上記では、音データが取得される毎に、取得された音データが無音であるかが判断され、取得された1個の音データが、無音状態である場合、それまでに記憶された音データが消去される(図6のS61、S63:Yes、S67参照)。S63の判断は、同一の端末装置から取得される音データが、例えば、予め定めた回数又は時間連続して無音状態であった場合、否定(図6のS63:Yes参照)されるようにしてもよい。この場合、端末装置毎に、無音状態の音データが連続して取得された回数、又は無音状態の音データの時間がカウントされる。サーバ装置20と端末装置41,42,43の間を送受信される音データを、一定時間(例えば、20msec)のデータとした場合、無音状態の音データが連続して取得された回数をカウントすることで、無音状態である時間を計測することができる。無音状態の判断条件となる基準時間は、上記の場合と比較し、長い時間に設定される。
(4)上記では、変換処理(図4参照)では、S33で速度変換処理が実行される。速度変換処理は、省略してもよい。速度変換処理は、リプレイデータの再生速度を遅くする処理(テンポを遅くする処理)であってもよい。変換処理では、S35で振幅変換処理が実行される。ミキシング処理(図5参照)では、S51で第二減衰処理が実行される。振幅変換処理又は第二減衰処理の一方は、省略してもよい。例えば、振幅変換処理は、省略してもよい。
10 遠隔会議システム
20 サーバ装置
21 CPU
22 記憶装置
23 RAM
24 通信部
25 バス
41,42,43 端末装置
47 CPU
48 記憶装置
49 RAM
50 表示部
51 操作部
52 スピーカ
53 通信部
54 接続インターフェース(接続I/F)
55 バス
56 カメラ
57 マイク
60 遠隔会議画面
61 撮影画像
62 資料画像
63 操作情報
64 報知情報
65 終了ボタン
90 ネットワーク

Claims (11)

  1. ネットワークに接続された第一端末装置を制御するコンピュータに、
    前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、
    前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、
    前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、
    前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、
    前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、を実行させるプログラム。
  2. 前記プログラムは、前記コンピュータに、前記第二音データの再生に影響する状態を第一状態から第二状態へと変換する変換処理を実行させ、
    前記第一ミキシング処理は、前記第一音データと、前記第二状態へと変換された前記第二音データと、を合成する処理である、請求項1に記載のプログラム。
  3. 前記変換処理は、前記第一状態の前記第二音データを、前記第二音データの再生速度が前記第一状態より速い前記第二状態へと間引く処理である、請求項2に記載のプログラム。
  4. 前記第一合成データは、複数の音チャネルから構成され、
    前記第一ミキシング処理は、前記第一音データを、前記複数の音チャネルのうちの第一チャネルに合成し、前記第二音データを、前記複数の音チャネルのうちの第二チャネルに合成する処理である、請求項1から請求項3の何れか1項に記載のプログラム。
  5. 前記プログラムは、前記コンピュータに、
    前記第一音データを、第一比率だけ減衰させる第一減衰処理と、
    前記第二音データを、前記第一比率より小さな第二比率だけ減衰させる第二減衰処理と、を実行させ、
    前記第一ミキシング処理は、減衰された前記第一音データと、減衰された前記第二音データと、を合成する処理である、請求項1から請求項4の何れか1項に記載のプログラム。
  6. 前記プログラムは、前記コンピュータに、前記第二端末装置に対応する相手先情報と、前記第一リプレイ要求の送信に対応する操作情報と、を関連付けて表示させる第一表示処理を実行させ、
    前記第一送信処理は、前記相手先情報と前記操作情報とが表示されている状態で、前記操作情報に対する入力が受け付けられた場合、前記第一リプレイ要求と、前記遠隔会議で前記第二端末装置を識別する端末情報と、を前記サーバ装置へと送信させる処理である、請求項1から請求項5の何れか1項に記載のプログラム。
  7. 前記プログラムは、前記コンピュータに、
    前記第一端末装置で集音された第三音に対応する第三音データを、前記サーバ装置へと送信させる第二送信処理と、
    前記サーバ装置から送信される、前記第一端末装置で集音された、前記第一タイミングより前の第三タイミングの前記第三音に対応する前記第三音データが前記サーバ装置から前記第二端末装置に送信されていることを示すリプレイ情報を取得する第三取得処理と、
    前記リプレイ情報が取得された場合、前記第二端末装置に対応する相手先情報と、前記リプレイ情報の取得を示す報知情報と、を関連付けて表示させる第二表示処理と、を実行させる、請求項1から請求項6の何れか1項に記載のプログラム。
  8. ネットワークに接続されたサーバ装置を制御するコンピュータに、
    前記ネットワークに接続された第一端末装置と、前記ネットワークに接続された第二端末装置と、前記ネットワークに接続された第三端末装置と、による前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第四音に対応する第四音データを取得する第四取得処理と、
    取得された前記第四音データを記憶させる第一記憶処理と、
    前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第五音に対応する第五音データを取得する第五取得処理と、
    第一タイミングの前記第四音に対応する前記第四音データと、前記第一タイミングの前記第五音に対応する前記第五音データと、を合成した第二合成データを生成する第二ミキシング処理と、
    前記第二合成データを、前記第一端末装置へと送信させる第三送信処理と、
    前記第一端末装置から送信される、前記第一タイミングより前の第二タイミングの前記第四音に対応する前記第四音データの送信を要求する第二リプレイ要求を取得する第六取得処理と、
    前記第二リプレイ要求が取得された場合、前記第二タイミングの前記第四音に対応する前記第四音データを、前記第一端末装置に送信させる第四送信処理と、を実行させるプログラム。
  9. 前記第一記憶処理は、取得された前記第四音データを第一期間分記憶させる処理である、請求項8に記載のプログラム。
  10. 前記第一記憶処理は、取得された前記第四音データを、前記第四音データの振幅値が、基準時間連続して基準値以下又は未満とならない前記第一期間分記憶させる処理である、請求項9に記載のプログラム。
  11. ネットワークに接続された、第一端末装置と第二端末装置と第三端末装置とサーバ装置と、を含む遠隔会議システムで実行される遠隔会議方法であって、
    前記第一端末装置と前記第二端末装置と前記第三端末装置とによる前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第六音に対応する第六音データを取得する工程と、
    取得された前記第六音データを記憶する工程と、
    前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第七音に対応する第七音データを取得する工程と、
    第一タイミングの前記第六音に対応する前記第六音データと、前記第一タイミングの前記第七音に対応する前記第七音データと、を合成した第三合成データを生成する工程と、
    前記第三合成データを再生し、再生された第二合成音を出力する工程と、
    前記第一タイミングより前の第二タイミングの前記第六音の再生を要求するリプレイ要求を取得する工程と、
    前記リプレイ要求が取得された場合、前記第三合成データと、前記第二タイミングの前記第六音に対応する前記第六音データと、を合成した第四合成データを生成する工程と、
    前記第四合成データを再生し、再生された第三合成音を出力する工程と、を含む遠隔会議方法。
JP2015250701A 2015-12-22 2015-12-22 プログラム及び遠隔会議方法 Expired - Fee Related JP6390607B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015250701A JP6390607B2 (ja) 2015-12-22 2015-12-22 プログラム及び遠隔会議方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015250701A JP6390607B2 (ja) 2015-12-22 2015-12-22 プログラム及び遠隔会議方法

Publications (2)

Publication Number Publication Date
JP2017118281A true JP2017118281A (ja) 2017-06-29
JP6390607B2 JP6390607B2 (ja) 2018-09-19

Family

ID=59230962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015250701A Expired - Fee Related JP6390607B2 (ja) 2015-12-22 2015-12-22 プログラム及び遠隔会議方法

Country Status (1)

Country Link
JP (1) JP6390607B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003304337A (ja) * 2002-04-08 2003-10-24 Nec Corp 遠隔会議システムにおける発言管理システム
JP2010085688A (ja) * 2008-09-30 2010-04-15 Seiko Epson Corp プロジェクター、会議システム、音源方向決定方法およびカメラ制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003304337A (ja) * 2002-04-08 2003-10-24 Nec Corp 遠隔会議システムにおける発言管理システム
JP2010085688A (ja) * 2008-09-30 2010-04-15 Seiko Epson Corp プロジェクター、会議システム、音源方向決定方法およびカメラ制御方法

Also Published As

Publication number Publication date
JP6390607B2 (ja) 2018-09-19

Similar Documents

Publication Publication Date Title
US9386278B2 (en) Teleconference method, storage medium storing program for teleconference, and terminal apparatus
US20160294892A1 (en) Storage Medium Storing Program, Server Apparatus, and Method of Controlling Server Apparatus
WO2019071808A1 (zh) 视频画面显示的方法、装置、系统、终端设备及存储介质
JP5211001B2 (ja) 会議通信システム、会議通信方法及びプログラム
WO2020238840A1 (zh) 单机程序的运行方法、装置、设备及存储介质
JP2015126524A (ja) 遠隔会議プログラム、端末装置および遠隔会議方法
JP2008236553A (ja) テレビ会議システムにおける端末装置、端末装置の制御方法、端末装置の制御プログラム
JP6390607B2 (ja) プログラム及び遠隔会議方法
JP2010154387A (ja) 通信端末装置、通信制御方法、通信制御プログラム
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
JP2008141348A (ja) 通信装置
JP2019176386A (ja) 通信端末及び会議システム
JP3031320B2 (ja) ビデオ会議装置
JP5777233B1 (ja) 動画生成装置及び動画生成方法
JP2020135556A (ja) 処理装置、プログラム、及び処理方法
JP5889162B2 (ja) 会議支援装置、会議支援システム、その方法及びプログラム
JP2012004756A (ja) 端末装置、会議システムおよび処理プログラム
WO2024032111A1 (zh) 在线会议的数据处理方法、装置、设备、介质及产品
US20230035219A1 (en) Teleconference method and teleconference system
WO2022201431A1 (ja) 情報処理装置、参加者端末、支援システム、情報処理方法、支援方法、および、支援プログラム
JP6399001B2 (ja) 遠隔会議方法及びプログラム
WO2013146510A1 (ja) 会議システム、プログラムおよび会議方法
US20240046540A1 (en) Speech image providing method and computing device for performing the same
JP6610572B2 (ja) 編集装置
JP2023120068A (ja) 音声処理システム、デバイス、音声処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180806

R150 Certificate of patent or registration of utility model

Ref document number: 6390607

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees