JP2023043497A - remote conference system - Google Patents
remote conference system Download PDFInfo
- Publication number
- JP2023043497A JP2023043497A JP2021151164A JP2021151164A JP2023043497A JP 2023043497 A JP2023043497 A JP 2023043497A JP 2021151164 A JP2021151164 A JP 2021151164A JP 2021151164 A JP2021151164 A JP 2021151164A JP 2023043497 A JP2023043497 A JP 2023043497A
- Authority
- JP
- Japan
- Prior art keywords
- remote conference
- participant
- participants
- seat
- remote
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、リモート会議システムに関する。 The present invention relates to a remote conference system.
従来、リモート会議を実行するためのリモート会議システムとして、例えば、特許文献1に示すような多地点テレビ会議システムがある。特許文献1の多地点テレビ会議システムは、空間情報管理手段及び映像配置制御手段と、協同作業状態検出手段と、操作入力管理手段と、を備える。空間情報管理手段及び映像配置制御手段は、顔映像と協同作業映像の映像配置を管理する。協同作業状態検出手段は、協同作業手段の処理状態を検出する。操作入力管理手段は、協同作業手段が利用者からの入力として端末の別を指定する情報を待っている状態であることを検出した場合に利用者が顔映像領域に対して行ったポインティング操作を協同作業手段に対する端末指定の入力情報に変換する。 Conventionally, as a remote conference system for executing a remote conference, for example, there is a multipoint video conference system as disclosed in Patent Document 1. The multipoint video conference system of Patent Document 1 includes spatial information management means, video layout control means, collaborative work state detection means, and operation input management means. Spatial information management means and image layout control means manage the image layout of the face image and the collaborative work image. The cooperative work state detection means detects the processing state of the cooperative work means. The operation input management means controls the pointing operation performed by the user on the face image area when detecting that the collaborative work means is waiting for information specifying the type of terminal as input from the user. It is converted into terminal-specified input information for collaborative work means.
しかしながら、特許文献1の多地点テレビ会議システムでは、仮想的な会議空間における座席位置に応じて各参加者の画像を合成し、仮想的な会議室の画像を演出することは可能であるが、参加者が発する音声に対しては何ら作用を加えていないため、各参加者の音声音像が1点に集中する。そのため、特許文献1の多地点テレビ会議システムでは、実際の会議室とは異なり、複数の参加者が同時に発話した場合に、各参加者の発言内容が聞き取りにくいという問題があった。 However, in the multi-point video conference system of Patent Document 1, it is possible to produce an image of a virtual conference room by synthesizing the images of each participant according to the seat position in the virtual conference space. Since no action is applied to the voices uttered by the participants, the voice sound image of each participant concentrates on one point. Therefore, in the multi-point video conference system of Patent Document 1, unlike in an actual conference room, when a plurality of participants speak at the same time, there is a problem that it is difficult to hear the content of each participant's speech.
そこで、本発明は、リモート会議中に複数の参加者が同時に発言した場合であっても、個々の話者の発言内容を聞き取り可能なリモート会議システムを提供することを目的とする。 SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a remote conference system in which even when a plurality of participants speak at the same time during a remote conference, the content of each speaker's speech can be heard.
上記目的を達成するために、本発明の一局面に係るリモート会議システムは、リモート会議サーバー装置と、リモート会議クライアント装置とを備える。前記リモート会議サーバー装置は、前記リモート会議を主催する。前記リモート会議クライアント装置は、前記リモート会議に参加する参加者の各々に割り当てられる。前記リモート会議サーバー装置は、座席決定部を含む。前記座席決定部は、前記リモート会議を行うリモート会議室における前記参加者の座席を決定する。前記リモート会議サーバー装置又は前記リモート会議クライアント装置は、音場特性決定部と、音声合成部とを含む。音場特性決定部は、前記座席決定部によって決定される各座席相互間での音場特性を決定する。音声合成部は、前記参加者に対して出力される音声を合成する。前記音場特性決定部は、前記各リモート会議クライアント装置で再生する音声の音場特性を、前記リモート会議クライアント装置毎に個別に決定する。前記音声合成部は、前記音場特性決定部によって決定された音場特性に基づいて、前記リモート会議クライアント装置の各々で再生する音声を合成する。 To achieve the above object, a remote conference system according to one aspect of the present invention includes a remote conference server device and a remote conference client device. The remote conference server device hosts the remote conference. The remote conference client device is assigned to each participant joining the remote conference. The remote conference server device includes a seat determiner. The seat determination unit determines the seats of the participants in the remote conference room where the remote conference is held. The remote conference server device or the remote conference client device includes a sound field characteristic determination section and a speech synthesis section. A sound field characteristic determination unit determines sound field characteristics between the seats determined by the seat determination unit. The voice synthesizing unit synthesizes voices to be output to the participants. The sound field characteristic determining unit individually determines, for each remote conference client apparatus, sound field characteristics of audio reproduced by each of the remote conference client apparatuses. The speech synthesizing unit synthesizes speech to be reproduced by each of the remote conference client devices based on the sound field characteristics determined by the sound field characteristics determining unit.
本発明によると、複数の参加者が同時に発言した場合であっても、個々の話者の発言内容を容易に聞き取ることができる。 According to the present invention, even when a plurality of participants speak at the same time, it is possible to easily hear the content of each speaker's speech.
以下、本発明の一実施形態を、図面を参照して説明する。図1は、本実施形態におけるリモート会議システム10の全体概要を示す概要図である。図2は、本実施形態におけるリモート会議システム10の全体概要を示すシステム構成図である。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic diagram showing an overall overview of a
リモート会議システム10は、複数の参加者A、B、C、Dが互いに離れた場所で一方向又は双方向に通信を行う通信会議システムである。図1に示すように、参加者A、B、C、Dは、それぞれ、例えば、各自の自宅、各自の勤務先(具体的には、勤務先の自席又は勤務先の会議室等)、又は外出先等からリモート会議クライアント装置11、12、13、14を操作することによってリモート会議に参加する。図2に示すように、リモート会議システム10は、複数のリモート会議クライアント装置11、12、13、14と、リモート会議サーバー装置15と、から構成されている。
The
リモート会議クライアント装置11、12、13、14は、それぞれリモート会議に参加する参加者A、B、C、Dに割り当てられる通信装置である。リモート会議クライアント装置11、12、13、14は、例えば、スマートフォン、タブレット、パーソナルコンピューター、テレビ受像装置等のリモート会議サーバー装置15と通信可能な装置である。リモート会議クライアント装置11、12、13、14の各々は、通信ユニット16と、スピーカー17と、マイク18と、表示部19と、を主に備えている。
Remote
通信ユニット16は、リモート会議サーバー装置15と通信を行う。すなわち、通信ユニット16は、参加者A、B、C、Dのリモート会議クライアント装置11、12、13、14の各々から、音声及び画像を、リモート会議サーバー装置15に伝達する音声アップロード手段である。
The
例えば、第1リモート会議クライアント装置11の通信ユニット16は、第1リモート会議クライアント装置11において形成される第1参加者Aの発話の音声データを、リモート会議サーバー装置15に送信する。一方で、第1リモート会議クライアント装置11の通信ユニット16は、他のリモート会議クライアント装置12、13、14において形成される他の参加者B、C、Dの発話の音声データ、及びリモート会議サーバー装置15において形成される音場形成用データを、リモート会議サーバー装置15から受信する。通信ユニット16は、受信した音声データ及び音場形成用データをスピーカー17に対して出力する。音場形成用データとは、リモート会議室30における音場特性(リモート会議室30において参加者A、B、C、Dの相互間で伝達される音声の特性)を決定するためのデータである。
For example, the
同様に、第1リモート会議クライアント装置11の通信ユニット16は、第1リモート会議クライアント装置11において形成される第1参加者Aの画像等の画像データを、リモート会議サーバー装置15に送信する。第1リモート会議クライアント装置11の通信ユニット16は、他のリモート会議クライアント装置12、13、14において形成される他の参加者B、C、Dの画像等の画像データ、及びリモート会議サーバー装置15において形成される画像データを、リモート会議サーバー装置15から受信する。通信ユニット16は、受信した画像データを表示部19に出力する。
Similarly, the
スピーカー17は、リモート会議クライアント装置11、12、13、14において形成される音声データ、並びに通信ユニット16が受信した音声データ及び音場形成用データを出力する。具体的には、例えば、第1リモート会議クライアント装置11のスピーカー17は、第1リモート会議クライアント装置11において形成される音声データを出力する。一方で、第1リモート会議クライアント装置11のスピーカー17は、リモート会議システム10の利用時には、他のリモート会議クライアント装置12、13、14において形成される音声データを含んだリモート会議サーバー装置15から送信される音声データを出力する。
The
スピーカー17は、例えば、リモート会議クライアント装置の左右に配置された2つのスピーカーによって構成される。スピーカー17は、左右のスピーカーで異なる音を出力することが可能である。すなわち、スピーカー17は、ステレオ再生が可能である。なお、スピーカー17は、1つのスピーカーによって構成されてもよいし、3つ以上のスピーカーによって構成されてもよい。
The
マイク18は、参加者A、B、C、Dがリモート会議中に音声を発する際に使用する。参加者A、B、C、Dがマイク18に音声を入力することで、音声信号が通信ユニット16に出力される。
表示部19は、各リモート会議クライアント装置11、12、13、14において形成される画像データ及びリモート会議サーバー装置15において形成される画像データを表示する。
The
リモート会議サーバー装置15は、リモート会議を主催するホスト制御処理装置である。図2に示すように、リモート会議サーバー装置15は、通信部20と、画像形成部21と、座席決定部22と、音場特性決定部23と、音声合成部24と、発話回数記録部25と、を主に含んでいる。
The remote
通信部20は、リモート会議クライアント装置11、12、13、14の通信ユニット16と通信可能に接続されている。通信部20は、リモート会議クライアント装置11、12、13、14の通信ユニット16との間で、音声データ、音場形成用データ及び画像データの送受信を行う。すなわち、通信部20は、リモート会議サーバー装置15から各リモート会議クライアント装置11、12、13、14に個別の音声及び画像を配信する配信手段である。なお、通信部20と通信ユニット16との間の通信は、有線及び無線を問わない。
The
図3は、リモート会議システム10において各リモート会議クライアント装置11、12、13、14の表示部19に表示されるリモート会議室30の一例を示す図である。画像形成部21は、各リモート会議クライアント装置11、12、13、14の表示部19に表示させる画像データを形成する。画像形成部21は、例えば、図3に示すように、リモート会議室30を想定し、想定したリモート会議室30の中に会議用テーブル31を仮定し、仮定した会議用テーブル31の周りに参加者の人数分の座席(座席32、33、34、35)を配置する。すなわち、画像形成部21は、仮想的なリモート会議室30を設定し、その仮想的に設定されたリモート会議室30の中に、会議用テーブル31及び座席32、33、34、35を配置する。より具体的には、画像形成部21は、長方形の会議用テーブル31を仮定し、会議用テーブル31の片側に座席32、33を配置し、座席32、33の向かい側に座席34、35を配置する。なお、リモート会議室30の形状、会議用テーブル31の形状、座席32、33、34、35の配置等は、画像形成部21によって任意で決定されてもよいし、ユーザーによって任意で決定されてもよい。
FIG. 3 is a diagram showing an example of a
座席決定部22は、リモート会議室30における参加者A、B、C、Dの座席(座席32、33、34、35)を決定する。具体的には、座席決定部22は、リモート会議システム10の利用時に、画像形成部21によって配置されたリモート会議室30の座席(座席32、33、34、35)に、参加者A、B、C、Dを振り分ける。
The
より具体的には、座席決定部22は、図3に示すように、第1リモート会議クライアント装置11から参加している第1参加者Aを第1座席32に振り分ける。座席決定部22は、第2リモート会議クライアント装置12から参加している第2参加者Bを第1座席32の隣の第2座席33に振り分ける。座席決定部22は、第3リモート会議クライアント装置13から参加している第3参加者Cを第1座席32の向かい側の第3座席34に振り分ける。座席決定部22は、第4リモート会議クライアント装置14から参加している第4参加者Dを第2座席33の向かい側(第3座席34の隣)の第4座席35に振り分ける。なお、座席決定部22は、例えば、リモート会議室30における参加者A、B、C、Dの座席(座席32、33、34、35)の配置を、画像形成部21によって配置された座席32、33、34、35に応じて任意で決定する。または、座席決定部22は、例えば、座席32、33、34、35の配置を、参加者A、B、C、Dの要望(リモート会議クライアント装置11、12、13、14からの要求信号)に応じて決定する。
More specifically, the
画像形成部21は、座席決定部22が参加者A、B、C、Dを各座席(座席32、33、34、35)に振り分けることで、参加者A、B、C、Dの画像を、振り分けた座席32、33、34、35に対応させて形成する。より具体的には、画像形成部21は、例えば、第1参加者Aの画像を、第1座席32の上に表示させる画像データを形成する。画像形成部21は、第2参加者Bの画像を、第2座席33の上に表示させる画像データを形成する。画像形成部21は、第3参加者Cの画像を、第3座席34の上に表示させる画像データを形成する。画像形成部21は、第4参加者Dの画像を、第4座席35の上に表示させる画像データを形成する。
The
音場特性決定部23は、仮想的に設定されたリモート会議室30における各参加者A、B、C、Dの相対的な位置関係(座席32、33、34、35への着席位置よる相対的な位置関係)に応じて音声の音場特性(音場及び音像定位、並びに音声の奥行き感)を決定する。具体的には、音場特性決定部23は、座席決定部22によって決定される各座席32、33、34、35相互間での音場形成用データを形成する。
The sound field
音声合成部24は、参加者A、B、C、Dに対して出力される音声及び画像を合成する。具体的には、音声合成部24は、音場特性決定部23によって決定された音場特性(音場特性決定部23によって形成された音場形成用データ)に基づいて、各リモート会議クライアント装置11、12、13、14で再生する音声及び画像を合成する。
The
発話回数記録部25は、リモート会議中における各参加者A、B、C、Dの発話回数を記録する。具体的には、発話回数記録部25は、各リモート会議クライアント装置11、12、13、14から送信される音声データに基づいて各参加者A、B、C、Dの発話回数を記録する。発話回数記録部25は、各参加者A、B、C、Dの発話回数から、リモート会議に参加中の各参加者A、B、C、Dの発話頻度を算定する。具体的には、発話回数記録部25は、一定時間(例えば、リモート会議開始から10分間)内における各参加者A、B、C、Dの発話回数の単純平均、又は、直近の比率を高めた各参加者A、B、C、Dの発話回数の加重平均に基づいて、リモート会議に参加中の各参加者A、B、C、Dの発話頻度を算定する。従って、参加者A、B、C、Dの各々の発話頻度を、リモート会議の開始から所定時間毎に細かく算定することができる。
The utterance
座席決定部22は、発話回数記録部25が算定した各参加者A、B、C、Dの発話頻度に基づいて、リモート会議室30における参加者A、B、C、Dの仮想的な着席位置(座席32、33、34、35の位置)を調整する。具体的には、発話回数記録部25が各参加者A、B、C、Dの発話頻度を算出した結果、参加者Aの発話頻度が他の参加者B、C、Dの直近の発話頻度より多いと判明した場合には、座席決定部22は、直近の発言量の多い第1参加者Aと他の参加者B、C、Dとの間の距離が長くなるように、リモート会議室30における第1参加者Aの仮想的な着席位置(第1座席32の位置)を、他の参加者B、C、Dの仮想的な着席位置(座席33、34、35の位置)より離す。このように、座席決定部22は、各参加者A、B、C、Dの過去の発話履歴に基づいて、参加者A、B、C、Dの仮想的な着席位置を調整することで、リモート会議室30において、発話頻度が多い参加者(参加者A)を容易に識別することができる。
The
次に、リモート会議システム10におけるステレオ再生による音像合成について説明する。リモート会議システム10においては、複数の参加者A、B、C、Dが同時に話を行っていても、各参加者A、B、C、Dの声を聞き取り易くするために、各参加者A、B、C、Dの音声音像を離れた位置に配置するようにステレオ再生を行う。具体的には、音場特性決定部23及び音声合成部24が、仮想的に設定されたリモート会議室30における各参加者A、B、C、Dの着席位置(座席32、33、34、35の位置)による相対的な位置関係に応じてステレオ再生時の音声を調整することで、各参加者A、B、C、Dがあたかもその場所から話しているように再現することができる。具体的には、リモート会議室30における話者と、話者以外の参加者との相対的な距離によって以下のような処理を行う。
Next, sound image synthesis by stereo reproduction in the
音声合成部24は、遠くの話者の音声データを高域フィルターによって処理する。すなわち、音声合成部24は、音声データを処理するフィルターの係数を、リモート会議室30における話者と、話者以外の参加者との相対的な距離に応じて調整する。これにより、スピーカー17から出力される際の音声に奥行感を出すことができる。具体的には、図3に示すように、音声合成部24が、第1リモート会議クライアント装置11で(第1参加者Aに対して)再生する音声を合成する場合には、第1参加者Aに対して、第2参加者B及び第3参加者Cよりも遠くの話者である第4参加者Dの音声データを高域フィルターによって処理する。ここで、音声合成部24は、音場特性決定部23によって決定された音場特性に基づいて、第4参加者Dの音声データを、第1参加者Aに対して遠くの話者の音声データと判断する。音場特性決定部23は、リモート会議室30における第1参加者Aの着席位置(第1座席32)を基準として、第4参加者Dの着席位置(第4座席35)と、第2参加者Bの着席位置(第2座席33)及び第3参加者Cの着席位置(第3座席34)との位置関係を相対的に比較することで、第4参加者Dの着席位置が第1参加者Aの着席位置から遠い(第4参加者Dが第1参加者Aの着席位置から遠い話者である)と判断する。そして、音場特性決定部23は、その判断結果を音声合成部24に送信する。
The
また、音声合成部24は、音声データを処理するフィルターの係数を調整することで、遠くの話者の音声データのうちの高い周波数の音ほど空気によって吸収される現象を再現する。このようにフィルターの係数を調整することで、空気中での音の伝わり方を忠実に再現することができ、低い周波数成分を有する音のみが遠くまで聞こえるように調整することができる。
In addition, the
さらに、音声合成部24は、遠くの話者の音声データについては、音声レベルの増加が緩やかとなるようにアタックを調整する。すなわち、音声合成部24は、各参加者A、B、C、Dの無発声状態からの発話開始を検知して、各参加者A、B、C、Dの音声の音量の立ち上がりを、リモート会議室30における話者と、話者以外の参加者との相対的な距離に応じて調整する。具体的には、図3に示すように、音声合成部24が、第1リモート会議クライアント装置11で(第1参加者Aに対して)再生する音声を合成する場合には、第1参加者Aに対して遠くの話者である第4参加者Dの音声の音量の立ち上がりが、他の参加者B、Cの音声の音量の立ち上がりより緩やかとなるようにアタックを調整する。
Furthermore, the
さらにまた、音声合成部24は、遠くの話者の音声データにはリバーブ(残響)を適用する。音声合成部24が遠くの話者の音声データにリバーブ(残響)を適用することで、話者の音声に、空間的な深み、或いは広がり感を与えることができる。
Furthermore, the
また、音声合成部24は、リモート会議室30における話者と、話者以外の参加者との左右方向の相対的な位置関係に応じて、スピーカー17のステレオ再生における左右のスピーカーの音量を調整する。具体的には、図3に示すように、音声合成部24が、第1リモート会議クライアント装置11で(第1参加者Aに対して)再生する音声を合成する場合に、第1参加者Aに対して左側(図3においては右側)の話者である第2参加者Bの音声を出力する際には、スピーカー17のステレオ再生における左側のスピーカーの音量を右側のスピーカーの音量より大きく調整する。
In addition, the
このように、リモート会議システム10では、リモート会議サーバー装置15の音場特性決定部23及び音声合成部24において、各参加者A、B、C、D用に処理された音声データ及び画像を生成し、参加者A、B、C、D毎に個別に配信する。
As described above, in the
図4は、リモート会議システム10におけるリモート会議サーバー装置15の作動フローを示すフローチャートである。上記のような機能を有するリモート会議システム10において、リモート会議サーバー装置15は、例えば、図4に示すような作動フローに沿って処理を行う。
FIG. 4 is a flow chart showing the operation flow of the remote
図4に示すように、リモート会議サーバー装置15は、各リモート会議クライアント装置11、12、13、14から送信される信号に基づいてリモート会議の参加者A、B、C、Dを特定する(ステップS1)。リモート会議サーバー装置15は、参加者A、B、C、Dを特定すると、画像形成部21によって、図3に示すようなリモート会議室30を想定し、想定したリモート会議室30の中に会議用テーブル31を仮定し、仮定した会議用テーブル31の周りに参加者の人数分の座席(座席32、33、34、35)を配置する(ステップS2)。リモート会議サーバー装置15は、リモート会議室30に座席32、33、34、35を配置すると、座席決定部22によって、リモート会議室30における参加者A、B、C、Dの座席(座席32、33、34、35)を図3に示すように決定する(ステップS3)。リモート会議サーバー装置15は、参加者A、B、C、Dの座席を決定すると、音場特性決定部23によって、座席32、33、34、35相互間での音場特性を、リモート会議クライアント装置11、12、13、14毎に個別に決定する(ステップS4)。
As shown in FIG. 4, the remote
その後、リモート会議が開始され、参加者A、B、C、Dからの発話がある、すなわち、リモート会議クライアント装置11、12、13、14からリモート会議サーバー装置15に音声データが送信されると、リモート会議サーバー装置15は、送信された音声データから発話者を特定する(ステップS5)。リモート会議サーバー装置15は、発話者を特定すると、音声合成部24によって、各リモート会議クライアント装置11、12、13、14で再生する発話者の音声を、リモート会議クライアント装置11、12、13、14毎に合成する(ステップS6)。この際、音声合成部24は、音場特性決定部23によって決定された音場特性に基づいて発話者の音声を合成する。リモート会議サーバー装置15は、音場特性決定部23によって発話者の音声を合成すると、合成した音声データを通信部20によって各リモート会議クライアント装置11、12、13、14に送信する(ステップS7)。
After that, when the remote conference is started and participants A, B, C, and D speak, that is, voice data is transmitted from the remote
リモート会議サーバー装置15は、合成した音声データを各リモート会議クライアント装置11、12、13、14に送信すると、参加者A、B、C、Dからの発話があるか否かを判断する(ステップS8)。すなわち、リモート会議サーバー装置15は、リモート会議クライアント装置11、12、13、14からリモート会議サーバー装置15に音声データが送信されているか否かを判断する。リモート会議サーバー装置15は、参加者A、B、C、Dからの発話があると判断すると(ステップS8-Yes)、送信された音声データから発話者を特定する(ステップS5)。リモート会議サーバー装置15は、参加者A、B、C、Dからの発話がないと判断すると(ステップS8-No)、リモート会議が終了したか否かを判断する(ステップS9)。この時、リモート会議サーバー装置15は、リモート会議を終了する旨の信号がリモート会議クライアント装置11、12、13、14の少なくとも1つから送信された場合、或いは、リモート会議クライアント装置11、12、13、14の少なくとも1つからの通信が切断された場合には、リモート会議が終了したと判断する。リモート会議サーバー装置15は、リモート会議が終了していないと判断すると(ステップS9-No)、参加者A、B、C、Dからの発話があるか否かを判断する(ステップS8)。リモート会議サーバー装置15は、リモート会議が終了したと判断すると(ステップS9-No)、リモート会議システム10のホスト処理を終了する。なお、ステップS9において、リモート会議を終了する旨の信号がリモート会議クライアント装置11、12、13、14の全てから送信された場合、或いは、全てのリモート会議クライアント装置11、12、13、14からの通信が切断された場合に、リモート会議サーバー装置15は、リモート会議が終了したと判断してもよい。
When the remote
次に、図5を参照して、リモート会議システム10の1対1対話機能について説明する。図5は、リモート会議システム10において1対1対話モード時にリモート会議クライアント装置11、12、13、14の表示部19に表示されるリモート会議室30の一例を示す図である。
Next, with reference to FIG. 5, the one-to-one interaction function of the
リモート会議システム10には、リモート会議に参加中の参加者A、B、C、Dの中から特定の参加者と1対1で対話を行うことができる1対1対話モードが設定されている。1対1対話モードは、各リモート会議クライアント装置11、12、13、14に設けられている。参加者A、B、C、Dは、リモート会議クライアント装置11、12、13、14の表示部19に表示される参加者リストから特定の参加者を選択することで、1対1対話モードに入ることができる。例えば、参加者Aが特定の参加者Cとのみ対話がしたい場合には、参加者Aは、第1リモート会議クライアント装置11の表示部19に表示される参加者リストから参加者Cを選択して1対1対話モードに入ることで、参加者Cとのみ対話をすることができる。
The
リモート会議クライアント装置11、12、13、14において1対1対話モードが設定されると、リモート会議サーバー装置15は、1対1対話モードに設定されたリモート会議クライアント装置11、12、13、14から伝達される音声を、1対1対話モードに設定されたリモート会議クライアント装置11、12、13、14のみに配信する。このように、リモート会議サーバー装置15が音声を配信することで、特定の参加者A、B、C、Dとのみ対話をすることができる。
When the remote
例えば、1対1対話モードが、第1リモート会議クライアント装置11(第1参加者A)と、第3リモート会議クライアント装置13(第3参加者C)と、の間で設定されている場合、リモート会議サーバー装置15は、第1リモート会議クライアント装置11から伝達される音声を、第3リモート会議クライアント装置13のみに配信するとともに、第3リモート会議クライアント装置13から伝達される音声を、第1リモート会議クライアント装置11のみに配信する。すなわち、1対1モードが設定されていない第2リモート会議クライアント装置12(第2参加者B)及び第4リモート会議クライアント装置14(第4参加者D)には、第1リモート会議クライアント装置11及び第3リモート会議クライアント装置13から伝達される音声は配信されない。
For example, if the one-to-one interaction mode is set between the first remote conference client device 11 (first participant A) and the third remote conference client device 13 (third participant C), The remote
リモート会議システム10における1対1対話モードの設定は、1対1対話モードに設定されたリモート会議クライアント装置のみが解除できる。例えば、1対1対話モードが、第1リモート会議クライアント装置11(第1参加者A)と、第3リモート会議クライアント装置13(第3参加者C)と、の間で設定されている場合、1対1対話モードの設定は、第1リモート会議クライアント装置11と第3リモート会議クライアント装置13とのいずれかのみで解除できる。このように、1対1対話モードに設定されたリモート会議クライアント装置のみが1対1対話モードの設定を解除できることから、1対1対話モードではない他の参加者A、B、C、Dから1対1対話モードの設定を解除されることを防止できる。
The setting of the one-to-one interactive mode in the
座席決定部22は、1対1対話モードが所定のリモート会議クライアント装置11、12、13、14間で設定されると、1対1対話モードのリモート会議クライアント装置11、12、13、14から参加する参加者A、B、C、D同士のリモート会議室30における相対的距離を一時的に近づけるように、リモート会議室30における参加者A、B、C、Dの座席32、33、34、35の位置を決定する。併せて、座席決定部22は、1対1対話モードではないリモート会議クライアント装置11、12、13、14から参加する参加者A、B、C、Dとのリモート会議室30における相対的距離を一時的に遠ざけるように、リモート会議室30における参加者A、B、C、Dの座席32、33、34、35の位置を決定する。
When the one-to-one interactive mode is set between predetermined remote
具体的には、例えば、第1参加者Aの第1リモート会議クライアント装置11と、第3参加者Cの第3リモート会議クライアント装置13との間で1対1対話モードが設定されている場合には、座席決定部22は、図5に示すように、リモート会議室30における第1参加者Aと第3参加者Cとの相対的距離を一時的に近づけるように、第1座席32の位置と、第3座席34の位置とを相対的に近づける。併せて、座席決定部22は、1対1対話モードが設定されていないリモート会議クライアント装置12、14から参加する参加者B、Dとの相対的距離を一時的に遠ざけるように、第2座席33及び第4座席35の位置に対して、第1座席32及び第3座席34の位置を相対的に遠ざける。
Specifically, for example, when the one-to-one dialogue mode is set between the first remote
音声合成部24は、1対1対話モードに設定されているリモート会議クライアント装置11、12、13、14のスピーカー17から出力される参加者A、B、C、Dの音声のうち、1対1対話モードに設定されていないリモート会議クライアント装置11、12、13、14の参加者A、B、C、Dの音声を、1対1対話モードに設定されているリモート会議クライアント装置11、12、13、14の参加者A、B、C、Dの音声より小さい音量でスピーカー17から出力させるように、1対1対話モードに設定されていないリモート会議クライアント装置11、12、13、14の参加者A、B、C、Dの音声データを合成する。すなわち、1対1対話モードに設定されているリモート会議クライアント装置では、1対1対話モードに設定されていないリモート会議クライアント装置の参加者の音声の音量が絞られてスピーカー17から出力される。
The
例えば、第1参加者Aの第1リモート会議クライアント装置11と、第3参加者Cの第3リモート会議クライアント装置13との間で1対1対話モードが設定されている場合には、音声合成部24は、第1リモート会議クライアント装置11及び第3リモート会議クライアント装置13のスピーカー17から出力される参加者A、B、C、Dの音声のうち、1対1対話モードに設定されていないリモート会議クライアント装置12、14の参加者B、Dの音声を、1対1対話モードに設定されているリモート会議クライアント装置11、14の参加者A、Cの音声より小さい音量でスピーカー17から出力させるように、リモート会議クライアント装置12、14の参加者B、Dの音声データを合成する。
For example, when the one-to-one dialogue mode is set between the first remote
このように、音声合成部24がスピーカー17から出力させる参加者A、B、C、Dの音声の音量を制御した音声データを合成することで、1対1対話モードに設定されているリモート会議クライアント装置11、12、13、14の参加者A、B、C、Dの音声と、1対1対話モードに設定されていないリモート会議クライアント装置11、12、13、14の参加者A、B、C、Dの音声と、が混同することなく、1対1対話モードに設定されているリモート会議クライアント装置11、12、13、14のスピーカー17から出力させることができ、より一層参加者A、B、C、Dの音声を聞き取り易くすることができる。
In this way, by synthesizing voice data in which the
なお、本発明の実施形態では、音声合成部24(リモート会議サーバー装置15側)においてスピーカー17から出力させる参加者A、B、C、Dの音声の音量を制御しているが、これに限定されるものではなく、リモート会議クライアント装置11、12、13、14側(例えば、スピーカー17)において参加者A、B、C、Dの音声の音量を制御しても構わない。
In the embodiment of the present invention, the volume of the voices of the participants A, B, C, and D to be output from the
以上のように、本発明の実施形態によると、リモート会議において、個々の参加者A、B、C、Dの音像定位を、リモート会議クライアント装置11、12、13、14(参加者A、B、C、D)毎に分離することから、複数の参加者A、B、C、Dが同時に発言した場合であっても、個々の話者の発言内容を容易に聞き取ることができる。
As described above, according to the embodiment of the present invention, in a remote conference, the sound image localization of individual participants A, B, C, and D is controlled by the remote
また、本発明の実施形態によると、個々の参加者A、B、C、Dの音像定位を過去の発話履歴や特別な1対1対話モードによって調整するため、より一層参加者A、B、C、Dの音声を聞き取り易くすることができる。 In addition, according to the embodiment of the present invention, since the sound image localization of each participant A, B, C, D is adjusted according to the past speech history and a special one-to-one interaction mode, the participants A, B, The voices of C and D can be made easier to hear.
なお、本発明の実施形態では、音場特性決定部23及び音声合成部24をリモート会議サーバー装置15に設けているが、これに限定されるものではなく、リモート会議クライアント装置11、12、13、14に設けても構わない。すなわち、リモート会議サーバー装置15は、各参加者A、B、C、Dの音声を個別の音声トラックとした全参加者分の音声データを、各リモート会議クライアント装置11、12、13、14に対して並列に同報配信する。そして、リモート会議クライアント装置11、12、13、14は、配信された各参加者A、B、C、Dの音声データを音場特性決定部23及び音声合成部24によって調整した後、各参加者A、B、C、Dの音声データをミックスしてステレオ再生を行う。
In the embodiment of the present invention, the sound field
本実施形態では、第1参加者Aと第3参加者Cとの間で1対1対話モードが設定されている場合に、座席決定部22は、リモート会議室30における第1参加者Aと第3参加者Cとを一時的に近づけるように、第1座席32の位置と第3座席34の位置とを近づけているが、これに限定されるものではない。例えば、第1座席32の位置と第3座席34の位置とを近づけることなく、第1参加者Aと第3参加者Cとの間で1対1対話モードを設定しても構わない。すなわち、リモート会議室30における参加者の座席の位置を近づけることなく、1対1対話モードを設定しても構わない。このようにすることで、1対1対話モードを設定している参加者(第1参加者A及び第3参加者C)は、1対1対話モードを設定していない参加者(第2参加者B及び第4参加者D)に対して、1対1対話モードを実行していることを隠すことができる。
In this embodiment, when the one-to-one dialogue mode is set between the first participant A and the third participant C, the
以上、図面を参照しながら本発明の実施形態を説明した。但し、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚み、長さ、個数、間隔等は、図面作成の都合上から実際とは異なる。また、上記の実施形態で示す各構成要素の材質、形状、寸法等は一例であって、特に限定されるものではなく、本発明の構成から実質的に逸脱しない範囲で種々の変更が可能である。 The embodiments of the present invention have been described above with reference to the drawings. However, the present invention is not limited to the above-described embodiments, and can be implemented in various aspects without departing from the gist of the present invention. In order to make the drawings easier to understand, the drawings mainly show each component schematically. is different. In addition, the material, shape, dimensions, etc. of each component shown in the above embodiment are examples and are not particularly limited, and various changes are possible without substantially departing from the configuration of the present invention. be.
本発明は、リモート会議を実行するためのリモート会議システム等に用いるのに好適である。 INDUSTRIAL APPLICABILITY The present invention is suitable for use in remote conference systems and the like for executing remote conferences.
10 リモート会議システム
11 第1リモート会議クライアント装置(リモート会議クライアント装置)
12 第2リモート会議クライアント装置(リモート会議クライアント装置)
13 第3リモート会議クライアント装置(リモート会議クライアント装置)
14 第4リモート会議クライアント装置(リモート会議クライアント装置)
15 リモート会議サーバー装置
22 座席決定部
23 音場特性決定部
24 音声合成部
32 第1座席(座席)
33 第2座席(座席)
34 第3座席(座席)
35 第4座席(座席)
A 第1参加者(参加者)
B 第2参加者(参加者)
C 第3参加者(参加者)
D 第4参加者(参加者)
10
12 second remote conference client device (remote conference client device)
13 third remote conference client device (remote conference client device)
14 fourth remote conference client device (remote conference client device)
15 Remote
33 Second Seat (Seat)
34 Third Seat (Seat)
35 Fourth seat (seat)
A First Participant (Participant)
B Second Participant (Participant)
C Third Participant (Participant)
D Fourth Participant (Participant)
Claims (8)
前記リモート会議に参加する参加者の各々に割り当てられるリモート会議クライアント装置と
を備え、
前記リモート会議サーバー装置は、前記リモート会議を行うリモート会議室における前記参加者の座席を決定する座席決定部を含み、
前記リモート会議サーバー装置又は前記リモート会議クライアント装置は、
前記座席決定部によって決定される各座席相互間での音場特性を決定する音場特性決定部と、
前記参加者に対して出力される音声を合成する音声合成部と
を含み、
前記音場特性決定部は、前記リモート会議クライアント装置の各々で再生する音声の音場特性を決定し、
前記音声合成部は、前記音場特性決定部によって決定された音場特性に基づいて、前記リモート会議クライアント装置の各々で再生する音声を合成する、リモート会議システム。 a remote conference server device that hosts a remote conference;
a remote conference client device assigned to each participant participating in the remote conference;
The remote conference server device includes a seat determination unit that determines the seats of the participants in the remote conference room where the remote conference is held;
The remote conference server device or the remote conference client device,
a sound field characteristic determination unit that determines sound field characteristics between the seats determined by the seat determination unit;
a speech synthesizer that synthesizes speech to be output to the participant,
The sound field characteristic determination unit determines sound field characteristics of audio reproduced by each of the remote conference client devices,
The remote conference system, wherein the voice synthesizing unit synthesizes voices to be reproduced by each of the remote conference client devices based on the sound field characteristics determined by the sound field characteristics determining unit.
前記発話回数記録部は、前記参加者の各々の発話回数に基づいて、前記リモート会議に参加中の前記参加者の各々の発話頻度を算定し、
前記座席決定部は、前記発話回数記録部が算定した複数の前記発話頻度に基づいて、前記発話頻度の高い前記参加者が前記リモート会議室において着席する前記座席の位置を調整する、請求項1に記載のリモート会議システム。 The remote conference server device includes an utterance count recording unit that records the number of utterances of each of the participants,
The utterance frequency recording unit calculates the utterance frequency of each of the participants participating in the remote conference based on the number of utterances of each of the participants;
2. The seat determining unit adjusts the position of the seat where the participant with the high frequency of speaking sits in the remote conference room, based on the plurality of the speaking frequencies calculated by the speaking frequency recording unit. remote conference system described in .
前記リモート会議サーバー装置は、前記1対1対話モードに設定された前記リモート会議クライアント装置から伝達される音声を、前記1対1対話モードに設定された前記リモート会議クライアント装置のみに配信する、請求項1から請求項4のいずれか1項に記載のリモート会議システム。 The remote conference client device has a one-to-one dialogue mode in which a specific participant and another specific participant among the plurality of participants have a one-to-one dialogue,
wherein said remote conference server device distributes audio transmitted from said remote conference client device set in said one-to-one interaction mode only to said remote conference client device set in said one-to-one interaction mode. The remote conference system according to any one of claims 1 to 4.
前記特定の参加者と、前記他の特定の参加者との前記リモート会議室における相対的距離を近づけるように、前記リモート会議室における前記参加者の座席の位置を決定し、
前記特定の参加者と、前記1対1対話モードではない前記リモート会議クライアント装置を割り当てられた前記参加者との前記相対的距離を遠ざけるように、前記リモート会議室における前記参加者の座席の位置を決定する、請求項5又は請求項6に記載のリモート会議システム。 The seat determination unit
determining a seat position of the participant in the remote conference room so as to reduce the relative distance between the specific participant and the other specific participant in the remote conference room;
a seating position of the participant in the remote conference room to distance the relative distance between the particular participant and the participant assigned the remote conference client device not in the one-to-one interaction mode; 7. The remote conference system according to claim 5 or 6, wherein the remote conference system determines
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021151164A JP2023043497A (en) | 2021-09-16 | 2021-09-16 | remote conference system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021151164A JP2023043497A (en) | 2021-09-16 | 2021-09-16 | remote conference system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023043497A true JP2023043497A (en) | 2023-03-29 |
Family
ID=85725458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021151164A Pending JP2023043497A (en) | 2021-09-16 | 2021-09-16 | remote conference system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023043497A (en) |
-
2021
- 2021-09-16 JP JP2021151164A patent/JP2023043497A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11991315B2 (en) | Audio conferencing using a distributed array of smartphones | |
JP2975687B2 (en) | Method for transmitting audio signal and video signal between first and second stations, station, video conference system, method for transmitting audio signal between first and second stations | |
US10805575B2 (en) | Controlling focus of audio signals on speaker during videoconference | |
US9049339B2 (en) | Method for operating a conference system and device for a conference system | |
US20050213747A1 (en) | Hybrid monaural and multichannel audio for conferencing | |
US9025002B2 (en) | Method and apparatus for playing audio of attendant at remote end and remote video conference system | |
JP7354225B2 (en) | Audio device, audio distribution system and method of operation thereof | |
US11521636B1 (en) | Method and apparatus for using a test audio pattern to generate an audio signal transform for use in performing acoustic echo cancellation | |
CN102119531A (en) | Audio/video system | |
JP2006254064A (en) | Remote conference system, sound image position allocating method, and sound quality setting method | |
CN102209225B (en) | Method and device for realizing video communication | |
WO2018198790A1 (en) | Communication device, communication method, program, and telepresence system | |
WO2022054900A1 (en) | Information processing device, information processing terminal, information processing method, and program | |
JP2023043497A (en) | remote conference system | |
JP2006339869A (en) | Apparatus for integrating video signal and voice signal | |
JP2001339799A (en) | Virtual meeting apparatus | |
US11589159B2 (en) | Networked audio auralization and feedback cancellation system and method | |
JPH03252258A (en) | Directivity reproducing device | |
US11019216B1 (en) | System and method for acoustically defined remote audience positions | |
WO2017211447A1 (en) | Method for reproducing sound signals at a first location for a first participant within a conference with at least two further participants at at least one further location | |
WO2023286320A1 (en) | Information processing device and method, and program | |
WO2017211448A1 (en) | Method for generating a two-channel signal from a single-channel signal of a sound source | |
JP7191146B2 (en) | Distribution server, distribution method, and program | |
JP4849494B2 (en) | Teleconference system, sound image location assignment method, and sound quality setting method | |
KR20060081966A (en) | Sound image location system in teleconference system |