JP2019117997A - Web conference system, control method of web conference system, and program - Google Patents
Web conference system, control method of web conference system, and program Download PDFInfo
- Publication number
- JP2019117997A JP2019117997A JP2017250436A JP2017250436A JP2019117997A JP 2019117997 A JP2019117997 A JP 2019117997A JP 2017250436 A JP2017250436 A JP 2017250436A JP 2017250436 A JP2017250436 A JP 2017250436A JP 2019117997 A JP2019117997 A JP 2019117997A
- Authority
- JP
- Japan
- Prior art keywords
- client terminal
- web conference
- web
- lip
- conference system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、複数の拠点に接続されるクライアント端末を用いたウェブ会議システム、ウェブ会議システムの制御方法、およびプログラムに関する。 The present invention relates to a web conference system using a client terminal connected to a plurality of bases, a control method of the web conference system, and a program.
従来から、ネットワークを介して接続された複数の端末を利用して、仮想的な会議を行うウェブ会議システムが知られている。ウェブ会議システムにおける会議参加者は、異なる拠点に配置された端末に接続し、自由に発言を行うことが可能となっている。一方で、会議に参加する拠点が多い場合には、発言中の拠点が不明になる場合があった。 2. Description of the Related Art Conventionally, there is known a web conference system that performs virtual conferences using a plurality of terminals connected via a network. Conference participants in the web conference system can connect to terminals located at different bases and can freely speak. On the other hand, when there are a large number of bases participating in the conference, there may be cases where the speaking base is unknown.
特許文献1では、口唇部分の動きを捕捉して発話の前駆動作を検出することにより、発言を開始しようとする参加者を特定するテレビ会議システムが開示されている。 Patent Document 1 discloses a video conference system that identifies a participant who is about to start speaking by capturing a movement of a lip portion and detecting a speech precursor action.
ところで、音が聞き取りつらい難聴者等がウェブ会議システムに参加する場合には、異なる拠点の発言者の唇の動きを見てその内容を理解する。この場合、難聴者等は、発言者の唇が画面に対して小さく表示される場合や、画面に映らない場合には意思疎通が困難となる。しかしながら、特許文献1に記載の技術では、発言の開始を検出できるものの、発言中の動作の検出方法については何ら検討されていなかった。 By the way, when a person who is hard to hear the noise participates in the web conference system, he / she sees the movement of the lips of the speakers at different bases and understands the contents. In this case, it is difficult for the deaf person or the like to communicate when the lips of the speaker are displayed smaller than the screen or when they are not displayed on the screen. However, although the technique described in Patent Document 1 can detect the start of speech, no method has been considered for detecting a motion during speech.
そこで、本発明は、上記の課題に鑑みてなされたものであり、発言中の参加者の口唇部分の視認性を向上させることが可能なウェブ会議システムを提供することを目的とする。 Then, this invention is made in view of said subject, and an object of this invention is to provide the web meeting system which can improve the visibility of the lip part of the participant in speech.
上記の目的を達成するために、本発明は、複数の拠点に接続されたクライアント端末で撮影される撮影画像を複数表示することが可能なウェブ会議システムであって、発言中の人物が存在するクライアント端末を特定する特定手段と、前記特定手段により特定されたクライアント端末で撮影された撮影画像から発言中の人物の口唇部分を検出する検出手段と、前記検出手段により発言中の人物の口唇部分が検出されてない場合に、前記特定手段により特定されたクライアント端末に対して該検出がされていないことを示す表示をする表示制御手段と、を有することを特徴とする。 In order to achieve the above object, the present invention is a web conference system capable of displaying a plurality of photographed images photographed by client terminals connected to a plurality of bases, and a person speaking is present Specification means for specifying a client terminal, detection means for detecting a lip portion of a person speaking from a photographed image captured by the client terminal specified by the specifying means, Lip portion of a person speaking by the detection means And a display control means for displaying an indication that the detection has not been made to the client terminal specified by the specifying means, when the above is not detected.
本発明によれば、発言中の参加者の口唇部分の視認性を向上させることが可能なウェブ会議システムを提供することができる。 According to the present invention, it is possible to provide a web conference system capable of improving the visibility of the lip portion of a participant who is speaking.
以下、図面を参照して、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本実施形態に係わるウェブ会議システムのシステム構成図の一例を示す図である。 FIG. 1 is a diagram showing an example of a system configuration diagram of a web conference system according to the present embodiment.
本発明のウェブ会議システムは、例えば、パーソナルコンピュータを適用可能なクライアント端末100(300、310)の間でウェブ会議システムを利用可能にするウェブ会議サーバ(サーバ装置)200がネットワーク110を介して接続されている。ウェブ会議システムは、Web会議システム・テレビ会議システムとも呼ぶ。クライアント端末100(300、310)は、ウェブ会議サーバ(サーバ装置)200のクライアント端末として機能する。ウェブ会議システムは、複数の拠点に接続された各クライアント端末で撮影される画像(静止画あるいは動画)を複数の各クライアント端末に表示することができる。また、ウェブ会議システムは、複数の拠点に接続された各クライアント端末で発した音声を複数の各クライアント端末に出力することができる。なお、クライアント端末100は、PC等に代表される情報処理装置の一態様である。
In the web conference system of the present invention, for example, a web conference server (server apparatus) 200 that makes a web conference system available between client terminals 100 (300, 310) applicable to personal computers is connected via the
各装置は、ネットワーク110に有線ネットワークで接続するようにしてもよいし、無線ネットワークや無線通信により接続するようにしてもよい。
Each device may be connected to the
ウェブ会議サーバ200は、ウェブブラウザを利用したウェブ会議を実現するためのサーバである。クライアント端末100は、はウェブ会議サーバ200へアクセスすることにより、ウェブ会議画面(インタフェース)を取得してウェブ会議を行うことができる。ウェブ会議サーバ200は、CPU等の制御回路、RAM、ROM等の記憶領域を備える。また、ウェブ会議サーバ200は、各クライアント端末100と通信するための通信回路を備える。
The web conference server 200 is a server for realizing a web conference using a web browser. The
本実施形態では、クライアント端末100や300のようにタブレットPCを例にして説明するが、情報処理装置310のようなノートPCや不図示のデスクトップPCなどを利用することもできる。情報処理装置は、ウェブ会議サーバから配信されるコンテンツの画像を所定の表示領域に表示可能となっている。
In this embodiment, a tablet PC is described as an example of the
配信されるコンテンツ(映像、音声、音量など)は、カメラ101やマイク102によって取得された画像や音声であって、所定の間隔で情報処理装置からウェブ会議サーバへ送信される。これらの情報を蓄積したウェブ会議サーバ200が、接続された情報処理装置に配信するようになっている。 Content to be distributed (video, audio, volume, etc.) is an image or audio acquired by the camera 101 or the microphone 102, and is transmitted from the information processing apparatus to the web conference server at predetermined intervals. The web conference server 200 storing these pieces of information is distributed to the connected information processing apparatus.
これらクライアント端末100には、ウェブ会議サーバ200へアクセスするためのウェブブラウザ、及び専用のモジュールがインストールされている。なお、この専用のモジュールは、例えば、ウェブブラウザを介して、ウェブ会議サーバ200からダウンロードするActiveXコンポーネントである。
In these
なお、ウェブ会議において自身の動画像を送信する場合は、ビデオデバイスであるウェブカメラなどのカメラ101を接続する。音声を送信する場合は、マイク102を接続し、相手の音声を視聴するためにはスピーカー103を接続する。マイク102およびスピーカー103はオーディオデバイスである。例えば、本実施例ではマイク102によって集音された音声の変化を利用して注目すべき拠点を決定することが可能である。 In addition, when transmitting a moving image of oneself in a web conference, the camera 101 such as a web camera which is a video device is connected. In the case of transmitting voice, the microphone 102 is connected, and in order to view the voice of the other party, the speaker 103 is connected. The microphone 102 and the speaker 103 are audio devices. For example, in the present embodiment, it is possible to determine a base to which attention should be paid by using a change in sound collected by the microphone 102.
また、各デバイスは同じ筐体のハードに備えられるものもあり、例えばカメラ機能とマイク機能や、マイク機能とスピーカー機能、および全ての機能を備えたデバイスも存在する。 In addition, some devices are provided in the same housing hardware, and for example, there are devices provided with a camera function and a microphone function, a microphone function and a speaker function, and all functions.
また、ウェブ会議システムは、クライアント端末100の画面を他の情報処理装置(300や310)の画面に表示する、画面共有を行うことができる。共有される画面は、クライアント端末100で指定することが可能で、指定するアプリケーションの画面であったり、デスクトップ全体であったりする。
In addition, the web conference system can perform screen sharing in which the screen of the
本ウェブ会議システムは、ルームと呼ばれるウェブ上の仮想会議室を複数設定することが可能で、ルームを複数設定することにより複数の会議を行うことが可能である。 The present web conference system can set a plurality of virtual conference rooms on the web called a room, and can set a plurality of rooms to perform a plurality of conferences.
図2は、本発明の実施形態に係わる情報処理装置のハードウェア構成の一例を示すブロック図である。 FIG. 2 is a block diagram showing an example of the hardware configuration of the information processing apparatus according to the embodiment of the present invention.
図2に示すように、クライアント端末100では、システムバス215を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声入出力コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。
As shown in FIG. 2, in the
CPU201は、システムバス215に接続される各デバイスやコントローラを統括的に制御する。
The
ROM202あるいは記憶装置204は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
The
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは記憶装置204からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
The
入力コントローラ205は、キーボード/タッチパネル/カメラなどの入力装置210からの入力を制御する。入力装置はこれに限ったものでなく、マウスやマルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
The
音声入出力コントローラ206は、マイク/スピーカー等の音声入出力装置211からの入出力を制御する。マイクから入力された音声を音声認識することが可能となっている。スピーカーにはイヤホンを接続することも可能である。
The audio input / output controller 206 controls input / output from an audio input /
ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作により受け付け可能な装置については、キーボード/タッチパネルからの入力を受け付けることも可能となる。
The
なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
The
本発明では、ユーザが情報処理装置を通常する場合の表示に用いられる第1のビデオメモリ領域と、所定の画面が表示される場合に、第1のビデオメモリ領域の表示内容に重ねての表示に用いられる第2のビデオメモリ領域を有している。ビデオメモリ領域は2つに限ったものではなく、情報処理装置の資源が許す限り複数有することが可能なものとする。 In the present invention, the first video memory area used for display when the user normally operates the information processing apparatus and the display content superimposed on the display content of the first video memory area when the predetermined screen is displayed And a second video memory area used for The video memory area is not limited to two, and can be plural as long as the resource of the information processing apparatus permits.
メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
The
通信I/Fコントローラ209、ネットワーク214を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。
The communication I /
なお、記憶装置204は情報を永続的に記憶するための媒体であって、その形態をハードディスク等の記憶装置に限定するものではない。例えば、SSD(Solid State Drive)などの媒体であってもよい。
The
また本実施形態における通信端末で行われる各種処理時の一時的なメモリエリアとしても利用可能である。 Moreover, it can also be used as a temporary memory area at the time of various processes performed by the communication terminal in the present embodiment.
図3は、本実施形態に係るウェブ会議システムにおける機能構成の一例を示す機能構成図である。なお、各機能は、ウェブ会議サーバ200に含まれるCPU等により実行される機能である。 FIG. 3 is a functional configuration diagram showing an example of a functional configuration in the web conference system according to the present embodiment. Each function is a function executed by a CPU or the like included in the web conference server 200.
ウェブ会議システムのウェブ会議サーバ200は、発言者特定部311、撮影画像取得部312、口唇部分検出部313、表示制御部314、会議モード設定部315、記憶部316を有する。
The web conference server 200 of the web conference system includes a
発言者特定部311は、発言中の人物が存在するクライアント端末を特定する。具体的には、発言者特定部311は、会議に参加するクライアント端末から音声を取得した場合に、発言中の人物が存在するクライアント端末であると特定できる。例えば、発言者特定部311は、クライアント端末を利用する人物が音を発したことを検出した場合に、該クライアント端末を発言中の人物が存在するクライアント端末であると特定できる。発言者特定部311によるクライアント端末の特定方法は、これらに限定されない。例えば、発言者特定部311は、撮影画像に映る人物の動作から特定してもよい。また、発言者特定部311は、クライアント端末から発言に先立って、発言中であることを示す音声以外の信号を受信し、当該情報により特定してもよい。
The
撮影画像取得部312は、ウェブ会議に参加するクライアント端末で撮影された撮影画像を取得する。撮影画像取得部312は、連続して撮影された撮影画像である動画を取得する。
The captured
口唇部分検出部313は、発言者特定部311により特定されたクライアント端末で撮影された撮影画像から発言中の人物の口唇部分を検出する。ウェブ会議サーバ200は、ウェブ会議の際には、撮影画像取得部312により動画を常時取得する。ここで、口唇部分検出部313は、発言を開始した人物が存在すると特定されたクライアント端末から取得した動画の各フレームの撮影画像から人物の顔部分を検出する。そして、口唇部分検出部313は、顔部分を検出した撮影画像から口唇部分を検出する。ここで、口唇部分とは、唇とその周辺部分を含み、人物が発言する際に動く部分を示す。口唇部分は、口の動きを見て、発言を読み取れる程度の範囲が含まれていることが好ましい。また、口唇部分には、顔の鼻から顎の範囲で、且つ頬と頬の間が映っていることが好ましい。口唇部分検出部313は、公知の画像処理技術やパターン認識処理等により口唇部分を特定する。
The lip
表示制御部314は、各クライアント端末から取得した撮影画像を会議に参加するクライアント端末に表示する。表示制御部314は、口唇部分検出部313により発言中の人物の口唇部分が検出されてない場合に、発言者特定部311で特定したクライアント端末に対して、警告表示をする。ここで、警告表示は、口唇部分検出部313により口唇部分が検出がされていないことを示す表示であればよい。表示制御部314は、当該表示を行うことにより、発言者に対して注意喚起をすることができる。なお、表示制御部314は、口唇部分検出部313により発言中の人物の口唇部分が検出されている場合には、当該警告表示は行わない。また、表示制御部314は、口唇部分検出部313により発言中の人物の口唇部分が検出されている場合に、クライアント端末に表示される発言者の口唇部分を拡大した画像(拡大画像)を他のクライアント端末に表示する。さらに、表示制御部314は、後述する会議モード設定部315により口唇優先モードが設定されたクライアント端末に対してのみ拡大画像を表示してもよい。なお、表示制御部314は、この場合、口唇優先モードが設定されていないクライアント端末に対しては拡大画像ではなく、通常の撮影画像を表示するように制御してもよい。
The
会議モード設定部315は、各クライアント端末の会議モードを設定する。各会議の参加者は、予めクライアント端末上の参加画面(図6の会議予約画面600)から会議モードを選択することができる。会議モード設定部315は、取得した設定情報を、データベース(図5の会議モードデータベース500)として、ウェブ会議サーバの記憶部316に記憶する。ここで、会議モードとは、会議中の各クライアント端末への表示モードを示す。口唇優先モードは、口唇部分の動きを基に他の参加者の発言内容を判断するユーザのために設けられたものである。口唇優先モードにより難聴者もリアルタイムに会議に参加することができる。通常モードは、上述した口唇部分の検出処理や拡大画像の表示処理を行わないモードである。
The conference
記憶部316は、図5で示す各データベースを記憶し、これらを管理する機能部である。
The
なお、本実施形態では、本機能構成図に示す機能をウェブ会議サーバが有するように説明しているが、一部の機能を各クライアント端末で実行してもよいし、複数のサーバで協業して機能させてもよい。 In the present embodiment, the web conference server is described as having the functions shown in this functional configuration diagram, but some functions may be executed by each client terminal, or a plurality of servers may cooperate. You may make it function.
ここで、図5を用いて、本実施形態に係るウェブ会議システムにおけるデータベースの一例を説明する。 Here, an example of a database in the web conference system according to the present embodiment will be described with reference to FIG.
会議モードデータベース500は、ルームID501と、ユーザID502と、会議モード503とが対応づけられた情報である。ルームID501は、ウェブ会議システムで開催される会議を識別するための情報である。ユーザID502は、ウェブ会議システムの参加者を識別するための情報である。会議モード503は、ユーザが設定した会議モードを識別するための情報である。図5を例に説明すると、ルームID501が「100000」であり、ユーザID502が「100000」と「100001」の各ユーザは同じウェブ会議に参加することを示す。また、ユーザID502が「100000」のユーザは、「口唇優先モード」で、当該会議に参加し、ユーザID502が「100001」のユーザは、「通常モード」で、当該会議に参加することを示す。
The
会議管理データベース510は、ルームID511と、会議の名称であるルーム名512と、その利用時間である利用時間513とが対応づけられた情報である。
The
ユーザ管理データベース520は、ユーザID521と、ユーザの名前を示すユーザ名522と、ユーザが属するグループ名523とが対応づけられた情報である。
The
次に、図4を用いて本実施形態のウェブ会議システムにおける制御処理を説明する。図4は、本発明の実施形態に係るウェブ会議システムにおける制御処理の一例を示すフローチャートである。 Next, control processing in the web conference system of the present embodiment will be described using FIG. FIG. 4 is a flowchart showing an example of control processing in the web conference system according to the embodiment of the present invention.
S401において、ウェブ会議サーバ200は、会議の参加者情報を受信する。ここで、参加者とは、具体的には、各ユーザが操作するクライアント端末100を示す。参加者情報とは、ユーザ管理データベース520に登録されるユーザの参加要求である。さらに、参加者情報とは、口唇優先モードと通常モードのいずれの会議モードで参加するかを示す情報である。当該参加者情報を受信するために、ウェブ会議サーバ200は、クライアント端末に表示される会議予約画面600(図6)からユーザにより入力された情報を受信する。ここで、図6を用いて会議予約画面600について説明する。会議予約画面600は、ウェブ会議サーバ200により各クライアント端末に表示される画面である。会議予約画面600は、参加ボタン(601、602)と、口唇優先モード選択アイコン(603、604)を含んで表示する。参加ボタン(601、602)は、会議単位で設定されるボタンであり、選択を受け付けた場合に、クライアント端末はウェブ会議サーバに参加を要求する。口唇優先モード選択アイコン(603、604)は、口唇優先モードで参加するか否かを選択するアイコンである。口唇優先モード選択アイコン603は、口唇優先モードで参加が選択されている場合であり、口唇優先モード選択アイコン604は、口唇優先モードで参加せず通常モードで参加する場合を示す。
In S401, the web conference server 200 receives conference participant information. Here, the participant specifically indicates the
S402において、ウェブ会議サーバ200は、各参加者の会議モードを記憶する。具体的には、ウェブ会議サーバ200は、各参加者が口唇優先モードであるか通常モードであるかを、会議モードデータベース500に記憶する。
In S402, the web conference server 200 stores the conference mode of each participant. Specifically, the web conference server 200 stores in the
S403において、ウェブ会議サーバ200は、会議画面を参加者のクライアント端末に送信する。ここで、図6の会議画面610を用いて会議が行われる際の画面について説明する。図6の会議画面610は、ウェブ会議室(仮想会議室)として設定された会議室に入室したクライアント端末100に表示される画面である。本実施形態では、自分の他に4拠点(User001〜004)で計5ユーザがウェブ会議に参加している。会議画面610は、自身の撮影画像を更に表示することもできる。なお、ウェブ会議サーバ200は、画像表示領域613に、各クライアント端末のカメラで撮影した撮影画像を表示する。図6における会議画面610の画面レイアウトは、画像表示領域613を4つ配置したレイアウトである。参加者名表示部612には、画像表示領域613に表示する画像の送信元の名称を表示する。例えば、当該画像の送信元のクライアント端末100でウェブ会議サーバ200にログインしているユーザのユーザ名を表示する。ボタン表示領域611には、指定画像の共有を開始するための「資料共有」ボタンや、会議から退出する(会議室から退室する)ための「退出」ボタン614等を表示する。
In S403, the web conference server 200 transmits the conference screen to the client terminal of the participant. Here, a screen when a conference is performed will be described using the conference screen 610 of FIG. The conference screen 610 in FIG. 6 is a screen displayed on the
S404において、ウェブ会議サーバ200は、各クライアント端末から撮影画像および音声を受信する。 In S404, the web conference server 200 receives the photographed image and the sound from each client terminal.
S405において、ウェブ会議サーバ200は、口唇優先モードの参加者が存在するか否かを判定する。ウェブ会議サーバ200は、口唇優先モードの参加者がいない場合には、S406の処理を実行する。一方で、ウェブ会議サーバ200は、口唇優先モードの参加者がいる場合には、S407の処理を実行する。 In S405, the web conference server 200 determines whether there is a participant in the lip priority mode. When there is no participant in the lip priority mode, the web conference server 200 executes the processing of S406. On the other hand, when there is a participant in the lip priority mode, the web conference server 200 executes the process of S407.
S406において、ウェブ会議サーバ200は、S404で受信した各撮影画像および音声を、参加者のクライアント端末に送信する。ウェブ会議サーバ200は、会議が継続している間は、当該処理を繰り返す。 In step S406, the web conference server 200 transmits each captured image and sound received in step S404 to the client terminal of the participant. The web conference server 200 repeats the process while the conference continues.
S407において、ウェブ会議サーバ200は、発言者が存在するクライアント端末を特定する。 In step S407, the web conference server 200 identifies a client terminal in which the speaker is present.
S408において、ウェブ会議サーバ200は、S407で特定したクライアント端末から送信される撮影画像から発言中の人物の口唇部分を検出する。ウェブ会議サーバ200は、口唇部分が検出できなかった場合には、S409の処理を実行する。一方で、ウェブ会議サーバ200は、口唇部分が検出できた場合には、S411の処理を実行する。 In S408, the web conference server 200 detects the lip portion of the person speaking from the photographed image transmitted from the client terminal specified in S407. If the web conference server 200 can not detect the lip portion, the web conference server 200 executes the processing of S409. On the other hand, the web conference server 200 executes the processing of S411 when the lip portion can be detected.
S409において、ウェブ会議サーバ200は、発言者のクライアント端末に警告表示を送信する。ここで、図7の警告表示画面700を用いて警告表示について説明する。警告表示とは、S407で特定したクライアント端末に対して口唇部分が検出されていないことを示す通知の一態様である。図7の警告表示画面700は、会議画面610に対し、警告表示が重畳して表示された画面である。警告表示画面700は、少なくとも警告表示701を含んで表示される。警告表示701は、クライアント端末100に対して、自身の動画では口元が映っていない旨を認識させることができる。このため、警告表示701は、当該クライアント端末のユーザに対して自身の位置やクライアント端末100の位置の調整を促すことが可能である。
In S409, the web conference server 200 transmits a warning display to the client terminal of the speaker. Here, warning display will be described using the warning display screen 700 of FIG. 7. The warning display is an aspect of a notification indicating that the lip portion is not detected for the client terminal identified in S407. The warning display screen 700 of FIG. 7 is a screen displayed with a warning display superimposed on the conference screen 610. The warning display screen 700 is displayed including at least the
S410において、ウェブ会議サーバ200は、口唇部分が検出されたか否かを再度判定する。つまり、ウェブ会議サーバ200は、口唇部分が検出されるまで、S409の処理を繰り返す。一方で、ウェブ会議サーバ200は、口唇部分が検出された場合にS411の処理を実行する。 In S410, the web conference server 200 determines again whether the lip portion is detected. That is, the web conference server 200 repeats the process of S409 until the lip portion is detected. On the other hand, the web conference server 200 executes the processing of S411 when the lip portion is detected.
S411において、ウェブ会議サーバ200は、クライアント端末に口唇部分を拡大した拡大画像を送信する。ここで、図7の拡大表示画面710を用いて拡大画像について説明する。拡大表示画面710は、図6の会議画面610に、拡大画像711が表示されたものである。ここで、User001は、S407において、特定された参加者の撮影画像である。ウェブ会議サーバ200は、口唇優先モードのクライアント端末にのみ拡大画像を送信する。ウェブ会議サーバ200は、当該拡大画像とともに音声を送信する。なお、ウェブ会議サーバ200は、口唇優先モードを設定しているクライアント端末には音声を送信しないように制御してもいい。口唇優先モードを設定しているクライアント端末は、音声でなく、口唇部分の動きを見て発言内容を判断している可能性が高いためである。 In step S411, the web conference server 200 transmits an enlarged image in which the lip portion is enlarged to the client terminal. Here, a magnified image will be described using the magnified display screen 710 of FIG. 7. The enlarged display screen 710 is one in which the enlarged image 711 is displayed on the conference screen 610 of FIG. Here, User 001 is a photographed image of the participant identified in S407. The web conference server 200 transmits the enlarged image only to the client terminal in the lip priority mode. The web conference server 200 transmits the sound together with the enlarged image. The web conference server 200 may control so as not to transmit the voice to the client terminal for which the lip priority mode is set. This is because there is a high possibility that the client terminal in which the lip priority mode is set is not speech but judging movement of the lip portion to determine the content of the speech.
S412において、ウェブ会議サーバ200は、会議に参加する他のクライアント端末に、受信した撮影画像と音声を送信する。ウェブ会議サーバ200は、図7の拡大表示画面710と音声とをクライアント端末100に送信する。
In step S412, the web conference server 200 transmits the received captured image and sound to other client terminals participating in the conference. The web conference server 200 transmits the enlarged display screen 710 of FIG. 7 and the voice to the
本実施形態においては、ウェブ会議システムで利用される仮想会議室のことをウェブ会議室、仮想会議室、または単に会議室として説明しているが同じものである。 In the present embodiment, although the virtual meeting room used in the web meeting system is described as a web meeting room, a virtual meeting room, or simply a meeting room, it is the same.
以上、上述の実施形態によれば、ウェブ会議システムは、複数の拠点に接続されたクライアント端末で撮影される撮影画像を複数表示することが可能である。本実施形態のウェブ会議システムは、発言中の人物が存在するクライアント端末を特定し、当該特定されたクライアント端末で撮影された撮影画像から発言中の人物の口唇部分を検出する。そして、ウェブ会議システムは、発言中の人物の口唇部分が検出されてない場合に、特定されたクライアント端末に対して該検出がされていないことを示す表示を行う。このことにより、発言中の参加者の口唇部分の視認性を向上させることが可能となる。言い換えると、ウェブ会議システムは、当該表示を行うことにより発言者に対して口唇部分が映った情報で発言するように促すことができる。その結果、発言中の参加者は自身の口唇部分が映るように発言を行うこととなる。そして、ウェブ会議システムは、会議の参加者に難聴の人物がいた場合にも、口唇部分が映った動画を提供することができる。 As described above, according to the above-described embodiment, the web conference system can display a plurality of captured images captured by client terminals connected to a plurality of bases. The web conference system of the present embodiment identifies a client terminal in which a person speaking is present, and detects a lip portion of the person speaking from the photographed image captured by the identified client terminal. Then, when the lip part of the person speaking is not detected, the web conference system displays a message indicating that the detection is not performed on the specified client terminal. This makes it possible to improve the visibility of the lip of the participant who is speaking. In other words, the web conference system can prompt the speaker to speak the information in which the lip portion is reflected by performing the display. As a result, the participant who is speaking will speak in such a way as to reflect his / her lip. Then, the web conference system can provide a moving image in which the lip is reflected, even when the participants in the conference have a person with hearing loss.
さらに、上述の実施形態によれば、ウェブ会議システムは、発言中の人物の口唇部分が検出されてる場合に、発言者の口唇部分を拡大した拡大画像を表示する。このことにより、ウェブ会議システムは、更に、言中の参加者の口唇部分の視認性を向上させることが可能となる。 Further, according to the above-described embodiment, the web conference system displays an enlarged image in which the lip portion of the speaker is enlarged, when the lip portion of the person speaking is detected. This enables the web conferencing system to further improve the visibility of the lips of the participant in question.
さらに、上述の実施形態によれば、ウェブ会議システムは、口唇優先モードと通常モードの会議モードのいずれかを設定可能である。そして、ウェブ会議システムは、会議の参加者に口唇優先モードを設定しているクライアント端末がいる場合に、拡大画像を表示する。このことにより、ウェブ会議システムは、会議モードに応じて適切な表示制御が可能となる。これは、ウェブ会議システムは、口唇優先モードを設定しているユーザがいない場合にまで、警告表示や拡大画像を表示すると迅速な会議の進行を妨げるおそれがあるためである。そのため、ウェブ会議システムは、口唇優先モードを設定しているユーザがいる場合に拡大画像を表示することとしている。 Furthermore, according to the above-described embodiment, the web conferencing system can set either the lip priority mode or the conference mode in the normal mode. Then, the web conference system displays an enlarged image when there is a client terminal in which the lip priority mode is set to the participants of the conference. This enables the web conferencing system to perform appropriate display control in accordance with the conference mode. This is because the web conference system may prevent the progress of a prompt conference if a warning display or a magnified image is displayed even when there is no user who has set the lip priority mode. Therefore, the web conference system displays the enlarged image when there is a user who has set the lip priority mode.
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。 As described above, the recording medium recording the program for realizing the functions of the above-described embodiments is supplied to the system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the program stored in the recording medium. It goes without saying that the object of the present invention can be achieved also by reading and executing.
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。 In this case, the program itself read out from the recording medium realizes the novel function of the present invention, and the recording medium storing the program constitutes the present invention.
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,DVD−ROM,磁気テープ,不揮発性のメモリカード,ROM,EEPROM,シリコンディスク等を用いることができる。 As a recording medium for supplying the program, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, DVD-ROM, magnetic tape, non-volatile memory card, ROM, EEPROM, silicon A disk etc. can be used.
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, by executing the program read by the computer, not only the functions of the above-described embodiment are realized, but also an operating system (OS) or the like running on the computer is actually executed based on the instructions of the program. It goes without saying that the processing is partially or entirely performed, and the processing realizes the functions of the above-described embodiments.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, after the program read from the recording medium is written to the memory provided to the function expansion board inserted into the computer or the function expansion unit connected to the computer, the function expansion board is read based on the instruction of the program code. It goes without saying that the case where the CPU or the like provided in the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiment are realized by the processing.
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 Further, the present invention may be applied to a system constituted by a plurality of devices or to an apparatus comprising a single device. It goes without saying that the present invention can also be applied to the case where it is achieved by supplying a program to a system or apparatus. In this case, by reading a recording medium storing a program for achieving the present invention into the system or apparatus, the system or apparatus can receive the effects of the present invention.
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ,データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 Furthermore, by downloading and reading a program for achieving the present invention from a server on a network, a database or the like by a communication program, the system or apparatus can receive the effects of the present invention.
100 情報処理装置
101 カメラ
200 ウェブ会議サーバ
311 発言者特定部
312 撮影画像取得部
313 口唇部分検出部
314 表示制御部
100 information processing apparatus 101 camera 200
Claims (7)
発言中の人物が存在するクライアント端末を特定する特定手段と、
前記特定手段により特定されたクライアント端末で撮影された撮影画像から発言中の人物の口唇部分を検出する検出手段と、
前記検出手段により発言中の人物の口唇部分が検出されてない場合に、前記特定手段により特定されたクライアント端末に対して該検出がされていないことを示す表示をする表示制御手段と、
を有することを特徴とするウェブ会議システム。 A web conference system capable of displaying a plurality of captured images captured by client terminals connected to a plurality of bases,
Specifying means for specifying a client terminal in which a person speaking is present;
Detection means for detecting a lip portion of a person speaking from the photographed image photographed by the client terminal specified by the specifying means;
Display control means for displaying a message indicating that the detection has not been made to the client terminal specified by the specifying means when the lip part of the person speaking is not detected by the detection means;
Web conferencing system characterized by having.
前記表示制御手段は、会議の参加者に前記口唇優先モードを設定しているクライアント端末がいる場合に、前記拡大画像を表示することを特徴とする請求項2に記載のウェブ会議システム。 And conference mode setting means for setting one of the conference mode of the lip priority mode and the normal mode;
3. The web conference system according to claim 2, wherein the display control means displays the enlarged image when there is a client terminal in which the lip priority mode is set to the participant of the conference.
発言中の人物が存在するクライアント端末を特定する特定工程と、
前記特定工程により特定されたクライアント端末で撮影された撮影画像から発言中の人物の口唇部分を検出する検出工程と、
前記検出工程により発言中の人物の口唇部分が検出されてない場合に、前記特定工程により特定されたクライアント端末に対して該検出がされていないことを示す表示をする表示制御工程と、
を有することを特徴とするウェブ会議システムの制御方法。 A control method of a web conference system capable of displaying a plurality of photographed images photographed by a client terminal connected to a plurality of bases.
A specifying step of specifying a client terminal in which a person who is speaking is present;
A detection step of detecting a lip portion of a person speaking from the photographed image photographed by the client terminal specified in the specifying step;
A display control step of displaying a message indicating that the detection has not been made to the client terminal specified in the specifying step, when the lip part of the person speaking is not detected in the detecting step;
A control method of a web conference system characterized by having.
The program for making a computer perform the control method of the web meeting system of Claim 6.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017250436A JP2019117997A (en) | 2017-12-27 | 2017-12-27 | Web conference system, control method of web conference system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017250436A JP2019117997A (en) | 2017-12-27 | 2017-12-27 | Web conference system, control method of web conference system, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019117997A true JP2019117997A (en) | 2019-07-18 |
Family
ID=67304647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017250436A Pending JP2019117997A (en) | 2017-12-27 | 2017-12-27 | Web conference system, control method of web conference system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019117997A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6886750B1 (en) * | 2020-10-29 | 2021-06-16 | 株式会社パルケ | Online meeting support device, online meeting support program, and online meeting support system |
JP7043110B1 (en) * | 2020-10-29 | 2022-03-29 | 株式会社パルケ | Online conferencing support equipment, online conferencing support programs, and online conferencing support systems |
-
2017
- 2017-12-27 JP JP2017250436A patent/JP2019117997A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6886750B1 (en) * | 2020-10-29 | 2021-06-16 | 株式会社パルケ | Online meeting support device, online meeting support program, and online meeting support system |
JP7043110B1 (en) * | 2020-10-29 | 2022-03-29 | 株式会社パルケ | Online conferencing support equipment, online conferencing support programs, and online conferencing support systems |
WO2022091298A1 (en) * | 2020-10-29 | 2022-05-05 | 株式会社パルケ | Online conference assistance device, online conference assistance program, and online conference assistance system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110769189B (en) | Video conference switching method and device and readable storage medium | |
US20070283040A1 (en) | Electronic device, network connecting system, network connecting method, and program product therefor | |
EP4192005A1 (en) | Conversation control device, conversation system, and conversation control method | |
JP2022125064A (en) | Information process system, control method of the same, and program | |
JP2019117998A (en) | Web conference system, control method of web conference system, and program | |
JP2017111643A (en) | Web conference system, information processing method, and program | |
JP2019117997A (en) | Web conference system, control method of web conference system, and program | |
JP5999126B2 (en) | Information processing apparatus, information processing method, and program | |
JP2017112601A (en) | Information processing apparatus, information processing method, and program | |
JP7206481B2 (en) | Information processing device, control method and program for information processing device | |
JP2018036688A (en) | Information processing device, server device, information processing system, control method thereof, and program | |
JP2016163111A (en) | Information processing device, information processing method, and program | |
JP6493443B2 (en) | Image display system, image display system control method, information processing apparatus, information processing apparatus control method, and program | |
JP2020194343A (en) | Information processing system, information processing device, control method of information processing system, and program | |
JP2017084284A (en) | Web conference system and control method of the same, and program | |
JP7292765B1 (en) | Communication controller and computer program | |
JP6703259B2 (en) | Information processing system, conference server, control method thereof, and program | |
JP6680031B2 (en) | Conference apparatus, transmission method, and computer program | |
US20220377177A1 (en) | Conferencing System, Server, Information Processing Device and Non-Transitory Recording Medium | |
JP7445350B1 (en) | Information processing system, information processing method and program | |
JP7464853B2 (en) | Information processing device, information processing method, and program | |
JP2018018431A (en) | Web conference system, information processing device, control method, and program | |
US11758050B2 (en) | Conference system, conference method, and recording medium containing conference program | |
JP2017084285A (en) | Web conference system and control method of the same, and program | |
JP2024024879A (en) | Display control system, display control method, and display control program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180703 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20181031 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190115 |