JP2011030063A - Video conference system, server apparatus, and video conference program - Google Patents

Video conference system, server apparatus, and video conference program Download PDF

Info

Publication number
JP2011030063A
JP2011030063A JP2009175274A JP2009175274A JP2011030063A JP 2011030063 A JP2011030063 A JP 2011030063A JP 2009175274 A JP2009175274 A JP 2009175274A JP 2009175274 A JP2009175274 A JP 2009175274A JP 2011030063 A JP2011030063 A JP 2011030063A
Authority
JP
Japan
Prior art keywords
video
main speaker
point
display device
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009175274A
Other languages
Japanese (ja)
Other versions
JP5316286B2 (en
Inventor
Thitiporn Lertrusdachakul
ティティポーン ルートラットデーチャークン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2009175274A priority Critical patent/JP5316286B2/en
Publication of JP2011030063A publication Critical patent/JP2011030063A/en
Application granted granted Critical
Publication of JP5316286B2 publication Critical patent/JP5316286B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a video conference system, server apparatus and video conference program by which a video conference can be carried out inexpensively. <P>SOLUTION: A main speaker determining section 21 of a server apparatus 3 determines a main speaker of a video conference and, based on a determination result of the main speaker determining section 21, a video display control section 22 of the server apparatus 3 specifies a first main speaker and a second main speaker. The video display control section 22 then controls a display device 11 of any other point in such a way that video images of the first main speaker and the second main speaker are displayed at different positions on left and right sides, controls a display device 11 at a point, where the first main speaker is located, in such a way that the video image of the second main speaker is displayed at a left/right position different from a video display position of the second main speaker on the display device 11 of the other point, and controls a display device 11 of a point, where the second main speaker is located, in such a way that the video image of the first main speaker is displayed at a left/right position different from the video display position of the first main speaker on the display device 11 of the other point. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、複数の地点にいる出席者間でビデオ会議を行うためのビデオ会議システム,サーバ装置,及びビデオ会議プログラムに関する。   The present invention relates to a video conference system, a server device, and a video conference program for conducting a video conference between attendees at a plurality of points.

従来より、撮像装置と表示装置を用いて複数の地点にいる出席者の映像を撮影及び伝送することにより、複数の地点にいる出席者間でビデオ会議を行うビデオ会議システムが知られている。このようなビデオ会議システムでは、同じ会議を行っているという臨場感を出席者に与えるために、出席者の視線を互いに一致させることが重要な課題である。   2. Description of the Related Art Conventionally, a video conference system is known in which a video conference is performed between attendees at a plurality of locations by capturing and transmitting images of attendees at the plurality of locations using an imaging device and a display device. In such a video conference system, in order to give attendees a sense of realism that the same conference is being held, it is an important issue to match attendees' line of sight with each other.

このような背景から、複数の通信先の映像を1つの画面に合成して表示する表示装置と、会話中の通信先の映像と視線が一致する角度から通信元の正面の映像を撮影する複数の正面用撮像装置と、会話中の出席者同士の視線が一致する角度から通信元の横顔の映像を撮影する複数の横顔用撮像装置を備えるビデオ会議システムが提案されている(特許文献1参照)。   From such a background, a display device that synthesizes and displays a plurality of communication destination images on a single screen, and a plurality of images that capture a front image of the communication source from an angle at which the line of sight coincides with the image of the communication destination in conversation. A video conferencing system has been proposed that includes a front-side imaging device and a plurality of side-view imaging devices that capture a video of a communication source's profile from an angle at which the lines of sight of attendees in conversation match. ).

このビデオ会議システムは、出席者(通信元)がどの通信先の出席者と会話をしているのかを検出する。そしてビデオ会議システムは、検出結果に応じて、複数の正面用撮像装置により撮影された映像のうちの対応する映像を会話中の通信先に送信し、複数の横顔用撮像装置により撮影された映像のうちの対応する映像を会話中の通信先以外の通信先に送信する。   This video conferencing system detects which attendee (conversation source) is talking to which attendee. The video conferencing system then transmits a corresponding video out of the video captured by the plurality of front imaging devices to the communication destination during the conversation according to the detection result, and the video captured by the plurality of profile imaging devices. Is transmitted to a communication destination other than the communication destination in conversation.

従来のビデオ会議システムによれば、少なくとも{(ビデオ会議の出席者数−1)×2}台の撮像装置を出席者がいる各地点に設置しなければならないために、出席者数の増加に伴い撮像装置の必要設置台数が増加し、ビデオ会議を安価に行うことが困難になる。   According to the conventional video conferencing system, at least {(number of attendees of video conference −1) × 2} must be installed at each point where attendees are present. Along with this, the required number of installed image pickup devices increases, making it difficult to conduct video conferencing at low cost.

本発明は、上記に鑑みてなされたものであって、その目的は、ビデオ会議を安価に行うことが可能なビデオ会議システム,サーバ装置,及びビデオ会議プログラムを提供することにある。   The present invention has been made in view of the above, and an object of the present invention is to provide a video conference system, a server device, and a video conference program capable of performing a video conference at low cost.

上述した課題を解決し、目的を達成するために、本発明は、ビデオ会議の出席者がいる地点毎に配置された複数のビデオ会議端末装置と、電気通信回線を介して複数のビデオ会議端末装置に接続されたサーバ装置とを備え、各ビデオ会議端末装置は、少なくとも2地点の他の出席者の映像を左右異なる位置に表示する表示装置と、表示装置の表示画面に対面する出席者の映像を撮影する撮像装置とを備え、サーバ装置は、ビデオ会議の主要発言者を判定する主要発言者判定部と、表示装置が表示する出席者の映像を制御する映像表示制御部とを備え、映像表示制御部は、主要発言者判定部の判定結果に基づいて第1及び第2の主要発言者を特定し、撮像装置により撮影された第1の主要発言者と前記第2の主要発言者の映像が左右異なる位置に表示されるように、第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置を制御し、撮像装置により撮影された第2の主要発言者の映像が、第1及び第2の主要発言者以外の出席者がいる地点の表示装置における、第2の主要発言者の映像表示位置とは異なる左右位置に表示されるように、第1の主要発言者がいる地点の表示装置を制御し、撮像装置により撮影された第1の主要発言者の映像が、第1及び第2の主要発言者以外の出席者がいる地点の表示装置における、第1の主要発言者の映像表示位置とは異なる左右位置に表示されるように、第2の主要発言者がいる地点の表示装置を制御する。   In order to solve the above-described problems and achieve the object, the present invention provides a plurality of video conference terminal devices arranged at points where attendees of a video conference are present, and a plurality of video conference terminals via telecommunication lines. Each of the video conference terminal devices includes a display device that displays images of other attendees at least at two different positions on the left and right sides of the attendant facing the display screen of the display device. An image pickup device that captures video, and the server device includes a main speaker determination unit that determines a main speaker of a video conference, and a video display control unit that controls a video of an attendee displayed by the display device, The video display control unit identifies the first and second main speakers based on the determination result of the main speaker determination unit, and the first main speaker and the second main speaker captured by the imaging device. The position of the video is different The display device of the point where the attendees other than the first and second main speakers are present is controlled so that the video of the second main speaker captured by the imaging device is displayed. The display of the point where the first main speaker is located so that it is displayed in the left and right positions different from the video display position of the second main speaker in the display device of the point where the attendees other than the second main speaker are present An image of the first main speaker in a display device at a point where an attendee other than the first and second main speakers is present, with the video of the first main speaker captured by the imaging device controlled by the apparatus The display device at the point where the second main speaker is located is controlled so as to be displayed at the left and right positions different from the display position.

上述した課題を解決し、目的を達成するために、本発明は、複数の地点にいるビデオ会議の出席者の中からビデオ会議の主要発言者を判定する主要発言者判定部と、ビデオ会議の出席者がいる地点毎に配置された表示装置に表示させる出席者の映像を制御する映像表示制御部とを備え、映像表示制御部は、主要発言者判定部の判定結果に基づいて第1及び第2の主要発言者を特定し、第1の主要発言者と第2の主要発言者の映像が左右異なる位置に表示されるように、第1及び第2の主要発言者以外の出席者がいる地点の表示装置を制御し、第2の主要発言者の映像が、第1及び第2の主要発言者以外の出席者がいる地点の表示装置における、第2の主要発言者の映像表示位置とは異なる左右位置に表示されるように、第1の主要発言者がいる地点の表示装置を制御し、第1の主要発言者の映像が、第1及び第2の主要発言者以外の出席者がいる地点の表示装置における、第1の主要発言者の映像表示位置とは異なる左右位置に表示されるように、第2の主要発言者がいる地点の表示装置を制御する。   In order to solve the above-described problems and achieve the object, the present invention provides a main speaker determination unit that determines a main speaker of a video conference from among video conference attendees at a plurality of points, A video display control unit for controlling the video of the attendee to be displayed on a display device arranged at each point where the attendee is present, the video display control unit based on the determination result of the main speaker determination unit Attendees other than the first and second main speakers are identified so that the second main speaker is identified and the images of the first main speaker and the second main speaker are displayed at different positions. The video display position of the second main speaker in the display device of the point where the attendees other than the first and second main speakers are present is controlled. The first main speaker is displayed so that it is displayed at a different left and right position. The display device of the first main speaker is controlled, and the video display position of the first main speaker in the display device of the point where attendees other than the first and second main speakers are present is controlled. Controls the display device at the point where the second main speaker is located so that they are displayed at different left and right positions.

上述した課題を解決し、目的を達成するために、本発明は、複数の地点にいるビデオ会議の出席者の中からビデオ会議の主要発言者を判定する主要発言者判定ステップと、ビデオ会議の出席者がいる地点毎に配置された表示装置に表示させる出席者の映像を制御する映像表示制御ステップとをコンピュータに実行させ、映像表示制御ステップは、主要発言者判定ステップの結果に基づいて第1及び第2の主要発言者を特定するステップと、第1の主要発言者と第2の主要発言者の映像が左右異なる位置に表示されるように、第1及び第2の主要発言者以外の出席者がいる地点の表示装置を制御するステップと、第2の主要発言者の映像が、第1及び第2の主要発言者以外の出席者がいる地点の表示装置における、第2の主要発言者の映像表示位置とは異なる左右位置に表示されるように、第1の主要発言者がいる地点の表示装置を制御するステップと、第1の主要発言者の映像が、第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、第1の主要発言者の映像表示位置とは異なる左右位置に表示されるように、第2の主要発言者がいる地点の表示装置を制御するステップとを含む。   In order to solve the above-described problems and achieve the object, the present invention provides a main speaker determination step for determining a main speaker of a video conference from among video conference attendees at a plurality of points, And a video display control step for controlling the video of the attendee to be displayed on the display device arranged at each point where the attendee is present. The video display control step is performed based on the result of the main speaker determination step. Steps for identifying the first and second main speakers, and other than the first and second main speakers so that the images of the first main speaker and the second main speaker are displayed at different positions on the left and right Controlling the display device at the point where the attendee is present and the video of the second main speaker is the second main in the display device at the point where attendees other than the first and second main speakers are present Video display of the speaker A step of controlling the display device at the point where the first main speaker is located so that the left and right positions are different from the position of the device, and images of the first main speaker are the first and second main messages. The display device at the point where the second main speaker is located is controlled such that the display device is displayed at a left and right position different from the video display position of the first main speaker in the display device where the attendee other than the present person is present. Steps.

本発明によれば、撮像装置の必要設置台数がビデオ会議の出席者数に依存しなくなるので、ビデオ会議を安価に行うことができる。   According to the present invention, since the required number of installed image pickup devices does not depend on the number of attendees of the video conference, the video conference can be performed at a low cost.

図1は、本発明の実施形態となるビデオ会議システムの構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a video conference system according to an embodiment of the present invention. 図2は、図1に示す表示装置の画面構成を示す模式図である。FIG. 2 is a schematic diagram showing a screen configuration of the display device shown in FIG. 図3は、図1に示す左カメラと右カメラのレイアウトを示す模式図である。FIG. 3 is a schematic diagram showing a layout of the left camera and the right camera shown in FIG. 図4は、図1に示す主要発言者判定部の内部構成を示すブロック図である。FIG. 4 is a block diagram showing an internal configuration of the main speaker determination unit shown in FIG. 図5は、図1に示す表示装置の表示出力例を示す模式図である。FIG. 5 is a schematic diagram illustrating a display output example of the display device illustrated in FIG. 1. 図6(a)は、出席者が右画面領域を見ている際に右カメラにより撮影される映像を説明するための図、図6(b)は、出席者が右画面領域を見ている際に左カメラにより撮影される映像を説明するための図、図6(c)は、出席者が左画面領域を見ている際に右カメラにより撮影される映像を説明するための図、図6(d)は、出席者が左画面領域を見ている際に左カメラにより撮影される映像を説明するための図である。FIG. 6A is a diagram for explaining an image captured by the right camera when the attendee is looking at the right screen area, and FIG. 6B is a view of the attendee looking at the right screen area. FIG. 6C is a diagram for explaining an image photographed by the right camera when the attendee is looking at the left screen area. FIG. 6D is a diagram for explaining an image captured by the left camera when the attendee is looking at the left screen area. 図7は、地点P1〜P4の表示装置に表示される出席者の映像の一例を示す模式図である。FIG. 7 is a schematic diagram illustrating an example of attendee images displayed on the display devices at the points P1 to P4. 図8は、映像表示制御処理の流れを示すフローチャート図である。FIG. 8 is a flowchart showing the flow of the video display control process. 図9は、図8に示すステップS4の処理のサブルーチンを示すフローチャート図である。FIG. 9 is a flowchart showing a subroutine of the process in step S4 shown in FIG. 図10は、図8に示すステップS5の処理のサブルーチンを示すフローチャート図である。FIG. 10 is a flowchart showing a subroutine of the process in step S5 shown in FIG. 図11は、図10に示すステップS23の処理のサブルーチンを示すフローチャート図である。FIG. 11 is a flowchart showing a subroutine of the process in step S23 shown in FIG. 図12は、図10に示すステップS24の処理のサブルーチンを示すフローチャート図である。FIG. 12 is a flowchart showing a subroutine of the process in step S24 shown in FIG. 図13は、図10に示すステップS25の処理のサブルーチンを示すフローチャート図である。FIG. 13 is a flowchart showing a subroutine of the process of step S25 shown in FIG. 図14は、図8に示すステップS6の処理のサブルーチンを示すフローチャート図である。FIG. 14 is a flowchart showing a subroutine of the process in step S6 shown in FIG. 図15は、図8に示すステップS8の処理のサブルーチンを示すフローチャート図である。FIG. 15 is a flowchart showing a subroutine of the process in step S8 shown in FIG. 図16は、他地点nにいる出席者,第1の主要発言者,及び第2の主要発言者の表示装置の表示画面例を示す模式図である。FIG. 16 is a schematic diagram illustrating a display screen example of the display device of the attendees at the other point n, the first main speaker, and the second main speaker. 図17は、主要発言者の変化に伴う表示画面の変化の一例を示す図である。FIG. 17 is a diagram illustrating an example of a change in the display screen accompanying a change in the main speaker.

以下、図面を参照して、本発明の実施形態となるビデオ会議システムの構成及びその動作について説明する。   Hereinafter, the configuration and operation of a video conference system according to an embodiment of the present invention will be described with reference to the drawings.

〔ビデオ会議システムの構成〕
始めに、図1を参照して、本発明の実施形態となるビデオ会議システムの構成について説明する。
[Configuration of video conferencing system]
First, the configuration of the video conference system according to the embodiment of the present invention will be described with reference to FIG.

本発明の実施形態となるビデオ会議システム1は、図1に示すように、ビデオ会議の出席者がいる地点毎に設けられたビデオ会議端末装置2と、ビデオ会議端末装置2の動作を制御するサーバ装置3とを備え、ビデオ会議端末装置2とサーバ装置3は、電気通信回線4を介して相互に情報通信可能なように構成されている。   As shown in FIG. 1, the video conference system 1 according to the embodiment of the present invention controls the video conference terminal device 2 provided at each point where the attendee of the video conference is present and the operation of the video conference terminal device 2. The video conference terminal device 2 and the server device 3 are configured to be capable of communicating information with each other via the telecommunication line 4.

〔ビデオ会議端末装置の構成〕
ビデオ会議端末装置2は、表示装置11と撮像装置12を備える。表示装置11は、液晶ディスプレイ装置やCRT(Cathode Ray Tube)装置等の公知の表示装置により構成され、図2に示すように、左画面領域31,右画面領域32,下画面領域33,及び発言率表示領域34,35を有する。左画面領域31,右画面領域32,及び下画面領域33は、サーバ装置3から送信されたビデオ会議の出席者の映像を表示する。本実施形態では、左画面領域32と右画面領域33は、図3に示すように、それぞれの中心位置から表示画面の中心位置までの距離(図3に示す距離a)が同じになる位置に配置されている。
[Configuration of video conference terminal]
The video conference terminal device 2 includes a display device 11 and an imaging device 12. The display device 11 is configured by a known display device such as a liquid crystal display device or a CRT (Cathode Ray Tube) device, and as shown in FIG. 2, a left screen region 31, a right screen region 32, a lower screen region 33, and a statement Rate display areas 34 and 35 are provided. The left screen area 31, the right screen area 32, and the lower screen area 33 display images of attendees of the video conference transmitted from the server device 3. In the present embodiment, as shown in FIG. 3, the left screen area 32 and the right screen area 33 are located at the same distance from the center position to the center position of the display screen (distance a shown in FIG. 3). Has been placed.

発言率表示領域34及び発言率表示領域35はそれぞれ、左画面領域31及び右画面領域32に表示されている出席者の発言時間のビデオ会議時間中に占める割合(発言率)を表示する。本実施形態では、発言率表示領域34,35に表示されている黒色のバーの長さが出席者の発言率を示す。すなわち本実施形態では、黒色のバーが発言率表示領域34,35に表示されていない場合、出席者の発言率は0%となり、黒色のバーが発言率表示領域34,35の左端から右端まで表示されている場合には、出席者の発言率は100%となる。   The speech rate display area 34 and the speech rate display area 35 display the ratio (speech rate) of the attendee's speech time displayed in the left screen region 31 and the right screen region 32 during the video conference time, respectively. In this embodiment, the length of the black bar displayed in the speech rate display areas 34 and 35 indicates the speech rate of the attendee. That is, in this embodiment, when the black bar is not displayed in the speech rate display areas 34 and 35, the attendance rate of the attendee is 0%, and the black bar extends from the left end to the right end of the speech rate display areas 34 and 35. If displayed, the attendance rate for attendees is 100%.

撮像装置12は、表示装置11に対面している出席者(操作者)の映像を撮影する左カメラ12aと右カメラ12bを有する。左カメラ12aは、図3に示すように、操作者が左画面領域31に表示されている出席者の映像を見ている時の視線方向と撮像方向がなす角度がθとなる位置に配置され、操作者の正面近くの映像を角度θで撮影する。一方、右カメラ12bは、操作者が左画面領域31に表示されている出席者の映像を見ている時の視線方向と撮像方向がなす角度がβとなる位置に配置され、左画面領域31を見ている操作者の横顔の映像を角度βで撮影する。   The imaging device 12 includes a left camera 12a and a right camera 12b that capture images of attendees (operators) facing the display device 11. As shown in FIG. 3, the left camera 12 a is arranged at a position where the angle formed by the line-of-sight direction and the imaging direction when the operator is viewing the attendee's image displayed in the left screen area 31 is θ. Then, an image near the front of the operator is taken at an angle θ. On the other hand, the right camera 12b is arranged at a position where the angle formed by the line-of-sight direction and the imaging direction when the operator is viewing the attendee's video displayed in the left screen area 31 is β. An image of the profile of the operator who is watching is taken at an angle β.

左画面領域31又は右画面領域32に表示されている出席者の視線と操作者の視線を一致させるためには、角度θが可能な限り小さくなるように左カメラ12a及び右ガメラ12bを配置することが望ましい。また操作者の横顔を正しく撮影するためには、角度βが60〜90°の範囲内に収まるように左カメラ12a及び右カメラ12bを配置することが望ましい。但し、操作者の正面映像と横顔映像を区別しやすくするためには、角度βが角度θの少なくとも2倍以上であることが望ましい。   In order to match the line of sight of the attendee displayed in the left screen area 31 or the right screen area 32 with the line of sight of the operator, the left camera 12a and the right gamer 12b are arranged so that the angle θ is as small as possible. It is desirable. In order to correctly photograph the operator's profile, it is desirable to arrange the left camera 12a and the right camera 12b so that the angle β falls within the range of 60 to 90 °. However, in order to make it easy to distinguish the front image and the profile image of the operator, it is desirable that the angle β is at least twice the angle θ.

〔サーバ装置の構成〕
サーバ装置3は、ワークステーション等の公知の情報処理装置により構成され、主要発言者判定部21と映像表示制御部22を備える。主要発言者判定部21と映像表示制御部22の機能は、情報処理装置内部のCPU(Central Processing Unit)が記憶媒体からビデオ会議プログラムを読み出して実行することにより、サーバ装置3上で実現されるようになっている。
[Configuration of server device]
The server device 3 is configured by a known information processing device such as a workstation, and includes a main speaker determination unit 21 and a video display control unit 22. The functions of the main speaker determination unit 21 and the video display control unit 22 are realized on the server device 3 by a CPU (Central Processing Unit) inside the information processing device reading out and executing a video conference program from a storage medium. It is like that.

上記ビデオ会議プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM,フレキシブルディスク(FD),CD-R,DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。またビデオ会議プログラムをインターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。またビデオ会議プログラムをインターネット等のネットワーク経由で提供又は配布するように構成してもよい。またビデオ会議プログラムをROM等に予め組み込んで提供するように構成してもよい。   The video conferencing program is a file in an installable or executable format and is recorded on a computer-readable recording medium such as a CD-ROM, flexible disk (FD), CD-R, DVD (Digital Versatile Disk). Provided. Further, the video conference program may be stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. Further, the video conference program may be provided or distributed via a network such as the Internet. Further, the video conference program may be provided by being incorporated in advance in a ROM or the like.

主要発言者判定部21は、図4に示すように、音量検出部41,音量履歴記憶部42,主要発言書特定部43,及び発言時間計算部44を含む。音量検出部41は、ビデオ会議の出席者がいる各地点のビデオ会議端末装置2から出席者の映像を受信し、受信した映像情報に基づいて各出席者の発話音量を検出する。音量履歴記憶部42は、音量検出部41により検出された各出席者の発話音量を単位時間毎に記憶する。主要発言者特定部43は、音量履歴記憶部42に記憶されている各出席者の単位時間毎の発話音量に基づいて所定時間内の平均発話音量(例えば最近5〜10秒間の平均発話音量)を算出し、算出された平均発話音量が最も大きい出席者を主要発言者として特定する。発言時間計算部44は、音量履歴記憶部42に記憶されている各出席者の単位時間毎の発話音量に基づいて各出席者の発言率を算出する。   As shown in FIG. 4, the main speaker determination unit 21 includes a volume detection unit 41, a volume history storage unit 42, a main message book specification unit 43, and a speech time calculation unit 44. The volume detection unit 41 receives the attendee's video from the video conference terminal device 2 at each point where the video conference attendee is present, and detects the speech volume of each attendee based on the received video information. The volume history storage unit 42 stores the speech volume of each attendee detected by the volume detection unit 41 for each unit time. The main speaker specifying unit 43 determines the average utterance volume within a predetermined time based on the utterance volume per unit time of each attendee stored in the volume history storage unit 42 (for example, the average utterance volume for the last 5 to 10 seconds). And the attendee with the highest calculated average utterance volume is identified as the main speaker. The speech time calculation unit 44 calculates the speech rate of each attendee based on the speech volume per unit time of each attendee stored in the volume history storage unit 42.

映像表示制御部22は、主要発言者判定部21(主要発言者特定部43及び発言時間計算部44)の処理結果に基づいて、各地点の表示装置11に表示する映像や情報を制御する。詳しくは後述するが、地点P1〜P4にいる出席者間でビデオ会議を行っている場合において、地点P1の出席者が地点P2の出席者と会話をしている時には、映像表示制御部22は、例えば図5に示すように、地点P1の表示装置11の左画面領域31及び右画面領域32にそれぞれ地点P2及び地点P3の出席者の映像を表示する。   The video display control unit 22 controls the video and information displayed on the display device 11 at each point based on the processing result of the main speaker determination unit 21 (the main speaker specifying unit 43 and the speech time calculation unit 44). As will be described in detail later, when a video conference is being held between attendees at the points P1 to P4, when the attendant at the point P1 has a conversation with the attendant at the point P2, the video display control unit 22 For example, as shown in FIG. 5, the images of the attendees at the points P2 and P3 are displayed on the left screen region 31 and the right screen region 32 of the display device 11 at the point P1, respectively.

出席者が右画面領域32を見ている場合、右カメラ12bは図6(a)に示すような出席者が小さく左を向いている映像を撮影し、左カメラ12aは図6(b)に示すような出席者が大きく左を向いている映像を撮影する。一方、出席者が左画面領域31を見ている場合には、右カメラ12bは図6(c)に示すような出席者が大きく右を向いている映像を撮影し、左カメラ12aは図6(d)に示すような出席者が小さく右を向いている映像を撮影する。   When the attendee is looking at the right screen area 32, the right camera 12b captures a video in which the attendee is small and facing the left as shown in FIG. 6A, and the left camera 12a is shown in FIG. 6B. Take a picture of the attendee as shown, pointing to the left. On the other hand, when the attendee is looking at the left screen area 31, the right camera 12b captures an image in which the attendee is greatly facing right as shown in FIG. 6C, and the left camera 12a is shown in FIG. Shoot an image in which the attendee is small and facing right as shown in (d).

従って、地点P1の出席者が地点P2の出席者と会話をしている場合、映像表示制御部22は、図7に示すように、地点P1の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点P2の出席者が小さく右を向いている映像及び地点P3の出席者が大きく左を向いている映像を表示する。また映像表示制御部22は、地点P2の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点P4の出席者が大きく右を向いている映像及び地点P1の出席者が小さく左を向いている映像を表示する。また映像表示制御部22は、地点P3及び地点P4の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点P1の出席者が大きく右を向いている映像及び地点P2の出席者が大きく左を向いている映像を表示する。   Therefore, when the attendee at the point P1 is talking to the attendee at the point P2, the video display control unit 22 performs the left screen region 31 and the right screen region of the display device 11 at the point P1, as shown in FIG. In 32, an image in which the attendee at the point P2 is small and facing right and an image in which the attendee at the point P3 is facing large and left are displayed. In addition, the video display control unit 22 displays the video in which the attendee at the point P4 is greatly facing the right and the attendant at the point P1 is small in the left screen region 31 and the right screen region 32 of the display device 11 at the point P2. Display the video you are facing. In addition, the video display control unit 22 includes a video in which the attendee at the point P1 is greatly facing the right and the attendant at the point P2 in the left screen region 31 and the right screen region 32 of the display device 11 at the point P3 and the point P4, respectively. Display a video that is facing large left.

〔映像表示制御処理〕
このようなビデオ会議システム1では、サーバ装置3が以下に示す映像表示制御処理を実行することにより、ビデオ会議を安価に行うことを可能にする。以下、図8に示すフローチャートを参照して、この映像表示制御処理を実行する際のサーバ装置3の動作について説明する。
[Video display control processing]
In such a video conference system 1, the server device 3 can perform a video conference at a low cost by executing the following video display control process. The operation of the server device 3 when executing this video display control process will be described below with reference to the flowchart shown in FIG.

図8に示すフローチャートは、サーバ装置3に対しビデオ会議の開始が指示されたタイミングで開始となり、映像表示制御処理はステップS1の処理に進む。   The flowchart shown in FIG. 8 starts when the server apparatus 3 is instructed to start a video conference, and the video display control process proceeds to step S1.

ステップS1の処理では、映像表示制御部22が、映像表示制御処理の初期設定を実行する。具体的には、映像表示制御部22は、ビデオ会議の主催者によって入力されたビデオ会議の出席者の主要順序に基づいて、主要順序が1番目の出席者を「第1の主要発言者」,主要順序が2番目の出席者を「第2の主要発言者」,主要順序が3番目の出席者がいる地点を「デフォルト地点」に設定する。   In the process of step S1, the video display control unit 22 executes initial setting of the video display control process. Specifically, the video display control unit 22 designates the attendee whose primary order is the first as the “first primary speaker” based on the primary order of the attendees of the video conference input by the video conference organizer. , The second participant in the main order is set as “second main speaker”, and the point where the third participant in the main order is set as “default point”.

映像表示制御部22は、「第1の主要発言者」の表示装置11の左画面領域31及び右画面領域32にそれぞれ右カメラ12bにより撮影された「第2の主要発言者」の映像及び左カメラ12aにより撮影された「デフォルト地点」にいる出席者の映像を表示するように「第1の主要発言者」の表示装置11の表示画面を設定する。映像表示制御部22は、「第2の主要発言者」の表示装置11の左画面領域31及び右画面領域32にそれぞれ右カメラ12bにより撮影された「デフォルト地点」にいる出席者の映像及び左カメラ12aにより撮影された「第1の主要発言者」の映像を表示するように「第2の主要発言者」の表示装置11の表示画面を設定する。   The video display control unit 22 displays the video of the “second main speaker” and the left captured by the right camera 12b in the left screen region 31 and the right screen region 32 of the display device 11 of “first main speaker”, respectively. The display screen of the display device 11 of the “first main speaker” is set so as to display the video of the attendee at the “default location” photographed by the camera 12a. The video display control unit 22 displays the video of the attendee at the “default location” taken by the right camera 12b in the left screen area 31 and the right screen area 32 of the display device 11 of “second main speaker” and the left. The display screen of the display device 11 of the “second main speaker” is set so as to display the video of the “first main speaker” taken by the camera 12a.

映像表示制御部22は、「第1の主要発言者」と「第2の主要発言者」以外の出席者(「デフォルト地点」を含む「他地点」にいる出席者)の表示装置11の左画面領域31及び右画面領域32にそれぞれ右カメラ12bにより撮影された「第1の主要発言者」の映像及び左カメラ12aにより撮影された「第2の主要発言者」の映像を表示するように「他地点」の表示装置11の表示画面を設定する。そして映像表示制御部22は、各出席者について設定した情報、すなわち「第1の主要発言者」,「第2の主要発言者」,「デフォルト地点」,及び「他地点」の種別を示す分類情報と、表示装置11の左画面領域31及び右画面領域32に表示する映像を示す表示情報を各出席者の属性情報として記憶する。これにより、ステップS1の処理は完了し、映像表示制御処理はステップS2の処理に進む。   The video display control unit 22 displays the left side of the display device 11 of attendees other than “first main speaker” and “second main speaker” (participants in “other locations” including “default location”). An image of “first main speaker” captured by the right camera 12b and an image of “second main speaker” captured by the left camera 12a are displayed in the screen area 31 and the right screen area 32, respectively. The display screen of the “other point” display device 11 is set. The video display control unit 22 then classifies the information set for each attendee, that is, the types of “first main speaker”, “second main speaker”, “default location”, and “other locations”. Information and display information indicating video to be displayed on the left screen area 31 and the right screen area 32 of the display device 11 are stored as attribute information of each attendee. Thereby, the process of step S1 is completed and the video display control process proceeds to the process of step S2.

ステップS2の処理では、映像表示制御部22が、主要発言者判定部21から主要発言者の情報を取得する。これにより、ステップS2の処理は完了し、映像表示制御処理はステップS3の処理に進む。   In the process of step S <b> 2, the video display control unit 22 acquires information on the main speaker from the main speaker determination unit 21. Thereby, the process of step S2 is completed and the video display control process proceeds to the process of step S3.

ステップS3の処理では、映像表示制御部22が、出席者の属性情報とステップS2の処理により取得した主要発言者の情報とを比較することにより、主要発言者が変化したか否かを判別する。判別の結果、主要発言者が変化していない場合、映像表示制御部22は映像表示制御処理をステップS7の処理に進める。一方、主要発言者が変化した場合には、映像表示制御部22は映像表示制御処理をステップS4の処理に進める。   In the process of step S3, the video display control unit 22 determines whether or not the main speaker has changed by comparing the attendee's attribute information with the information of the main speaker acquired by the process of step S2. . If the main speaker is not changed as a result of the determination, the video display control unit 22 advances the video display control process to the process of step S7. On the other hand, when the main speaker changes, the video display control unit 22 advances the video display control process to the process of step S4.

ステップS4の処理では、映像表示制御部22が、新しい主要発言者(「第1の主要発言者」と「第2の主要発言者」)を特定し、特定結果に基づいて各出席者の属性情報を更新する(主要発言者特定処理)。この主要発言者特定処理の詳細については、図9に示すフローチャートを参照して後述する。これにより、ステップS4の処理は完了し、映像表示制御処理はステップS5の処理に進む。   In the process of step S4, the video display control unit 22 specifies new main speakers (“first main speaker” and “second main speaker”), and attributes of each attendee based on the specified result. Update information (main speaker identification process). Details of the main speaker specifying process will be described later with reference to a flowchart shown in FIG. Thereby, the process of step S4 is completed, and the video display control process proceeds to the process of step S5.

ステップS5の処理では、映像表示制御部22が、ステップS4の処理により更新された各出席者の属性情報に従って、各出席者の表示装置11の左画面領域31及び右画面領域32に映像を表示する出席者を決定する(映像表示地点決定処理)。この映像表示地点決定処理の詳細については、図10乃至図13に示すフローチャートを参照して後述する。これにより、ステップS5の処理は完了し、映像表示制御処理はステップS6とステップS7の処理に進む。   In the process of step S5, the video display control unit 22 displays the video in the left screen area 31 and the right screen area 32 of each attendee's display device 11 in accordance with the attribute information of each attendee updated in the process of step S4. Attendees to be determined (video display point determination processing). Details of this video display point determination processing will be described later with reference to the flowcharts shown in FIGS. Thereby, the process of step S5 is completed, and the video display control process proceeds to the processes of step S6 and step S7.

ステップS6の処理では、映像表示制御部22が、ステップS5の処理結果に基づいて、各出席者の表示装置11の左画面領域31及び右画面領域32に表示する出席者の映像(左カメラ12a又は右カメラ12bにより撮影された映像)を特定する(映像特定処理)。この映像特定処理の詳細については図14に示すフローチャートを参照して後述する。これにより、ステップS6の処理は完了し、映像表示制御処理はステップS8の処理に進む。   In the process of step S6, the video display control unit 22 displays the attendee video (left camera 12a) displayed on the left screen area 31 and the right screen area 32 of the display device 11 of each attendee based on the processing result of step S5. Alternatively, the image captured by the right camera 12b) is identified (image identification process). Details of this video specifying process will be described later with reference to a flowchart shown in FIG. Thereby, the process of step S6 is completed, and the video display control process proceeds to the process of step S8.

ステップS7の処理では、映像表示制御部22が、主要発言者判定部21から「第1の主要発言者」,「第2の主要発言者」,及び「デフォルト地点」にいる出席者の発言率に関する情報を取得する。これにより、ステップS7の処理は完了し、映像表示制御処理はステップS8の処理に進む。   In the process of step S7, the video display control unit 22 sends a speech rate of attendees at the “first main speaker”, “second main speaker”, and “default location” from the main speaker determination unit 21. Get information about. Thereby, the process of step S7 is completed, and the video display control process proceeds to the process of step S8.

ステップS8の処理では、映像表示制御部22が、ステップS6の処理結果に基づいて各地点の表示装置11に送信する映像を選択し、ステップS7の処理により取得した発言率に関する情報と共に選択された映像を各地点の表示装置11に送信する(情報送信処理)。この情報送信処理の詳細については、図15に示すフローチャートを参照して後述する。これにより、ステップS8の処理は完了し、映像表示制御処理はステップS9の処理に進む。   In the process of step S8, the video display control unit 22 selects the video to be transmitted to the display device 11 at each point based on the process result of step S6, and is selected together with the information regarding the speech rate acquired by the process of step S7. The video is transmitted to the display device 11 at each point (information transmission process). Details of this information transmission processing will be described later with reference to the flowchart shown in FIG. Thereby, the process of step S8 is completed, and the video display control process proceeds to the process of step S9.

ステップS9の処理では、映像表示制御部22が、ビデオ会議の終了指示が入力されたか否かを判別する。判別の結果、ビデオ会議の終了指示が入力されていない場合、映像表示制御部22は映像表示制御処理をステップS2の処理に戻す。一方、ビデオ会議の終了指示が入力された場合には、映像表示制御部22は一連の映像表示制御処理を終了する。   In the process of step S9, the video display control unit 22 determines whether or not a video conference end instruction has been input. As a result of the determination, when the video conference end instruction is not input, the video display control unit 22 returns the video display control process to the process of step S2. On the other hand, when a video conference end instruction is input, the video display control unit 22 ends the series of video display control processing.

〔主要発言者特定処理〕
次に、図9に示すフローチャートを参照して、上記ステップS4の主要発言者特定処理について詳しく説明する。
[Key speaker identification processing]
Next, the main speaker specifying process in step S4 will be described in detail with reference to the flowchart shown in FIG.

図9に示すフローチャートは、ステップS3の処理において主要発言者が変化したと判別されたタイミングで開始となり、主要発言者特定処理はステップS11の処理に進む。   The flowchart shown in FIG. 9 starts at the timing when it is determined that the main speaker has changed in the process of step S3, and the main speaker specifying process proceeds to the process of step S11.

ステップS11の処理では、映像表示制御部22が、各出席者の属性情報を読み出す。これにより、ステップS11の処理は完了し、主要発言者特定処理はステップS12の処理に進む。   In the process of step S11, the video display control unit 22 reads the attribute information of each attendee. Thereby, the process of step S11 is completed, and the main speaker specifying process proceeds to the process of step S12.

ステップS12の処理では、映像表示制御部22が、属性情報内の分類情報を元分類情報(主要発言者が変化する前の各出席者の属性情報)に置き換える。これにより、ステップS12の処理は完了し、主要発言者特定処理はステップS13の処理に進む。   In the process of step S12, the video display control unit 22 replaces the classification information in the attribute information with the original classification information (attribute information of each attendee before the main speaker changes). Thereby, the process of step S12 is completed, and the main speaker specifying process proceeds to the process of step S13.

ステップS13の処理では、映像表示制御部22が、元分類情報で「第2の主要発言者」に分類されている出席者の分類情報を「第1の主要発言者」に設定する。これにより、ステップS13の処理は完了し、主要発言者特定処理はステップS14の処理に進む。   In the processing of step S13, the video display control unit 22 sets the classification information of attendees classified as “second main speaker” in the original classification information as “first main speaker”. Thereby, the process of step S13 is completed, and the main speaker specifying process proceeds to the process of step S14.

ステップS14の処理では、映像表示制御部22が、新しい主要発言者の分類情報を「第2の主要発言者」に設定する。これにより、ステップS14の処理は完了し、主要発言者特定処理はステップS14の処理は完了し、主要発言者特定処理はステップS15の処理に進む。   In the processing of step S14, the video display control unit 22 sets the classification information of the new main speaker as “second main speaker”. Thereby, the process in step S14 is completed, the main speaker specifying process is completed in step S14, and the main speaker specifying process proceeds to the process in step S15.

ステップS15の処理では、映像表示制御部22が、ステップS13とステップS14の処理により「第1の主要発言者」及び「第2の主要発言者」に設定された出席者と元分類情報において「第1の主要発言者」及び「デフォルト地点」にいる出席者に設定されている出席者を除く出席者の中で、初期設定処理において設定された主要順位が最も高い出席者の分類情報を「デフォルト地点」に設定する。これにより、ステップS15の処理は完了し、主要発言者特定処理はステップS16の処理に進む。   In the process of step S15, the video display control unit 22 sets “first main speaker” and “second main speaker” set in “first main speaker” and the original classification information by the processes of steps S13 and S14. Among the attendees excluding the attendees set as attendees at the “first primary speaker” and “default location”, the classification information of the attendee with the highest priority set in the initial setting process is “ Set to “Default point”. Thereby, the process of step S15 is completed, and the main speaker specifying process proceeds to the process of step S16.

ステップS16の処理では、映像表示制御部22が、ステップS15の処理により「デフォルト地点」にいる出席者に分類された出席者を含む「第1の主要発言者」と「第2の主要発言者」以外の出席者の分類情報を「他地点」に設定する。これにより、ステップS16の処理は完了し、主要発言者特定処理はステップS17の処理に進む。   In the process of step S16, the video display control unit 22 includes the “first main speaker” and the “second main speaker” including the attendees classified as attendees at the “default location” by the process of step S15. Set the classification information of attendees other than "Other points". Thereby, the process of step S16 is completed, and the main speaker specifying process proceeds to the process of step S17.

ステップS17の処理では、映像表示制御部22が、ステップS12乃至ステップS16の処理結果に基づいて、各出席者の属性情報を更新する。これにより、ステップS17の処理は完了し、一連の主要発言者特定処理は完了する。   In the process of step S17, the video display control unit 22 updates the attribute information of each attendee based on the process results of steps S12 to S16. Thereby, the process of step S17 is completed and a series of main speaker specific processes are completed.

〔映像表示地点決定処理〕
次に、図10に示すフローチャートを参照して、上記ステップS5の映像表示地点決定処理について詳しく説明する。
[Video display point determination processing]
Next, the video display point determination process in step S5 will be described in detail with reference to the flowchart shown in FIG.

図10に示すフローチャートは、ステップS4の処理が完了したタイミングで開始となり、映像表示地点決定処理はステップS21の処理に進む。   The flowchart shown in FIG. 10 starts at the timing when the process of step S4 is completed, and the video display point determination process proceeds to the process of step S21.

ステップS21の処理では、映像表示制御部22が、各出席者の属性情報を読み出す。これにより、ステップS21の処理は完了し、映像表示地点決定処理はステップS22の処理に進む。   In step S21, the video display control unit 22 reads the attribute information of each attendee. Thereby, the process of step S21 is completed, and the video display point determination process proceeds to the process of step S22.

ステップS22の処理では、映像表示制御部22が、ステップS21の処理により読み出された属性情報から各出席者の分類情報,元分類情報、及び表示情報を抽出する。これにより、ステップS22の処理は完了し、映像表示地点決定処理はステップS23の処理に進む。   In the process of step S22, the video display control unit 22 extracts the classification information, the original classification information, and the display information of each attendee from the attribute information read out by the process of step S21. Thereby, the process of step S22 is completed, and the video display point determination process proceeds to the process of step S23.

ステップS23の処理では、映像表示制御部22が、ステップS22の処理により抽出された分類情報及び表示情報に基づいて、「他地点」の表示装置11に映像を表示する出席者の地点を決定する(第1表示地点決定処理)。この第1表示地点決定処理の詳細については、図11に示すフローチャートを参照して後述する。これにより、ステップS23の処理は完了し、映像表示地点決定処理はステップS24の処理に進む。   In the process of step S23, the video display control unit 22 determines the location of the attendee who displays the video on the display device 11 of “other location” based on the classification information and the display information extracted by the process of step S22. (First display point determination process). The details of the first display point determination process will be described later with reference to the flowchart shown in FIG. Thereby, the process of step S23 is completed, and the video display point determination process proceeds to the process of step S24.

ステップS24の処理では、映像表示制御部22が、ステップS22の処理により抽出された分類情報及び表示情報に基づいて、「第1の主要発言者」の表示装置11に映像を表示する出席者の地点を決定する(第2表示地点決定処理)。この第2表示地点決定処理の詳細については、図12に示すフローチャートを参照して後述する。これにより、ステップS24の処理は完了し、映像表示地点決定処理はステップS25の処理に進む。   In the process of step S24, the video display control unit 22 displays the video on the display device 11 of the “first main speaker” based on the classification information and the display information extracted by the process of step S22. A point is determined (second display point determination process). Details of the second display point determination process will be described later with reference to the flowchart shown in FIG. Thereby, the process of step S24 is completed, and the video display point determination process proceeds to the process of step S25.

ステップS25の処理では、映像表示制御部22が、ステップS22の処理により抽出された分類情報及び表示情報に基づいて、「第2の主要発言者」の表示装置11に映像を表示する出席者の地点を決定する(第3表示地点決定処理)。この第3表示地点決定処理の詳細については、図13に示すフローチャートを参照して後述する。これにより、ステップS25の処理は完了し、一連の映像表示地点決定処理は完了する。
〔第1表示地点決定処理〕
次に、図11に示すフローチャートを参照して、上記ステップS23の第1表示地点決定処理について詳しく説明する。
In the process of step S25, the video display control unit 22 displays the video on the display device 11 of the “second main speaker” based on the classification information and the display information extracted by the process of step S22. A point is determined (third display point determination process). The details of the third display point determination process will be described later with reference to the flowchart shown in FIG. Thereby, the process of step S25 is completed and a series of video display point determination processes are completed.
[First display point determination process]
Next, the first display spot determination process in step S23 will be described in detail with reference to the flowchart shown in FIG.

図11に示すフローチャートは、ステップS22の処理が完了したタイミングで開始となり、第1表示地点決定処理はステップS31の処理に進む。   The flowchart shown in FIG. 11 starts at the timing when the process of step S22 is completed, and the first display point determination process proceeds to the process of step S31.

ステップS31の処理では、映像表示制御部22が、ステップS22の処理により抽出された表示情報に基づいて、「第1の主要発言者」の映像が表示されている画面領域(左画面領域31又は右画面領域32)を検出する。これにより、ステップS31の処理は完了し、第1表示地点決定処理はステップS32の処理に進む。   In the process of step S31, the video display control unit 22 displays the screen area (the left screen area 31 or the video image of the “first main speaker”) based on the display information extracted by the process of step S22. The right screen area 32) is detected. Thereby, the process of step S31 is completed and a 1st display point determination process progresses to the process of step S32.

ステップS32の処理では、映像表示制御部22が、ステップS31の処理により検出された画面領域とは反対の画面領域に「第2の主要発言者」の映像を表示するように表示画面を設定する。これにより、ステップS32の処理は完了し、第1表示地点決定処理はステップS33の処理に進む。   In the process of step S32, the video display control unit 22 sets the display screen so that the video of “second main speaker” is displayed in the screen area opposite to the screen area detected by the process of step S31. . Thereby, the process of step S32 is completed and a 1st display point determination process progresses to the process of step S33.

ステップS33の処理では、映像表示制御部22が、ステップS32の処理により「第2の主要発言者」の映像を表示する画面と設定された画面領域とは反対の画面領域に「第1の主要発言者」の映像を表示するように表示画面を設定する。これにより、ステップS33の処理は完了し、第1表示地点決定処理はステップS34の処理に進む。   In the process of step S33, the video display control unit 22 displays “first main speaker” in a screen area opposite to the screen area that is set to the screen that displays the video of “second main speaker” in the process of step S32. Set the display screen to display the "Speaker" video. Thereby, the process of step S33 is completed, and the first display point determination process proceeds to the process of step S34.

ステップS34の処理では、映像表示制御部22が、ステップS32,S33の処理結果に基づいて、「他地点」にいる出席者として分類されている出席者の表示情報(属性情報)を更新する。これにより、ステップS34の処理は完了し、一連の第1表示地点決定処理は終了する。
〔第2表示地点決定処理〕
次に、図12に示すフローチャートを参照して、上記ステップS24の第2表示地点決定処理について詳しく説明する。
In the process of step S34, the video display control unit 22 updates the display information (attribute information) of attendees classified as attendees at “other locations” based on the processing results of steps S32 and S33. Thereby, the process of step S34 is completed and a series of 1st display point determination processes are complete | finished.
[Second display point determination process]
Next, the second display spot determination process in step S24 will be described in detail with reference to the flowchart shown in FIG.

図12に示すフローチャートは、ステップS23の処理が完了したタイミングで開始となり、第2表示地点決定処理はステップS41の処理に進む。   The flowchart shown in FIG. 12 starts at the timing when the process of step S23 is completed, and the second display point determination process proceeds to the process of step S41.

ステップS41の処理では、映像表示制御部22が、ステップS22の処理により抽出された表示情報に基づいて、「第2の主要発言者」の映像が表示されている画面領域(左画面領域31又は右画面領域32)を検出する。これにより、ステップS41の処理は完了し、第2表示地点決定処理はステップS42の処理に進む。   In the process of step S41, the video display control unit 22 displays the screen area (the left screen area 31 or the video image of the “second main speaker”) based on the display information extracted by the process of step S22. The right screen area 32) is detected. Thereby, the process of step S41 is completed and the second display point determination process proceeds to the process of step S42.

ステップS42の処理では、映像表示制御部22が、ステップS41の処理により検出された画面領域とは反対の画面領域に「第2の主要発言者」の映像を表示するように表示画面を設定する。これにより、ステップS42の処理は完了し、第2表示地点決定処理はステップS43の処理に進む。   In the process of step S42, the video display control unit 22 sets the display screen to display the video of “second main speaker” in the screen area opposite to the screen area detected by the process of step S41. . Thereby, the process of step S42 is completed and a 2nd display point determination process progresses to the process of step S43.

ステップS43の処理では、映像表示制御部22が、ステップS42の処理により「第2の主要発言者」の映像を表示する画面と設定された画面領域とは反対の画面領域に「デフォルト地点」にいる出席者の映像を表示するように表示画面を設定する。これにより、ステップS43の処理は完了し、第2表示地点決定処理はステップS44の処理に進む。   In the process of step S43, the video display control unit 22 sets the screen that displays the video of “second main speaker” in the process of step S42 to the “default location” in the screen area opposite to the set screen area. Set the display screen to display the attendee's video. Thereby, the process of step S43 is completed, and the second display point determination process proceeds to the process of step S44.

ステップS44の処理では、映像表示制御部22が、ステップS42,S43の処理結果に基づいて、「第1の主要発言者」に分類されている出席者の表示情報(属性情報)を更新する。これにより、ステップS44の処理は完了し、一連の第2表示地点決定処理は終了する。
〔第3表示地点決定処理〕
次に、図13に示すフローチャートを参照して、上記ステップS25の第3表示地点決定処理について詳しく説明する。
In the process of step S44, the video display control unit 22 updates the display information (attribute information) of attendees classified as “first main speaker” based on the processing results of steps S42 and S43. Thereby, the process of step S44 is completed and a series of 2nd display point determination processes are complete | finished.
[Third display point determination process]
Next, the third display point determination process in step S25 will be described in detail with reference to the flowchart shown in FIG.

図13に示すフローチャートは、ステップS24の処理が完了したタイミングで開始となり、第3表示地点決定処理はステップS51の処理に進む。   The flowchart shown in FIG. 13 starts at the timing when the process of step S24 is completed, and the third display point determination process proceeds to the process of step S51.

ステップS51の処理では、映像表示制御部22が、ステップS22の処理により抽出された表示情報に基づいて、「第1の主要発言者」の映像が表示されている画面領域(左画面領域31又は右画面領域32)を検出する。これにより、ステップS51の処理は完了し、第3表示地点決定処理はステップS52の処理に進む。   In the process of step S51, the video display control unit 22 displays the screen area (the left screen area 31 or the video image of the “first main speaker”) based on the display information extracted by the process of step S22. The right screen area 32) is detected. Thereby, the process of step S51 is completed, and the third display point determination process proceeds to the process of step S52.

ステップS52の処理では、映像表示制御部22が、ステップS51の処理により検出された画面領域とは反対の画面領域に「第1の主要発言者」の映像を表示するように表示画面を設定する。これにより、ステップS52の処理は完了し、第3表示地点決定処理はステップS53の処理に進む。   In the process of step S52, the video display control unit 22 sets the display screen so that the video of “first main speaker” is displayed in the screen area opposite to the screen area detected by the process of step S51. . Thereby, the process of step S52 is completed, and the third display point determination process proceeds to the process of step S53.

ステップS53の処理では、映像表示制御部22が、ステップS52の処理により「第1の主要発言者」の映像を表示する画面と設定された画面領域に対して反対の画面領域に「デフォルト地点」にいる出席者の映像を表示するように表示画面を設定する。これにより、ステップS53の処理は完了し、第3表示地点決定処理はステップS54の処理に進む。   In the process of step S53, the video display control unit 22 sets “default point” in the screen area opposite to the screen area set as the screen displaying the video of “first main speaker” by the process of step S52. Set the display screen to display the video of attendees in Thereby, the process of step S53 is completed, and the third display point determination process proceeds to the process of step S54.

ステップS54の処理では、映像表示制御部22が、ステップS52,S53の処理結果に基づいて、「第2の主要発言者」に分類されている出席者の表示情報(属性情報)を更新する。これにより、ステップS54の処理は完了し、一連の第3表示地点決定処理は終了する。
〔映像特定処理〕
次に、図14に示すフローチャートを参照して、上記ステップS6の映像特定処理について詳しく説明する。
In the process of step S54, the video display control unit 22 updates the display information (attribute information) of attendees classified as “second main speaker” based on the processing results of steps S52 and S53. Thereby, the process of step S54 is completed and a series of 3rd display point determination processes are complete | finished.
[Video specific processing]
Next, the video specifying process in step S6 will be described in detail with reference to the flowchart shown in FIG.

図14に示すフローチャートは、ステップS5の処理が完了したタイミングで開始となり、映像表示地点決定処理はステップS61の処理に進む。   The flowchart shown in FIG. 14 starts at the timing when the process of step S5 is completed, and the video display point determination process proceeds to the process of step S61.

ステップS61の処理では、映像表示制御部22が、各出席者の属性情報を読み出す。これにより、ステップS61の処理は完了し、映像特定処理はステップS61の処理に進む。   In the process of step S61, the video display control unit 22 reads the attribute information of each attendee. Thereby, the process of step S61 is completed, and the video specifying process proceeds to the process of step S61.

ステップS62の処理では、映像表示制御部22が、ステップS61の処理により読み出された属性情報から各出席者の分類情報,元分類情報、及び表示情報を抽出する。これにより、ステップS62の処理は完了し、映像特定処理はステップS63の処理に進む。   In the process of step S62, the video display control unit 22 extracts the classification information, the original classification information, and the display information of each attendee from the attribute information read out in the process of step S61. Thereby, the process of step S62 is completed, and the video specifying process proceeds to the process of step S63.

ステップS63の処理では、映像表示制御部22が、「第2の主要発言者」の映像が表示される「他地点」の表示装置11の画面領域と同じ側にある撮像装置により撮影された「第2の主要発言者」の映像を、「第1の主要発言者」の表示装置11に表示する「第2の主要発言者」の映像に設定する。これにより、ステップS63の処理は完了し、映像特定処理はステップS64の処理に進む。   In the process of step S <b> 63, the video display control unit 22 is photographed by the imaging device on the same side as the screen area of the display device 11 of “other point” on which the video of “second main speaker” is displayed. The video of “second main speaker” is set to the video of “second main speaker” displayed on display device 11 of “first main speaker”. Thereby, the process of step S63 is completed, and the video specifying process proceeds to the process of step S64.

ステップS64の処理では、映像表示制御部22が、「第1の主要発言者」の映像が表示される「他地点」の表示装置11の画面領域と同じ側にある撮像装置により撮影された「第1の主要発言者」の映像を、「第2の主要発言者」の表示装置11に表示する「第1の主要発言者」の映像に設定する。これにより、ステップS64の処理は完了し、映像特定処理はステップS65の処理に進む。   In the process of step S <b> 64, the video display control unit 22 is photographed by the imaging device on the same side as the screen area of the display device 11 of “other point” on which the video of “first main speaker” is displayed. The video of “first main speaker” is set to the video of “first main speaker” displayed on display device 11 of “second main speaker”. Thereby, the process of step S64 is completed and the video specifying process proceeds to the process of step S65.

ステップS65の処理では、映像表示制御部22が、「第2の主要発言者」の映像が表示される「他地点」の表示装置11の画面領域と同じ側にある撮像装置により撮影された「第1の主要発言者」の映像を、「他地点」の表示装置11に表示する「第1の主要発言者」の映像に設定する。これにより、ステップS65の処理は完了し、映像特定処理はステップS66の処理に進む。   In the process of step S65, the video display control unit 22 is photographed by the imaging device on the same side as the screen area of the display device 11 of “other point” on which the video of “second main speaker” is displayed. The video of “first main speaker” is set to the video of “first main speaker” displayed on display device 11 of “other location”. Thereby, the process of step S65 is completed, and the video specifying process proceeds to the process of step S66.

ステップS66の処理では、映像表示制御部22が、「第1の主要発言者」の映像が表示される「他地点」の表示装置11の画面領域と同じ側にある撮像装置により撮影された「第2の主要発言者」の映像を、「他地点」の表示装置11に表示する「第2の主要発言者」の映像に設定する。これにより、ステップS66の処理は完了し、映像特定処理はステップS67の処理に進む。   In the process of step S <b> 66, the video display control unit 22 is photographed by the imaging device on the same side as the screen area of the display device 11 of “other point” on which the video of “first main speaker” is displayed. The video of “second main speaker” is set to the video of “second main speaker” displayed on display device 11 of “other location”. Thereby, the process of step S66 is completed, and the video specifying process proceeds to the process of step S67.

ステップS67の処理では、映像表示制御部22が、ステップS62の処理により抽出された分類情報に基づいて、「デフォルト地点」にいる出席者として分類された出席者を検出する。これにより、ステップS67の処理は完了し、映像特定処理はステップS68の処理に進む。   In the process of step S67, the video display control unit 22 detects the attendees classified as attendees at the “default location” based on the classification information extracted by the process of step S62. Thereby, the process of step S67 is completed, and the video specifying process proceeds to the process of step S68.

ステップS68の処理では、映像表示制御部22が、「第1の主要発言者」の映像が表示される「他地点」の表示装置11の画面領域と同じ側にある撮像装置により撮影された「デフォルト地点」にいる出席者の映像を、「第1の主要発言者」の表示装置11に表示する「デフォルト地点」にいる出席者の映像に設定する。これにより、ステップS68の処理は完了し、映像特定処理はステップS69の処理に進む。   In the process of step S <b> 68, the video display control unit 22 is photographed by the imaging device on the same side as the screen area of the display device 11 of “other point” on which the video of “first main speaker” is displayed. The video of the attendee at the “default location” is set to the video of the attendee at the “default location” displayed on the display device 11 of the “first main speaker”. Thereby, the process of step S68 is completed and the video specifying process proceeds to the process of step S69.

ステップS69の処理では、映像表示制御部22が、「第2の主要発言者」の映像が表示される「他地点」の表示装置11の画面領域と同じ側にある撮像装置により撮影された「デフォルト地点」にいる出席者の映像を、「第2の主要発言者」の表示装置11に表示する「デフォルト地点」にいる出席者の映像に設定する。これにより、ステップS68の処理は完了し、映像特定処理はステップS69の処理に進む。   In the process of step S <b> 69, the video display control unit 22 is photographed by the imaging device on the same side as the screen area of the display device 11 of “other point” where the video of “second main speaker” is displayed. The video of the attendee at the “default location” is set as the video of the attendee at the “default location” displayed on the display device 11 of the “second main speaker”. Thereby, the process of step S68 is completed and the video specifying process proceeds to the process of step S69.

ステップS70の処理では、映像表示制御部22が、「第1の主要発言者」,「第2の主要発言者」,及び「デフォルト地点」にいる出席者以外の出席者の両側にある撮像装置により撮影された映像を、「第1の主要発言者」及び「第2の主要発言者」の表示装置11の下画面領域33に表示する出席者の映像に設定する。これにより、ステップS70の処理は完了し、映像特定処理はステップS71の処理に進む。   In the process of step S70, the image display control unit 22 has the imaging devices on both sides of the attendees other than the attendees at the “first main speaker”, the “second main speaker”, and the “default location”. Is set as the attendee's video to be displayed in the lower screen area 33 of the display device 11 of “first main speaker” and “second main speaker”. Thereby, the process of step S70 is completed, and the video specifying process proceeds to the process of step S71.

ステップS71の処理では、映像表示制御部22が、「第1の主要発言者」,「第2の主要発言者」,及び「他地点n」にいる出席者以外の出席者の両側にある撮像装置により撮影された映像を、「他地点n」の表示装置11の下画面領域33に表示する出席者の映像に設定する。これにより、ステップS71の処理は完了し、一連の映像特定処理は終了する。   In the process of step S71, the video display control unit 22 captures images on both sides of attendees other than the attendees at the “first main speaker”, the “second main speaker”, and the “other point n”. The video shot by the device is set as the video of the attendee to be displayed in the lower screen area 33 of the display device 11 of “other point n”. Thereby, the process of step S71 is completed, and a series of video specifying processes ends.

〔情報送信処理〕
最後に、図15に示すフローチャートを参照して、ステップS8の情報送信処理について詳しく説明する。
[Information transmission processing]
Finally, the information transmission process in step S8 will be described in detail with reference to the flowchart shown in FIG.

図15に示すフローチャートは、ステップS6,7の処理が完了したタイミングで開始となり、情報送信処理はステップS81の処理に進む。   The flowchart shown in FIG. 15 starts at the timing when the processes in steps S6 and S7 are completed, and the information transmission process proceeds to the process in step S81.

ステップS81の処理では、映像表示制御部22が、各出席者の撮像装置12の左カメラ12a及び右カメラ12bにより撮影された映像を受信する。これにより、ステップS81の処理は完了し、情報送信処理はステップS82の処理に進む。   In the process of step S81, the video display control unit 22 receives videos taken by the left camera 12a and the right camera 12b of the imaging device 12 of each attendee. Thereby, the process of step S81 is completed, and the information transmission process proceeds to the process of step S82.

ステップS82の処理では、映像表示制御部22が、ステップS6の処理により設定された情報とステップS7の処理により取得された発言率の情報を取得する。これにより、ステップS82の処理は完了し、情報送信処理はステップS83の処理に進む。   In the process of step S82, the video display control unit 22 acquires the information set by the process of step S6 and the information of the speech rate acquired by the process of step S7. Thereby, the process of step S82 is completed and the information transmission process proceeds to the process of step S83.

ステップS83の処理では、映像表示制御部22が、ステップS82の処理により取得した情報に基づいて、ステップS81の処理により受信した映像の中から各出席者の表示装置11に送信する映像を選択する。これにより、ステップS83の処理は完了し、情報送信処理はステップS84の処理に進む。   In the process of step S83, the video display control unit 22 selects a video to be transmitted to each attendee's display device 11 from the video received by the process of step S81, based on the information acquired by the process of step S82. . Thereby, the process of step S83 is completed, and the information transmission process proceeds to the process of step S84.

ステップS84の処理では、映像表示制御部22が、ステップS83の処理結果に基づいて、左映像領域31,右映像領域32,及び下映像領域33に表示する映像を発言率に関する情報と共に各出席者の表示装置11に送信する。具体的には、図16に示すように、他地点nの表示装置11の左画面領域31及び右画面領域32にそれぞれ「第1の主要発言者」及び「第2の主要発言者」の映像を表示する場合、映像表示制御部22は、「第2の主要発言者」(「第1の主要発言者」)の映像が表示されている右画面領域32(左画面領域31)と同じ側に設定されている右カメラ12b(左カメラ12a)により撮影された「第1の主要発言者」(「第2の主要発言者」)の映像を「第2に主要発言者」(第1の主要発言者)の表示装置11に表示する「第1の主要発言者」(「第2の主要発言者」)の映像として送信する。また他地点nが「デフォルト地点」でない場合、映像表示制御部22は、他地点nの左カメラ12a及び右カメラ12bにより撮影された映像を各地点に送信し、他地点nが「デフォルト地点」である場合には、「第1の主要発言者」の映像が表示されている左画面領域31と同じ側に設定されている左カメラ12aにより撮影された他地点nにいる出席者の映像を「第1の主要発言者」及び「第2の主要発言者」の表示装置11に表示する「デフォルト地点」にいる出席者の映像として送信する。これにより、ステップS84の処理は完了し、一連の情報送信処理は終了する。   In the process of step S84, the video display control unit 22 displays the video to be displayed in the left video area 31, the right video area 32, and the lower video area 33 together with information on the speech rate based on the processing result of step S83. To the display device 11. Specifically, as shown in FIG. 16, videos of “first main speaker” and “second main speaker” in the left screen region 31 and the right screen region 32 of the display device 11 at another point n, respectively. Is displayed on the same side as the right screen area 32 (left screen area 31) on which the video of “second main speaker” (“first main speaker”) is displayed. The video of the “first main speaker” (“second main speaker”) taken by the right camera 12b (left camera 12a) set to “second main speaker” (first It is transmitted as an image of “first main speaker” (“second main speaker”) displayed on the display device 11 of the main speaker. When the other point n is not the “default point”, the video display control unit 22 transmits the video shot by the left camera 12a and the right camera 12b at the other point n to each point, and the other point n is the “default point”. Is the video of the attendee at another point n taken by the left camera 12a set on the same side as the left screen area 31 on which the video of “first main speaker” is displayed. It is transmitted as an image of the attendee at the “default location” displayed on the display device 11 of “first main speaker” and “second main speaker”. Thereby, the process of step S84 is completed and a series of information transmission processes are completed.

以上の映像表示制御処理をより具体的に説明すると以下のようになる。いま地点A〜Fにいる出席者間でビデオ会議を行う場合を考える。初期化処理においてビデオ会議の主催者が出席者の主要順序を地点F,地点C,地点A,地点D,地点B,地点Eの順に設定したとすると、「第1の主要発言者」,「第2の主要発言者」,及び「デフォルト地点」にいる出席者は順に地点F,地点C,及び地点Aにいる出席者となる。従ってこの段階では、図17に示すように、他地点の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点C及び地点Fの出席者の映像が表示され、「第1の主要発言者」の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点A及び地点Cの出席者の映像が表示され、「第2の主要発言者」の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点F及び地点Aの出席者の映像が表示される。   The above video display control process will be described more specifically as follows. Consider a video conference between attendees at points A through F. If the organizer of the video conference sets the main order of attendees in the order of point F, point C, point A, point D, point B, and point E in the initialization process, “first main speaker”, “ The attendees at “second main speaker” and “default location” are the attendees at location F, location C, and location A in that order. Accordingly, at this stage, as shown in FIG. 17, the images of the attendees at the points C and F are displayed on the left screen region 31 and the right screen region 32 of the display device 11 at another point, respectively. In the left screen area 31 and the right screen area 32 of the “speaker” display device 11, the images of the attendees at the points A and C are displayed, respectively, and the left screen region of the “second main speaker” display device 11. In 31 and the right screen area 32, images of attendees at the points F and A are displayed, respectively.

次に、主要発言者が図17に示すように地点B→地点C→地点B→地点D→地点F→地点Aの順に変化したとすると、主要発言者が特定された段階で上述した出席者の分類(「第1の主要発言者」,「第2の主要発言者」,及び「デフォルト地点」にいる出席者)を元分類に置き換えた後、地点C及び地点Bにいる出席者をそれぞれ「第1の主要発言者」及び「第2の主要発言者」に分類する。そして他地点の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点C及び地点Bの出席者の映像が表示され、「第1の主要発言者」の表示位置は変化させないようにする。また「第1の主要発言者」(地点Cにいる出席者)の表示装置11の左画面領域31及び右画面領域32にはそれぞれ「第2の主要発言者」(地点Bにいる出席者)及び「デフォルト地点」にいる出席者(地点Dにいる出席者)の映像が表示され、「第2の主要発言者」(地点Bにいる出席者)の表示装置11の左画面領域31及び右画面領域32にはそれぞれ「デフォルト地点にいる出席者」及び「第1の主要発言者」の映像が表示される。なおこの場合、「デフォルト地点」は、「第1の主要発言者」と「第2の主要発言者」を除いた(望ましくは元分類情報において「第1の主要発言者」及び「デフォルト地点」にいる出席者に分類された出席者をさらに除いた)出席者の中で主要順序が最も高い出席者がいる地点を示す。   Next, assuming that the main speaker changes in the order of point B → point C → point B → point D → point F → point A as shown in FIG. 17, the attendee described above at the stage where the main speaker is specified. After replacing the category of (the first primary speaker, the second primary speaker, and the attendees at the default location) with the original classification, the attendees at location C and location B were each It is classified into “first main speaker” and “second main speaker”. The video images of the attendees at the points C and B are displayed on the left screen region 31 and the right screen region 32 of the display device 11 at other points, respectively, so that the display position of the “first main speaker” is not changed. To do. In addition, in the left screen area 31 and the right screen area 32 of the display device 11 of the “first main speaker” (the attendee at the point C), a “second main speaker” (the attendee at the point B), respectively. And the video of the attendee at the “default location” (the attendee at the location D) is displayed, and the left screen area 31 and the right of the display device 11 of the “second main speaker” (the attendee at the location B) In the screen area 32, images of “attendees at the default location” and “first main speaker” are displayed. In this case, the “default point” excludes “first main speaker” and “second main speaker” (preferably “first main speaker” and “default point” in the original classification information). (Excluding attendees categorized as attendees in) (showing the location of the attendee with the highest primary order among attendees).

次に、主要発言者が地点Bにいる出席者から地点Cにいる出席者に変化した場合、主要発言者が変化したタイミングで、主要発言者が地点Bにいる出席者である時の分類情報を元分類に置き換えた後、地点B及び地点Cにいる出席者をそれぞれ「第1の主要発言者」及び「第2の主要発言者」に分類する。そして他地点の表示装置11の左画面領域31及び右画面領域32にはそれぞれ地点C及び地点Bの出席者の映像が表示される。また「第1の主要発言者」(地点Bにいる出席者)の表示装置11の左画面領域31及び右画面領域32にはそれぞれ「デフォルト地点」にいる出席者(地点Fにいる出席者)及び「第2の主要発言者」(地点Cにいる出席者)の映像が表示され、「第2の主要発言者」(地点Cにいる出席者)の表示装置11の左画面領域31及び右画面領域32にはそれぞれ「第1の主要発言者」及び「デフォルト地点にいる出席者」の映像が表示される。以下、同様の処理を繰り返す。   Next, when the main speaker changes from an attendee at point B to an attendee at point C, the classification information when the main speaker is an attendee at point B at the timing when the main speaker changes Is replaced with the original classification, and the attendees at point B and point C are classified as "first main speaker" and "second main speaker", respectively. In the left screen area 31 and the right screen area 32 of the display device 11 at another point, the images of the attendees at the point C and the point B are displayed, respectively. The left screen region 31 and the right screen region 32 of the display device 11 of the “first main speaker” (the attendee at the point B) each have an attendee at the “default point” (the attendee at the point F). And the video of the “second main speaker” (the attendee at the point C) is displayed, and the left screen region 31 and the right of the display device 11 of the “second main speaker” (the attendee at the point C) In the screen area 32, images of “first main speaker” and “attendees at the default location” are displayed. Thereafter, the same processing is repeated.

以上の説明から明らかなように、本発明の実施形態となるビデオ会議システム1では、サーバ装置3の主要発言者判定部21が、ビデオ会議の主要発言者を判定し、サーバ装置3の映像表示制御部22が、主要発言者判定部21の判定結果に基づいて、「第1の主要発言者」と「第2の主要発言者」を特定する。そして映像表示制御部22は、「第1の主要発言者」と「第2の主要発言者」の映像が左右異なる位置に表示されるように「他地点」の表示装置11を制御し、「第2の主要発言者」の映像が「他地点」の表示装置11における「第2の主要発言者」の映像表示位置とは異なる左右位置に表示されるように「第1の主要発言者」がいる地点の表示装置11を制御し、「第1の主要発言者」の映像が「他地点」の表示装置11における「第1の主要発言者」の映像表示位置とは異なる左右位置に表示されるように「第2の主要発言者」がいる地点の表示装置11を制御する。   As is clear from the above description, in the video conference system 1 according to the embodiment of the present invention, the main speaker determination unit 21 of the server device 3 determines the main speaker of the video conference and displays the video on the server device 3. The control unit 22 identifies the “first main speaker” and the “second main speaker” based on the determination result of the main speaker determination unit 21. Then, the video display control unit 22 controls the display device 11 for “other points” so that the videos of the “first main speaker” and the “second main speaker” are displayed at different positions on the left and right. The “first main speaker” is displayed so that the video of the “second main speaker” is displayed at the left and right positions different from the video display position of the “second main speaker” on the display device 11 of “other points”. The display device 11 at the point where the sound is present is controlled, and the video of the “first main speaker” is displayed at the left and right positions different from the video display position of the “first main speaker” on the display device 11 of “other points”. In this manner, the display device 11 at the point where the “second main speaker” is present is controlled.

すなわち、本発明の実施形態となるビデオ会議システム1では、サーバ装置3の映像表示制御部22が、主要発言者判定部21により判定された主要発言者に基づいて、各地点の表示装置11に映像を表示する出席者を決定する。そしてこのような構成によれば、撮像装置の必要設置台数がビデオ会議の出席者数に依存しなくなるので、ビデオ会議を安価に行うことができる。また会議の途中で出席者が増加した場合であっても、増えた出席者分の撮像装置を必ずしも追加する必要がないので、ビデオ会議を円滑に進行することができる。また特殊な広視野角の曲面スクリーン等の特別な装置を用いることなく、主要発言者が向き合っている視線一致映像を他の出席者の表示装置11に表示させることができる。   That is, in the video conference system 1 according to the embodiment of the present invention, the video display control unit 22 of the server device 3 controls the display device 11 at each point based on the main speaker determined by the main speaker determination unit 21. Decide who attends to view the video. According to such a configuration, since the necessary number of installed image pickup devices does not depend on the number of attendees of the video conference, the video conference can be performed at a low cost. Even if the number of attendees increases during the conference, it is not always necessary to add imaging devices for the increased attendees, so that the video conference can proceed smoothly. Further, it is possible to display the line-of-sight matching video in which the main speaker faces the other attendee's display device 11 without using a special device such as a curved screen with a special wide viewing angle.

また本発明の実施形態となるビデオ会議システム1では、映像表示制御部22は、主要発言者が変化した場合、「第2の主要発言者」の映像を新たな主要発言者の映像に置き換えるように「他地点」の表示装置11を制御する。このような構成によれば、主要発言者が変化したとしても、主要発言者が変化する前の「第1の主要発言者」の映像は同じ位置に表示されるので、出席者の表示位置の変化が小さくなり、ビデオ会議を円滑に進行させることができる。   In the video conference system 1 according to the embodiment of the present invention, the video display control unit 22 replaces the video of the “second main speaker” with the video of the new main speaker when the main speaker changes. The “other point” display device 11 is controlled. According to such a configuration, even if the main speaker changes, the video of the “first main speaker” before the main speaker changes is displayed at the same position. The change is reduced and the video conference can proceed smoothly.

また本発明の実施形態となるビデオ会議システム1では、主要発言者判定部21は、ビデオ会議に出席している出席者の発話音量に基づいて、ビデオ会議の主要発言者を判定するので、主要発言者を正確に判定することができる。また本発明の実施形態となるビデオ会議システム1では、主要発言者判定部21は、ビデオ会議の会議時間中に占める各出席者の発言時間の割合を各出席者の発言率として算出し、映像表示制御部22は、表示装置11に映像を表示する出席者の発言率に関する情報を主要発言者特定部21から取得し、取得した発言率に関する情報を出席者の映像と共に表示するように表示装置11を制御するので、出席者の発言を予想及び比較することが可能となり、操作者が適切な行動が行うことが可能となる。   In the video conference system 1 according to the embodiment of the present invention, the main speaker determination unit 21 determines the main speaker of the video conference based on the utterance volume of the attendee attending the video conference. The speaker can be accurately determined. Further, in the video conference system 1 according to the embodiment of the present invention, the main speaker determination unit 21 calculates the ratio of the speaking time of each attendee during the conference time of the video conference as the speaking rate of each attendee, and the video The display control unit 22 acquires information on the speech rate of the attendee who displays the video on the display device 11 from the main speaker specifying unit 21, and displays the acquired information on the speech rate together with the video of the attendee. 11, it is possible to predict and compare the attendees' statements, and the operator can take appropriate actions.

また本発明の実施形態となるビデオ会議システム1では、撮像装置は、左カメラ12a及び右カメラ12bは、表示装置11に表示されている2人の出席者の映像のうちの一方の映像を見ている時の操作者の視線方向と右カメラ12bの撮像方向がなす角度βが、視線方向と左カメラ12aの撮像方向がなす角度θの少なくとも2倍以上、且つ、60度以上乃至90度以下の範囲内になる位置に配置されているので、主要発言者が向き合っている視線一致映像を正確に撮影することができる。   In the video conference system 1 according to the embodiment of the present invention, the imaging device is such that the left camera 12a and the right camera 12b view one of the images of the two attendees displayed on the display device 11. The angle β formed by the operator's line-of-sight direction and the imaging direction of the right camera 12b is at least twice the angle θ formed by the line-of-sight direction and the imaging direction of the left camera 12a, and 60 degrees or more and 90 degrees or less. Therefore, it is possible to accurately shoot a line-of-sight image in which the main speaker is facing.

以上、本発明者によってなされた発明を適用した実施の形態について説明したが、この実施の形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち上記実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等は全て本発明の範疇に含まれる。   As mentioned above, although embodiment which applied the invention made | formed by this inventor was demonstrated, this invention is not limited with the description and drawing which make a part of indication of this invention by this embodiment. That is, other embodiments, examples, operational techniques, and the like made by those skilled in the art based on the above-described embodiments are all included in the scope of the present invention.

1 ビデオ会議システム
2 ビデオ会議端末装置
3 サーバ装置
4 電気通信回線
11 表示装置
12 撮像装置
12a 左カメラ
12b 右カメラ
21 主要発言者判定部
22 映像表示制御部
31 左画面領域
32 右画面領域
33 下画面領域
34,35 発言率表示領域
41 音量検出部
42 音量履歴記憶部
43 主要発言者特定部
44 発言時間計算部
DESCRIPTION OF SYMBOLS 1 Video conference system 2 Video conference terminal device 3 Server apparatus 4 Electric communication line 11 Display apparatus 12 Imaging device 12a Left camera 12b Right camera 21 Main speaker determination part 22 Video display control part 31 Left screen area 32 Right screen area 33 Lower screen Areas 34 and 35 Speech rate display area 41 Volume detection unit 42 Volume history storage unit 43 Main speaker identification unit 44 Speech time calculation unit

特許第3587106号公報Japanese Patent No. 3587106

Claims (7)

ビデオ会議の出席者がいる地点毎に配置された複数のビデオ会議端末装置と、
電気通信回線を介して前記複数のビデオ会議端末装置に接続されたサーバ装置とを備え、
各ビデオ会議端末装置は、
少なくとも2地点の他の出席者の映像を左右異なる位置に表示する表示装置と、
前記表示装置の表示画面に対面する出席者の映像を撮影する撮像装置とを備え、
前記サーバ装置は、
前記ビデオ会議の主要発言者を判定する主要発言者判定部と、
前記表示装置が表示する出席者の映像を制御する映像表示制御部とを備え、
前記映像表示制御部は、
前記主要発言者判定部の判定結果に基づいて第1及び第2の主要発言者を特定し、
前記撮像装置により撮影された前記第1の主要発言者と前記第2の主要発言者の映像が左右異なる位置に表示されるように、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置を制御し、
前記撮像装置により撮影された前記第2の主要発言者の映像が、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、前記第2の主要発言者の映像表示位置とは異なる左右位置に表示されるように、前記第1の主要発言者がいる地点の表示装置を制御し、
前記撮像装置により撮影された前記第1の主要発言者の映像が、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、前記第1の主要発言者の映像表示位置とは異なる左右位置に表示されるように、前記第2の主要発言者がいる地点の表示装置を制御すること
を特徴とするビデオ会議システム。
A plurality of video conference terminal devices arranged at each point where the attendees of the video conference are present;
A server device connected to the plurality of video conference terminal devices via a telecommunication line,
Each video conference terminal device
A display device for displaying images of other attendees at least at two different positions on the left and right;
An imaging device for capturing images of attendees facing the display screen of the display device,
The server device
A main speaker determination unit for determining a main speaker of the video conference;
A video display control unit for controlling the video of attendees displayed by the display device,
The video display control unit
Identifying the first and second main speakers based on the determination result of the main speaker determination unit,
Attendees other than the first and second main speakers such that the images of the first main speaker and the second main speaker captured by the imaging device are displayed at different positions on the left and right. Control the display device at the point where
The video of the second main speaker taken at the display device at the point where the attendees other than the first and second main speakers are present is the video of the second main speaker captured by the imaging device. Controlling the display device at the point where the first main speaker is located so that the left and right positions are different from the display position;
The video of the first main speaker taken at the display device at the point where the attendees other than the first and second main speakers are present is the video of the first main speaker captured by the imaging device. A video conference system, wherein a display device at a point where the second main speaker is located is controlled so as to be displayed at a left and right position different from a display position.
前記映像表示制御部は、前記主要発言者判定部の判定結果に基づいて主要発言者が変化したか否かを判別し、主要発言者が変化した場合、前記第2の主要発言者の映像を新たな主要発言者の映像に置き換えるように前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置を制御することを特徴とする請求項1に記載のビデオ会議システム。   The video display control unit determines whether or not the main speaker has changed based on the determination result of the main speaker determination unit. If the main speaker has changed, the video display control unit displays the video of the second main speaker. 2. The video conference system according to claim 1, wherein a display device at a point where attendees other than the first and second main speakers are present is controlled so as to be replaced with a video of a new main speaker. 前記主要発言者判定部は、前記ビデオ会議に出席している出席者の発話音量に基づいて、前記ビデオ会議の主要発言者を判定することを特徴とする請求項1又は請求項2に記載のビデオ会議システム。   The said main speaker determination part determines the main speaker of the said video conference based on the utterance volume of the participant who attends the said video conference, The Claim 1 or Claim 2 characterized by the above-mentioned. Video conferencing system. 前記主要発言者判定部は、前記ビデオ会議の会議時間中に占める各出席者の発言時間の割合を各出席者の発言率として算出し、前記映像表示制御部は、前記表示装置に映像を表示する出席者の発言率に関する情報を前記主要発言者判定部から取得し、取得した発言率に関する情報を出席者の映像と共に表示するように前記表示装置を制御することを特徴とする請求項1乃至請求項3のうち、いずれか1項に記載のビデオ会議システム。   The main speaker determination unit calculates a speech rate of each attendee during the meeting time of the video conference as a speech rate of each attendee, and the video display control unit displays a video on the display device. The information about the speaking rate of the attending attendee is acquired from the main speaker determining unit, and the display device is controlled to display the acquired information regarding the speaking rate together with the video of the attendee. The video conference system according to claim 3. 前記撮像装置は、第1の撮像方向から出席者の映像を撮影する第1の撮像装置と第2の撮像方向から出席者の映像を撮影する第2の撮像装置とを備え、前記第1及び第2の撮像装置は、前記表示装置に表示されている2人の出席者の映像のうちの一方の映像を見ている時の操作者の視線方向と第1の撮像方向がなす角度が、当該視線方向と第2の撮像方向がなす角度の少なくとも2倍以上、且つ、60度以上乃至90度以下の範囲内になる位置に配置されていることを特徴とする請求項1乃至請求項4のうち、いずれか1項に記載のビデオ会議システム。   The imaging device includes a first imaging device that captures an attendee's video from a first imaging direction and a second imaging device that captures an attendee's video from a second imaging direction. The second imaging device has an angle formed by the operator's line-of-sight direction and the first imaging direction when viewing one of the two attendee images displayed on the display device. 5. The apparatus according to any one of claims 1 to 4, wherein the lens is disposed at a position that is at least twice as large as an angle formed by the line-of-sight direction and the second imaging direction and within a range of 60 degrees to 90 degrees. The video conference system according to any one of the above. 複数の地点にいるビデオ会議の出席者の中からビデオ会議の主要発言者を判定する主要発言者判定部と、
前記ビデオ会議の出席者がいる地点毎に配置された表示装置に表示させる出席者の映像を制御する映像表示制御部とを備え、
前記映像表示制御部は、
前記主要発言者判定部の判定結果に基づいて第1及び第2の主要発言者を特定し、
前記第1の主要発言者と前記第2の主要発言者の映像が左右異なる位置に表示されるように、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置を制御し、
前記第2の主要発言者の映像が、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、前記第2の主要発言者の映像表示位置とは異なる左右位置に表示されるように、前記第1の主要発言者がいる地点の表示装置を制御し、
前記第1の主要発言者の映像が、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、前記第1の主要発言者の映像表示位置とは異なる左右位置に表示されるように、前記第2の主要発言者がいる地点の表示装置を制御すること
を特徴とするサーバ装置。
A main speaker determination unit that determines a main speaker of a video conference from among video conference attendees at a plurality of points;
A video display control unit that controls the video of attendees to be displayed on a display device arranged at each point where the attendees of the video conference are present,
The video display control unit
Identifying the first and second main speakers based on the determination result of the main speaker determination unit,
A display device for a point where attendees other than the first and second main speakers are present so that the images of the first main speaker and the second main speaker are displayed at different positions on the left and right. Control
The left and right positions where the video of the second main speaker is different from the video display position of the second main speaker in a display device at a point where attendees other than the first and second main speakers are present The display device of the point where the first main speaker is located,
Left and right positions where the video of the first main speaker is different from the video display position of the first main speaker in a display device at a point where attendees other than the first and second main speakers are present The server device is characterized in that the display device at the point where the second main speaker is located is controlled so as to be displayed on the screen.
複数の地点にいるビデオ会議の出席者の中からビデオ会議の主要発言者を判定する主要発言者判定ステップと、
前記ビデオ会議の出席者がいる地点毎に配置された表示装置に表示させる出席者の映像を制御する映像表示制御ステップとをコンピュータに実行させ、
前記映像表示制御ステップは、
前記主要発言者判定ステップの結果に基づいて第1及び第2の主要発言者を特定するステップと、
前記第1の主要発言者と前記第2の主要発言者の映像が左右異なる位置に表示されるように、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置を制御するステップと、
前記第2の主要発言者の映像が、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、前記第2の主要発言者の映像表示位置とは異なる左右位置に表示されるように、前記第1の主要発言者がいる地点の表示装置を制御するステップと、
前記第1の主要発言者の映像が、前記第1及び前記第2の主要発言者以外の出席者がいる地点の表示装置における、前記第1の主要発言者の映像表示位置とは異なる左右位置に表示されるように、前記第2の主要発言者がいる地点の表示装置を制御するステップとを含むこと
を特徴とするビデオ会議プログラム。
A main speaker determination step for determining a video conference main speaker from video conference attendees at a plurality of points;
Causing the computer to execute a video display control step of controlling the video of the attendee to be displayed on a display device arranged at each point where the attendee of the video conference is present;
The video display control step includes:
Identifying first and second primary speakers based on the result of the primary speaker determination step;
A display device for a point where attendees other than the first and second main speakers are present so that the images of the first main speaker and the second main speaker are displayed at different positions on the left and right. Controlling step;
The left and right positions where the video of the second main speaker is different from the video display position of the second main speaker in a display device at a point where attendees other than the first and second main speakers are present Controlling a display device at the point where the first primary speaker is present, as shown in FIG.
Left and right positions where the video of the first main speaker is different from the video display position of the first main speaker in a display device at a point where attendees other than the first and second main speakers are present A video conferencing program comprising: controlling a display device at a point where the second main speaker is located so as to be displayed on the screen.
JP2009175274A 2009-07-28 2009-07-28 Video conference system, server device, and video conference program Expired - Fee Related JP5316286B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009175274A JP5316286B2 (en) 2009-07-28 2009-07-28 Video conference system, server device, and video conference program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009175274A JP5316286B2 (en) 2009-07-28 2009-07-28 Video conference system, server device, and video conference program

Publications (2)

Publication Number Publication Date
JP2011030063A true JP2011030063A (en) 2011-02-10
JP5316286B2 JP5316286B2 (en) 2013-10-16

Family

ID=43638240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009175274A Expired - Fee Related JP5316286B2 (en) 2009-07-28 2009-07-28 Video conference system, server device, and video conference program

Country Status (1)

Country Link
JP (1) JP5316286B2 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102244762A (en) * 2011-06-03 2011-11-16 深圳市东微智能科技有限公司 Camera tracking method and system used in conference system
CN102647578A (en) * 2011-02-17 2012-08-22 鸿富锦精密工业(深圳)有限公司 Video switching system and method
WO2013141405A1 (en) * 2012-03-19 2013-09-26 Ricoh Company, Limited Teleconference system and teleconference terminal
JP2016039600A (en) * 2014-08-11 2016-03-22 沖電気工業株式会社 Controller, control method, program, display, imaging device and video conference system
JP2016178355A (en) * 2015-03-18 2016-10-06 株式会社リコー Communication device, communication system, communication device control method, and program
JP2016189532A (en) * 2015-03-30 2016-11-04 日本電気株式会社 Video conference system, video conference controller, and video conference control method
JP2020005030A (en) * 2018-06-25 2020-01-09 シャープ株式会社 Information processing apparatus, information processing method, and program
JP7062126B1 (en) 2021-11-01 2022-05-02 株式会社バーチャルキャスト Terminals, information processing methods, programs, and recording media

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102453084B1 (en) 2018-04-17 2022-10-12 삼성전자주식회사 Electronic apparatus and method for controlling thereof

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06141310A (en) * 1992-10-23 1994-05-20 Arumetsukusu:Kk Video conference telephone system
JPH06351013A (en) * 1993-06-08 1994-12-22 Matsushita Electric Ind Co Ltd Electronic conference system
JPH07336660A (en) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd Video conference system
JPH09261608A (en) * 1996-03-27 1997-10-03 Nec Software Ltd Video conference terminal equipment and video conference image processor
JPH10112850A (en) * 1996-10-04 1998-04-28 Canon Inc Video conference system
JP2000333150A (en) * 1999-05-20 2000-11-30 Nec Corp Video conference system
JP2008147910A (en) * 2006-12-08 2008-06-26 Yamaha Corp Television conference apparatus

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06141310A (en) * 1992-10-23 1994-05-20 Arumetsukusu:Kk Video conference telephone system
JPH06351013A (en) * 1993-06-08 1994-12-22 Matsushita Electric Ind Co Ltd Electronic conference system
JPH07336660A (en) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd Video conference system
JPH09261608A (en) * 1996-03-27 1997-10-03 Nec Software Ltd Video conference terminal equipment and video conference image processor
JPH10112850A (en) * 1996-10-04 1998-04-28 Canon Inc Video conference system
JP2000333150A (en) * 1999-05-20 2000-11-30 Nec Corp Video conference system
JP2008147910A (en) * 2006-12-08 2008-06-26 Yamaha Corp Television conference apparatus

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647578A (en) * 2011-02-17 2012-08-22 鸿富锦精密工业(深圳)有限公司 Video switching system and method
CN102244762A (en) * 2011-06-03 2011-11-16 深圳市东微智能科技有限公司 Camera tracking method and system used in conference system
US9473741B2 (en) 2012-03-19 2016-10-18 Ricoh Company, Limited Teleconference system and teleconference terminal
WO2013141405A1 (en) * 2012-03-19 2013-09-26 Ricoh Company, Limited Teleconference system and teleconference terminal
JP2013197838A (en) * 2012-03-19 2013-09-30 Ricoh Co Ltd Remote conference system and remote conference terminal
CN104205816A (en) * 2012-03-19 2014-12-10 株式会社理光 Teleconference system and teleconference terminal
JP2016039600A (en) * 2014-08-11 2016-03-22 沖電気工業株式会社 Controller, control method, program, display, imaging device and video conference system
JP2016178355A (en) * 2015-03-18 2016-10-06 株式会社リコー Communication device, communication system, communication device control method, and program
JP2016189532A (en) * 2015-03-30 2016-11-04 日本電気株式会社 Video conference system, video conference controller, and video conference control method
JP2020005030A (en) * 2018-06-25 2020-01-09 シャープ株式会社 Information processing apparatus, information processing method, and program
JP7220525B2 (en) 2018-06-25 2023-02-10 シャープ株式会社 Information processing device, information processing method and program
JP7062126B1 (en) 2021-11-01 2022-05-02 株式会社バーチャルキャスト Terminals, information processing methods, programs, and recording media
WO2023074898A1 (en) * 2021-11-01 2023-05-04 株式会社ドワンゴ Terminal, information processing method, program, and recording medium
JP2023067360A (en) * 2021-11-01 2023-05-16 株式会社バーチャルキャスト Terminal, information processing method, program, and recording medium

Also Published As

Publication number Publication date
JP5316286B2 (en) 2013-10-16

Similar Documents

Publication Publication Date Title
JP5316286B2 (en) Video conference system, server device, and video conference program
CN110662083B (en) Data processing method and device, electronic equipment and storage medium
US10965909B2 (en) Image processing apparatus, camera apparatus, and image processing method
JP4770178B2 (en) Camera control apparatus, camera system, electronic conference system, and camera control method
US9473741B2 (en) Teleconference system and teleconference terminal
CN101150669A (en) Apparatus and method for photographing panoramic image
CN111083397B (en) Recorded broadcast picture switching method, system, readable storage medium and equipment
JP2019220848A (en) Data processing apparatus, data processing method and program
CN108986117B (en) Video image segmentation method and device
CN112788255A (en) Wireless screen projection method and device and screen projection host
WO2018061173A1 (en) Tv conference system, tv conference method, and program
JP2009246408A (en) Interaction device, image processing module, image processing method, and program
CN111246224A (en) Video live broadcast method and video live broadcast system
CN111163280B (en) Asymmetric video conference system and method thereof
CN114531564A (en) Processing method and electronic equipment
US9131109B2 (en) Information processing device, display control system, and computer program product
JP2006054830A (en) Image compression communication method and device
KR101665988B1 (en) Image generation method
CN113676693B (en) Picture presentation method, video conference system, and readable storage medium
JP3759216B2 (en) Television camera communication device and multipoint connection device
JP5157776B2 (en) Imaging direction control device, remote conference device, imaging direction control method, and imaging direction control program
JP4223922B2 (en) TV camera communication device
CN106301815B (en) Dynamic background sharing method and system based on voice chat room
EP4102825A1 (en) Image-capturing device, image-capturing method, and program
US20240119731A1 (en) Video framing based on tracked characteristics of meeting participants

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130624

R151 Written notification of patent or utility model registration

Ref document number: 5316286

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees