JP2007221437A - Remote conference system - Google Patents

Remote conference system Download PDF

Info

Publication number
JP2007221437A
JP2007221437A JP2006039428A JP2006039428A JP2007221437A JP 2007221437 A JP2007221437 A JP 2007221437A JP 2006039428 A JP2006039428 A JP 2006039428A JP 2006039428 A JP2006039428 A JP 2006039428A JP 2007221437 A JP2007221437 A JP 2007221437A
Authority
JP
Japan
Prior art keywords
imaging
information
remote
image
remote conference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006039428A
Other languages
Japanese (ja)
Inventor
Kishiki Miyazaki
貴識 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006039428A priority Critical patent/JP2007221437A/en
Publication of JP2007221437A publication Critical patent/JP2007221437A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a remote conference system in which an explainer can explain while grasping the whole atmosphere and the auditor of remote place and the auditor can listen with feeling of presence while viewing explainer's detail appearance of remote place. <P>SOLUTION: Auditor's reaction and aspect of a conference room photographed by a first imaging means 903 capable of taking a picture in omni-direction are displayed for an explainer, and the explainer's aspect photographed by a second imaging means 904 capable of taking a picture in a specified region is displayed for the auditor, so conference with feeling of presence can be carried out at remote places. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、複数の遠隔会議端末装置の間で通信回線を介して音声情報及び撮像情報により構成されるメディア情報と、画像情報及びテキスト情報により構成されるドキュメント情報を共有することにより複数の遠隔地間で会議を行う遠隔会議において、遠隔地間の説明者及び聴講者がより臨場感を持つことができる遠隔会議システムに関するものである。 The present invention provides a plurality of remote conference terminals by sharing media information composed of audio information and imaging information and document information composed of image information and text information via a communication line. The present invention relates to a teleconferencing system that allows a presenter and a listener in a remote location to have a more realistic sensation in a remote conference in which a conference is held between locations.

従来より、遠隔地間での会議やプレゼンテーション、又は教育等において、通信回線を介して遠隔地間で音声情報及び撮像情報により構成されるメディア情報と、画像情報及びテキスト情報により構成されるドキュメント情報を送受信し共有することにより実現する機器として、遠隔会議端末装置が用いられる。   Conventionally, in conferences, presentations, education, etc. between remote locations, media information consisting of audio information and imaging information between remote locations via a communication line, and document information consisting of image information and text information As a device realized by transmitting and receiving and sharing, a remote conference terminal device is used.

図2のようにこのような遠隔会議端末装置(2−1A〜C)を分散した複数の会議室(会議室A〜C)等に設置し、通信回線を介して複数の遠隔会議端末装置を接続することにより遠隔地間のユーザ(2−2A1〜3、2−2B1〜3、2−2C3)が会議やプレゼンテーション、又は教育等を実現していた。   As shown in FIG. 2, such remote conference terminal devices (2-1A to C) are installed in a plurality of conference rooms (conference rooms A to C) or the like, and a plurality of remote conference terminal devices are connected via communication lines. By connecting, users (2-2A1-3, 2-2B1-3, 2-2C3) between remote locations have realized meetings, presentations, education, and the like.

このような遠隔会議端末装置には、図3に示す大画面表示装置の画面上にタッチパネル等の入力検出手段を組み合わせ(302)、デジタイザやペン等(303)によりユーザ(301)が表示装置の画面上にテキストやイラスト(304)を描画することが可能であり、描画したデータが遠隔地間で共有され遠隔地間でホワイトボード共有を実現する装置も存在する(例えば、特許文献1参照)。   In such a remote conference terminal device, input detecting means such as a touch panel is combined on the screen of the large screen display device shown in FIG. 3 (302), and the user (301) uses the digitizer, pen, etc. (303). There is also an apparatus that can draw text and illustrations (304) on a screen, and that the drawn data is shared between remote locations and the whiteboard is shared between remote locations (see, for example, Patent Document 1). .

また、上記のように画像情報及びテキスト情報により構成されるドキュメント情報を共有すると共に、ユーザが表示装置の画面上に描画したテキストやイラストを共有し、さらには遠隔地間の映像情報及び音声情報を共有することでより臨場感を高め会議を行う装置も存在する(例えば、非特許文献1参照)。   In addition, document information composed of image information and text information as described above is shared, text and illustrations drawn on the screen of the display device by the user are shared, and video information and audio information between remote locations There is also an apparatus for performing a conference by increasing the sense of reality by sharing the information (for example, see Non-Patent Document 1).

また、遠隔地間で映像を共有するために撮像装置を使用するが、カメラの周囲360度、つまり全方位を撮像するとともに、任意の場所をパン、チルト及びズームにより詳細に撮像することが可能な撮像装置がある。   In addition, an imaging device is used to share images between remote locations, but 360 degrees around the camera, that is, all directions can be imaged, and any location can be imaged in detail by panning, tilting, and zooming There are various imaging devices.

上記の撮像装置を用いることにより、全方位カメラで周囲の様子を撮像するとともに、注目点をパン、チルト、ズームカメラにより詳細に撮像し閲覧することが可能である。   By using the above-described imaging device, it is possible to capture the surrounding situation with an omnidirectional camera, and to capture and browse the attention point in detail with a pan, tilt, and zoom camera.

図4に示すように全方位を撮像する方式としては、円錐ミラー、球面ミラー、双曲面ミラー等(401)を利用し撮像手段(402)により得られた円形の光学像をソフトウェア処理することで人が見やすい映像であるパノラマ映像や透視画像に変換する方法や、複数のカメラを利用し全方位を撮像しソフトウェア処理することで人が見やすい映像であるパノラマ映像に変換する方法等がある。   As shown in FIG. 4, the omnidirectional imaging method is to perform software processing on a circular optical image obtained by the imaging means (402) using a conical mirror, a spherical mirror, a hyperboloidal mirror, etc. (401). There are a method of converting to a panoramic image or a fluoroscopic image that is an image easy to see for humans, a method of converting to a panoramic image that is an image easy to see for humans by imaging all directions using a plurality of cameras and performing software processing.

また、全方位を撮像する手段(401、402)とパン、チルト及びズームにより詳細に撮像する手段(403、404)の中心軸と同一にすることにより、同じ視点で撮像することを実現する撮像装置もある(例えば、特許文献2参照)。   Further, imaging that realizes imaging from the same viewpoint by making it the same as the central axis of the means (401, 402) for imaging in all directions and the means (403, 404) for imaging in detail by panning, tilting, and zooming. There is also an apparatus (for example, refer to Patent Document 2).

特開2003−280817号公報JP 2003-280817 A 特開2003−259350号公報JP 2003-259350 A 「パイオニア株式会社 サイバーボード」2004年、http://wwwbsc.pioneer.co.jp/catalog/category/fset_cyberboard.html"Pioneer Corporation Cyber Board" 2004, http://wwwbsc.pioneer.co.jp/catalog/category/fset_cyberboard.html

しかしながら、特許文献1及び非特許文献1においては全方位カメラによる全方位映像に関する記載はない。また、非特許文献1の撮像装置として全方位カメラを使用したとしても、ユーザの状況に応じて遠隔地の全体を把握するための全方位カメラの映像と、部分的により詳細な状況を把握するためのパン、チルト、ズームカメラの映像を適切に表示することができなかった。   However, Patent Document 1 and Non-Patent Document 1 do not describe an omnidirectional video by an omnidirectional camera. In addition, even if an omnidirectional camera is used as the imaging device of Non-Patent Document 1, an image of an omnidirectional camera for grasping the entire remote location according to the user's situation and a partially more detailed situation are grasped. Therefore, the pan, tilt and zoom camera images could not be displayed properly.

このため、あたかも同一地点で会議を行うかのように遠隔地間においても臨場感がり使いやすい遠隔会議システムを実現することは困難であった。   For this reason, it has been difficult to realize a remote conference system that is realistic and easy to use even in remote locations as if a conference was held at the same point.

また、特許文献2においては監視用途のカメラであるため、全方位カメラにより撮像された全方位映像において動きがあった部分を詳細に撮像するために、パン、チルト、ズームカメラの制御を行う。   Further, since the camera is used for monitoring in Patent Document 2, pan, tilt, and zoom cameras are controlled in order to capture in detail the portion that has moved in the omnidirectional video captured by the omnidirectional camera.

しかしながら、遠隔会議や遠隔教育において当該撮像装置を使用した場合、パン、チルト、ズームカメラにより詳細に撮像し表示してもらいたい映像は必ずしも動きのある部分ではなく、説明者や発言者を詳細に撮像し表示することが求められる。そのため、遠隔会議システムにおいて使用する撮像装置としては適切ではなかった。   However, when the imaging device is used in a remote conference or distance learning, the video that you want to capture and display in detail with pan, tilt, and zoom cameras is not necessarily a moving part. It is required to image and display. Therefore, it was not suitable as an imaging device used in a remote conference system.

本発明は上述の点に鑑みてなされたものであり、説明者が遠隔地の聴講者及び全体の雰囲気を把握しながら説明でき、また聴講者は遠隔地の説明者の詳細な様子を閲覧しながら聴講することにより臨場感を持つことができる、遠隔会議システムを実現することを目的としている。   The present invention has been made in view of the above-mentioned points, and the presenter can explain the remote audience and the overall atmosphere while grasping the details of the remote presenter. The purpose is to realize a remote conference system that can give a sense of reality by listening to the lecture.

本発明の遠隔会議システムは、全方位の映像を撮像可能な第一の撮像手段と、パン、チルト及びズームにより任意の方向の詳細な映像を撮像可能な第二の撮像手段と、遠隔地の第一の撮像手段又は第二の撮像手段により撮像された撮像情報を表示すると共に画像情報及びテキスト情報により構成されるドキュメント情報を表示する表示手段と、表示手段が表示する撮像情報及びドキュメント情報の内容及びレイアウトを制御すると共に、遠隔地への撮像情報及びドキュメント情報の送信を制御する制御手段と、表示手段への入力操作を検出する入力手段と、音声入力手段と音声出力手段から構成される2つ以上の遠隔会議端末装置を用いて撮像情報及びドキュメント情報を共有することにより遠隔地と会議を行う遠隔会議システムにおいて、上記制御手段は上記入力手段及び音声入力手段の状態により異なる制御を行うことを特徴とする。   The remote conference system of the present invention includes a first imaging unit capable of capturing an omnidirectional image, a second imaging unit capable of capturing a detailed image in an arbitrary direction by panning, tilting, and zooming, A display unit that displays the imaging information captured by the first imaging unit or the second imaging unit and displays document information composed of image information and text information, and the imaging information and document information displayed by the display unit. The control unit is configured to control the contents and layout, and to control the transmission of imaging information and document information to a remote place, the input unit to detect an input operation to the display unit, the voice input unit, and the voice output unit. In a remote conference system for performing a conference with a remote place by sharing imaging information and document information using two or more remote conference terminal devices, Serial control means and performing different control depending on the state of said input means and voice input means.

本発明によれば、説明者は遠隔地の聴講者及び全体の雰囲気を把握しながら説明できる。
また、本発明によれば、聴講者は遠隔地の説明者の詳細な様子を閲覧しながら聴講することにより臨場感を持つことができる、遠隔会議システムを実現できる。
According to the present invention, the presenter can explain while grasping the remote audience and the overall atmosphere.
Further, according to the present invention, it is possible to realize a remote conference system in which the listener can have a sense of reality by listening while viewing the detailed state of the remote presenter.

以下、本発明による遠隔会議システムにおける制御方法の実施形態について図面を参照しながら説明する。   Hereinafter, an embodiment of a control method in a remote conference system according to the present invention will be described with reference to the drawings.

本実施形態におけるシステムは、複数の遠隔会議端末装置が同時にLAN及びWANで構成されるIPネットワーク網を介して接続されることにより遠隔会議を実現でき、遠隔会議端末装置の制御手段が撮像情報の表示を会議の状況に応じて適切に制御することにより遠隔会議システムにおける制御方法を実現するものである。   The system according to the present embodiment can realize a remote conference by simultaneously connecting a plurality of remote conference terminal devices via an IP network composed of a LAN and a WAN. A control method in the remote conference system is realized by appropriately controlling the display according to the status of the conference.

図1は本実施形態に係るネットワークの構成例を示すものである。メディア会議サーバ装置(1−1)や、会議制御サーバ装置(1−2)や、撮像装置(1−4A)〜(1−4B)が接続され通信機能を備えた遠隔会議端末装置(1−3A)〜(1−3B)がLAN及びWANで構成されるIPネットワーク網に接続された、遠隔会議システムの構成を示す図である。   FIG. 1 shows a configuration example of a network according to the present embodiment. Media conference server device (1-1), conference control server device (1-2), and remote conference terminal device (1-) equipped with a communication function to which imaging devices (1-4A) to (1-4B) are connected. It is a figure which shows the structure of the remote conference system connected to the IP network comprised by 3A)-(1-3B) by LAN and WAN.

遠隔会議端末装置(1−3A)〜(1−3B)の構成及び制御方法については後述する。   The configuration and control method of the remote conference terminal devices (1-3A) to (1-3B) will be described later.

メディア会議サーバ装置(1−1)は、複数の遠隔会議端末装置(1−3)から受信した音声情報及び撮像情報により構成されるメディア情報をミキシングし、ミキシングしたメディア情報を複数の遠隔会議端末装置(1−3)へ配信するものである。   The media conference server device (1-1) mixes media information composed of audio information and imaging information received from a plurality of remote conference terminal devices (1-3), and mixes the media information into a plurality of remote conference terminals. This is distributed to the device (1-3).

また遠隔会議端末装置(1−3)から受信した画像情報及びテキスト情報により構成されるドキュメント情報を複数の遠隔会議端末装置(1−3)へ配信する場合もある。   Further, document information composed of image information and text information received from the remote conference terminal device (1-3) may be distributed to a plurality of remote conference terminal devices (1-3).

会議制御サーバ装置(1−2)は、遠隔会議端末装置(1−3A)〜(1−3B)のIPアドレス等から構成される端末情報を管理し、遠隔会議端末装置(1−3A)〜(1−3B)の接続制御を行うものである。   The conference control server device (1-2) manages terminal information including the IP addresses of the remote conference terminal devices (1-3A) to (1-3B) and the remote conference terminal device (1-3A) to (1-3B) connection control is performed.

以下ではメディア会議サーバ装置(1−1)及び会議制御サーバ装置(1−2)を使用せずに遠隔会議端末装置(1−3A)と遠隔会議端末装置(1−3B)が直接接続し、上記メディア情報及び上記ドキュメント情報を送受信することにより遠隔会議を実現する方法について説明する。   In the following, the remote conference terminal device (1-3A) and the remote conference terminal device (1-3B) are directly connected without using the media conference server device (1-1) and the conference control server device (1-2). A method for realizing a remote conference by transmitting and receiving the media information and the document information will be described.

図5は本実施携帯における遠隔会議端末装置のハードウェア構成を示すブロック図である。遠隔会議端末装置(1−3)はCPU(5−1)、RAM(5−2)、ROM(5−3)、HDD(5−4)、ネットワークI/F(5−5)、入力機器I/F(5−6)、ディスプレイI/F(5−7)、撮像装置I/F(5−8)、音声入出力機器I/F(5−9)、キーボード(5−10)、デジタイザ(5−11)、ディスプレイ(5−12)、全方位撮像装置(5−13)、PTZ撮像装置(5−14)、音声入力装置(5−15)、音声出力機器(5−16)、バス(5−17)を具備している。   FIG. 5 is a block diagram showing a hardware configuration of the remote conference terminal device in this embodiment. The remote conference terminal device (1-3) includes a CPU (5-1), a RAM (5-2), a ROM (5-3), an HDD (5-4), a network I / F (5-5), and an input device. I / F (5-6), display I / F (5-7), imaging device I / F (5-8), audio input / output device I / F (5-9), keyboard (5-10), Digitizer (5-11), display (5-12), omnidirectional imaging device (5-13), PTZ imaging device (5-14), audio input device (5-15), audio output device (5-16) And a bus (5-17).

CPU(5−1)は遠隔会議端末装置全体の制御に加え、遠隔会議会議システムにおける制御方法を実現するプログラムデータが指示する処理を行う。   In addition to controlling the entire remote conference terminal device, the CPU (5-1) performs processing instructed by program data for realizing a control method in the remote conference system.

RAM(5−2)はRAM(Random Access Memory)であり、CPU(5−1)の動作に必要な作業メモリとして使用される。   A RAM (5-2) is a RAM (Random Access Memory) and is used as a work memory necessary for the operation of the CPU (5-1).

ROM(5−3)はROM(Read Only Memory)であり、CPU(5−1)に必要な命令やデータを格納する。   A ROM (5-3) is a ROM (Read Only Memory) and stores instructions and data necessary for the CPU (5-1).

HDD(5−4)はHDD(Hard Disk Drive)であり、遠隔会議システムにおける制御方法を実現するプログラムデータ自体を格納することに加え、遠隔会議システムにおける制御方法を実現するプログラムデータの動作に必要なユーザデータベース情報や端末情報等のデータの格納も行うものとする。   The HDD (5-4) is an HDD (Hard Disk Drive), which is necessary for the operation of the program data for realizing the control method in the remote conference system in addition to storing the program data itself for realizing the control method in the remote conference system. It is also assumed that data such as user database information and terminal information is stored.

ネットワークI/F(5−5)はネットワーク(5−18)に接続するための通信制御を処理するが、環境に応じて様々な通信インターフェースが適用される。   The network I / F (5-5) processes communication control for connecting to the network (5-18), but various communication interfaces are applied depending on the environment.

アクセス網に直接接続する場合は各種モデムやターミナルアダプタなどで構成され、外部装置のADSLモデムやケーブルモデムに接続する場合はイーサーネットインタフェースで構成される。   When connecting directly to the access network, it is composed of various modems and terminal adapters, and when connecting to an ADSL modem or cable modem of an external device, it is composed of an Ethernet interface.

入力機器I/F(5−6)は遠隔会議端末装置が具備するキーボード(5−10)、マウス、デジタイザ(5−11)、ペン入力装置等からの入力を処理するものであり、遠隔会議端末装置の操作に用いられるものである。   The input device I / F (5-6) processes input from a keyboard (5-10), a mouse, a digitizer (5-11), a pen input device, and the like included in the remote conference terminal device. It is used for the operation of the terminal device.

本実施形態では図5のようにディスプレイ(5−12)にタッチパネル等のデジタイザ(5−11)による入力操作を検出する手段を設けることにより、ディスプレイ(5−12)の画面へ直接操作することを可能にしている。   In the present embodiment, as shown in FIG. 5, the display (5-12) is provided with means for detecting an input operation by the digitizer (5-11) such as a touch panel, thereby directly operating the screen of the display (5-12). Is possible.

ディスプレイI/F(5−7)及びディスプレイ(5−12)は表示部であり、CRT、プラズマディスプレイ、リアプロジェクションテレビまたは液晶ディスプレイおよびその制御回路によって構成され、遠隔会議の会議内容はこのディスプレイ上の一部に表示されるものである。   The display I / F (5-7) and the display (5-12) are display units, and are configured by a CRT, a plasma display, a rear projection television or a liquid crystal display and a control circuit thereof. It is displayed in a part of.

撮像装置I/F(5−8)及び全方位撮像装置(5−13)及びPTZ撮像装置(5−14)は、遠隔会議端末装置の近辺の状況を含む実画像の撮像に用いられるものであり、遠隔会議端末装置において遠隔会議の映像通信を行う際に用いられるものである。   The imaging device I / F (5-8), the omnidirectional imaging device (5-13), and the PTZ imaging device (5-14) are used for capturing a real image including the situation in the vicinity of the remote conference terminal device. Yes, it is used when video communication of a remote conference is performed in a remote conference terminal device.

全方位撮像装置(5−13)は図4のように円錐ミラー、球面ミラー、双曲面ミラー等(401)を利用し得られた円形の光学像をソフトウェア処理することで人が見やすい映像であるパノラマ映像や透視画像に変換する方法や、複数のカメラを利用し全方位を撮像しソフトウェア処理することで人が見やすい映像であるパノラマ映像に変換する方法等により全方位を撮像するものである。   As shown in FIG. 4, the omnidirectional imaging device (5-13) is an image that is easy for humans to view by performing software processing on a circular optical image obtained by using a conical mirror, a spherical mirror, a hyperboloidal mirror, etc. (401). The omnidirectional imaging is performed by a method of converting to a panoramic image or a fluoroscopic image, a method of converting a panoramic image, which is an image that is easy for humans to view, by imaging the omnidirectional image using a plurality of cameras and performing software processing.

また、PTZ撮像装置(5−14)はパン、チルト、及びズーム可能な撮像装置である。音声入出力機器I/F(5−9)は遠隔会議端末装置が具備するマイク等の音声入力装置(5−15)、スピーカー等の音声出力装置(5−16)からの入出力を処理するものであり、遠隔会議端末装置において遠隔会議の音声通話を行う際に用いられるものである。また音声入出力機器I/F(5−9)は音声入力装置(5−15)から入力された音声が発声された方向を検出する機能も有する。(5−1)から(5−9)の各ブロックはシステムバス(5−17)に接続されている。   The PTZ imaging device (5-14) is an imaging device capable of panning, tilting, and zooming. The voice input / output device I / F (5-9) processes input / output from a voice input device (5-15) such as a microphone and a voice output device (5-16) such as a speaker provided in the remote conference terminal device. It is used when performing a teleconference voice call in the teleconference terminal device. The voice input / output device I / F (5-9) also has a function of detecting the direction in which the voice input from the voice input device (5-15) is uttered. Each block of (5-1) to (5-9) is connected to the system bus (5-17).

図6は、本実施形態における遠隔会議端末装置の会議室での配置について図示したものであり、図7〜図8を用いて上記全方位撮像装置(5−13)及びPTZ撮像装置(5−14)が撮像する撮像情報について説明する。   FIG. 6 illustrates the arrangement of the remote conference terminal device in the present embodiment in the conference room. The omnidirectional imaging device (5-13) and the PTZ imaging device (5- The imaging information captured by 14) will be described.

表示装置(601)は図6の全方位撮像装置(5−13)及びPTZ撮像装置(5−14)を除く、遠隔会議端末装置の主要な部分を構成する装置であり、図3、図6のようにユーザ(301、604)がディスプレイ(5−12)の画面へ直接操作することが可能である。   The display device (601) is a device constituting the main part of the remote conference terminal device except for the omnidirectional imaging device (5-13) and the PTZ imaging device (5-14) in FIG. As described above, the user (301, 604) can directly operate the screen of the display (5-12).

テーブル(602)は表示装置(601)の前に設置し、テーブル周囲にはユーザ(605A)〜(605H)が着席し会議を行う。   The table (602) is installed in front of the display device (601), and users (605A) to (605H) are seated around the table for a meeting.

撮像装置(603)は上記全方位撮像装置(5−13)及びPTZ撮像装置(5−14)から構成され、上記全方位撮像装置(5−13)は、図7のように設置された周囲の全方位を撮像し、また上記PTZ撮像装置(5−14)は図8のように設置された周囲の一部を詳細に撮像する。   The imaging device (603) is composed of the omnidirectional imaging device (5-13) and the PTZ imaging device (5-14), and the omnidirectional imaging device (5-13) is installed in the surrounding area as shown in FIG. The PTZ imaging device (5-14) captures a part of the surrounding area in detail as shown in FIG.

次に本実施形態における遠隔会議端末装置の機能構成について図9に図示された遠隔会議端末装置の機能構成を示すブロック図を用いて説明する。   Next, the functional configuration of the remote conference terminal device according to the present embodiment will be described with reference to the block diagram showing the functional configuration of the remote conference terminal device shown in FIG.

IPネットワーク網を介して遠隔会議端末装置(1−3A)と遠隔会議端末装置(1−3B)が直接接続し、音声情報及び撮像情報により構成されるメディア情報と、画像情報及びテキスト情報により構成されるドキュメント情報を送受信することにより、遠隔地間である会議室Aと会議室Bにおいて遠隔会議を実現するものであり、音声入力手段(901)、音声出力手段(902)、第一の撮像手段(903)、第二の撮像手段(904)、表示手段(905)、入力手段(906)、制御手段(907)、受信手段(908)、送信手段(909)から構成される。   The remote conference terminal device (1-3A) and the remote conference terminal device (1-3B) are directly connected via the IP network, and are composed of media information including voice information and imaging information, and image information and text information. The remote conference is realized in the conference room A and the conference room B, which are remote locations, by transmitting and receiving the document information to be transmitted. The voice input means (901), the voice output means (902), and the first imaging A means (903), a second imaging means (904), a display means (905), an input means (906), a control means (907), a receiving means (908), and a transmitting means (909).

音声入力手段(901)は音声入力装置(5−15)を用いて会議室の音声を取得するものであり、取得した音声は音声コーデックを使用しG.711又はG.729等のフォーマットにエンコードするものである。   The voice input means (901) acquires the voice of the conference room using the voice input device (5-15), and the acquired voice is encoded into a format such as G.711 or G.729 using a voice codec. To do.

エンコードされた音声データは送信手段(909)により接続した遠隔地の遠隔会議端末装置に送信される。   The encoded audio data is transmitted to the remote conference terminal device connected by the transmission means (909).

また、音声入力手段(901)は取得した音声が発声された方向を検出し、検出された発声源の方向に関する情報を制御手段(907)に伝達する。   The voice input means (901) detects the direction in which the acquired voice is uttered, and transmits information on the detected direction of the utterance source to the control means (907).

音声出力手段(902)は遠隔地の遠隔会議端末装置から送信され、受信手段(908)により受信された音声データを音声コーデックによりデコードし音声出力装置(5−16)を用いて再生するものである。   The voice output means (902) is a means for decoding the voice data transmitted from the remote conference terminal device at the remote location and received by the receiving means (908) by the voice codec and reproducing it using the voice output device (5-16). is there.

第一の撮像手段(903)は全方位撮像装置(5−13)を用いて会議参加者及び会議室全体の映像を取得するものであり、取得した撮像情報は映像コーデックを使用しH.264又はH.263等のフォーマットにエンコードするものである。   The first imaging means (903) acquires video of the conference participants and the entire conference room using the omnidirectional imaging device (5-13), and the acquired imaging information uses a video codec for the acquired imaging information. Or it encodes to formats, such as H.263.

エンコードされた撮像情報は送信手段(909)により接続した遠隔地の遠隔会議端末装置に送信される。   The encoded imaging information is transmitted to the remote conference terminal device connected by the transmission means (909).

第二の撮像手段(904)はPTZ撮像装置(5−14)を用いてパン、チルト及びズームにより会議室の一部の領域を撮像し全方位撮像装置(5−13)よりも詳細な映像を取得するものであり、取得した撮像情報は映像コーデックを使用しH.264又はH.263等のフォーマットにエンコードするものである。   The second image pickup means (904) uses the PTZ image pickup device (5-14) to pick up an image of a part of the conference room by panning, tilting and zooming, and more detailed video than the omnidirectional image pickup device (5-13). The acquired imaging information is encoded into a format such as H.264 or H.263 using a video codec.

エンコードされた撮像情報は送信手段(909)により接続した遠隔地の遠隔会議端末装置に送信される。上記の撮像する領域を決定するパン、チルト及びズームの制御は後述の制御手段(907)により行われる。   The encoded imaging information is transmitted to the remote conference terminal device connected by the transmission means (909). The pan, tilt and zoom controls for determining the area to be imaged are performed by a control means (907) described later.

表示手段(905)は遠隔地の遠隔会議端末装置から送信され、受信手段(908)により受信された撮像情報を映像コーデックによりデコードしディスプレイ(5−12)を用いて撮像情報を表示すると共に、受信手段(908)により受信された画像情報及びテキスト情報により構成されるドキュメント情報を表示するものである。   The display means (905) decodes the imaging information transmitted from the remote conference terminal device at the remote location and received by the receiving means (908) by the video codec, displays the imaging information using the display (5-12), and Document information composed of image information and text information received by the receiving means (908) is displayed.

表示手段(905)が表示する上記撮像情報と上記ドキュメント情報の内容及び表示位置の制御は後述の制御手段(907)により行われる。   Control of the content and display position of the imaging information and document information displayed by the display means (905) is performed by a control means (907) described later.

本実施形態においては、接続した各遠隔会議端末装置の表示手段(905)に同一の上記ドキュメント情報を表示し、リアルタイムに更新することにより遠隔地間でのコラボレーションの一助となっている。   In the present embodiment, the same document information is displayed on the display means (905) of each connected remote conference terminal device and is updated in real time, thereby assisting collaboration between remote locations.

入力手段(906)は遠隔会議端末装置の操作を行うだけではなく、デジタイザ(5−11)を用いて表示手段(905)の画面上にテキストやイラストを描画することが可能である。   The input means (906) can not only operate the remote conference terminal device but also can draw text and illustrations on the screen of the display means (905) using the digitizer (5-11).

描画したテキストやイラストは上記ドキュメント情報として送信手段(909)により接続した遠隔地の遠隔会議端末装置に送信される。   The drawn text and illustration are transmitted as the document information to the remote conference terminal device connected by the transmission means (909).

受信手段(908)は前述のように接続した遠隔地の遠隔会議端末装置に上記撮像情報及び上記ドキュメント情報を送信する。   The receiving means (908) transmits the imaging information and the document information to the remote conference terminal device connected as described above.

送信手段(909)は前述のように接続した遠隔地の遠隔会議端末装置から送信された上記撮像情報及び上記ドキュメント情報を受信する。   The transmission means (909) receives the imaging information and the document information transmitted from the remote conference terminal device connected at the remote place as described above.

制御手段(907)が行う制御について、以下に図10のフローチャートを用いて説明する。ここでは、図1の会議室Aに設置した遠隔会議端末装置(1−3A)と、図1の会議室Bに設置した遠隔会議端末装置(1−3B)により遠隔会議を行うものとする。   Control performed by the control means (907) will be described below with reference to the flowchart of FIG. Here, the remote conference terminal device (1-3A) installed in the conference room A in FIG. 1 and the remote conference terminal device (1-3B) installed in the conference room B in FIG.

遠隔会議端末装置(1−3A)と遠隔会議端末装置(1−3B)がIPネットワーク網を介し直接接続することにより、前述のメディア情報及び前述のドキュメント情報を送信手段(909)及び受信手段(908)により送受信を行い、遠隔会議を開始する(10−1)。   When the remote conference terminal device (1-3A) and the remote conference terminal device (1-3B) are directly connected via the IP network, the media information and the document information are transmitted (909) and received ( 908), a remote conference is started (10-1).

入力手段(906)はデジタイザ(5−11)による入力を検出した場合(10−2)、制御手段(907)はデジタイザ(5−11)により入力された付近を撮像するために、第二の撮像手段(904)のパン、チルト、及びズームの制御を行う(10−4)。   When the input means (906) detects the input from the digitizer (5-11) (10-2), the control means (907) uses the second input to image the vicinity input by the digitizer (5-11). The panning, tilting, and zooming of the image pickup means (904) are controlled (10-4).

制御手段(907)により制御された第二の撮像手段(904)は図5のようにデジタイザ(5−11)により入力された付近を撮像し、撮像された撮像情報は送信手段(909)により接続された遠隔地の遠隔会議端末装置へ送信される(10−5)。   The second imaging means (904) controlled by the control means (907) images the vicinity input by the digitizer (5-11) as shown in FIG. 5, and the captured imaging information is transmitted by the transmission means (909). It is transmitted to the connected remote conference terminal device (10-5).

また音声入力手段(901)はユーザの発言による音声を検出すると共に発声された方向を検出した場合(10−3)、制御手段(907)は発声された付近を撮像するために、発声された方向に第二の撮像手段(904)のパン、チルト、及びズームの制御を行う(10−4)。   In addition, when the voice input means (901) detects the voice produced by the user and detects the direction of the voice (10-3), the control means (907) is spoken to capture the vicinity of the voice. The pan, tilt and zoom of the second image pickup means (904) are controlled in the direction (10-4).

制御手段(907)により制御された第二の撮像手段(904)は発声された付近を撮像し、撮像された撮像情報は送信手段(909)により接続された遠隔地の遠隔会議端末装置へ送信される(10−5)。   The second image pickup means (904) controlled by the control means (907) picks up the vicinity of the utterance, and the picked-up image pickup information is transmitted to the remote conference terminal device connected by the transmission means (909). (10-5).

入力手段(906)がデジタイザ(5−11)による入力を検出せず、また音声入力手段(901)がユーザの発言による音声を検出しなかった場合、第一の撮像手段(903)は会議参加者を含む会議室全体を撮像し、撮像された撮像情報は送信手段(909)により接続された遠隔地の遠隔会議端末装置へ送信される(10−5)。   When the input means (906) does not detect the input from the digitizer (5-11) and the voice input means (901) does not detect the voice generated by the user, the first imaging means (903) participates in the conference. The entire conference room including the person is imaged, and the captured image information is transmitted to the remote conference terminal device at the remote location connected by the transmission means (909) (10-5).

ここで遠隔会議端末装置(1−3B)を設置した会議室Bについて図7を用いて上記全方位撮像装置(5−13)が撮像する会議参加者を含む会議室全体の撮像情報について説明する。   Here, the imaging information of the entire conference room including the conference participants captured by the omnidirectional imaging device (5-13) will be described with reference to FIG. 7 for the conference room B in which the remote conference terminal device (1-3B) is installed. .

表示装置(1101)は全方位撮像装置(5−13)及びPTZ撮像装置(5−14)を除く、遠隔会議端末装置の主要な部分を構成する装置であり、図3に示すようにユーザ(301、604)がディスプレイ(5−12)の画面へ直接操作することが可能である。   The display device (1101) is a device constituting the main part of the remote conference terminal device excluding the omnidirectional imaging device (5-13) and the PTZ imaging device (5-14). As shown in FIG. 301, 604) can directly operate the screen of the display (5-12).

テーブル(1102)は表示装置(1101)の前に設置し、テーブル周囲にはユーザ(1104A)〜(1104H)が着席し会議を行う。   The table (1102) is installed in front of the display device (1101), and users (1104A) to (1104H) are seated around the table to hold a conference.

撮像装置(1103)は上記全方位撮像装置(5−13)及びPTZ撮像装置(5−14)から構成され、上記全方位撮像装置(5−13)は図7のように設置された周囲の全方位を撮像する。   The imaging device (1103) is composed of the omnidirectional imaging device (5-13) and the PTZ imaging device (5-14), and the omnidirectional imaging device (5-13) is installed in the surrounding area as shown in FIG. Image all directions.

再び図10のフローチャートに戻り、制御手段(907)の制御に関する説明を行う。受信手段(908)は遠隔地の遠隔会議端末装置から送信された、第一の撮像手段(903)により撮像された撮像情報又は第二の撮像手段(904)により撮像された撮像情報を受信する(10−7)。   Returning to the flowchart of FIG. 10 again, the control of the control means (907) will be described. The receiving means (908) receives the imaging information imaged by the first imaging means (903) or the imaging information imaged by the second imaging means (904) transmitted from the remote conference terminal device at the remote location. (10-7).

以下に制御手段(907)が行う表示手段(905)の制御について、図1の会議室Aにおいて遠隔会議端末装置(1−3A)の入力手段(906)がデジタイザ(5−11)による入力を検出し、図1の会議室Bでは遠隔会議端末装置(1−3B)の入力手段(906)がデジタイザ(5−11)による入力を検出せず、又は音声入力手段(901)がユーザの発言による音声を検出しなかった場合を例にして説明する。   Hereinafter, regarding the control of the display means (905) performed by the control means (907), the input means (906) of the remote conference terminal device (1-3A) receives the input from the digitizer (5-11) in the conference room A of FIG. In the conference room B of FIG. 1, the input means (906) of the remote conference terminal device (1-3B) does not detect the input by the digitizer (5-11), or the voice input means (901) A case will be described as an example where no voice is detected.

図13は会議室Aにおいてユーザ(1301)が遠隔会議端末装置(1−3A)の入力手段付表示手段(1302)にデジタイザ(1303、5−11)を用いてテキスト(1304)を入力していることを図示したものである。   FIG. 13 shows that in a conference room A, a user (1301) inputs a text (1304) using a digitizer (1303, 5-11) to a display means (1302) with input means of a remote conference terminal device (1-3A). This is shown in the figure.

図13のようにデジタイザ(1303、5−11)による入力を検出した遠隔会議端末装置(1−3A)の制御手段(907)は、受信した第一の撮像手段(903)により撮像された撮像情報(1305)をユーザ(1301)によるテキスト(1304)の入力を妨げない位置に表示する。   The control means (907) of the remote conference terminal device (1-3A) that has detected the input by the digitizer (1303, 5-11) as shown in FIG. 13 picks up the image picked up by the received first image pickup means (903). The information (1305) is displayed at a position that does not prevent the user (1301) from inputting the text (1304).

これによりデジタイザ(1303、5−11)を使用し説明を行うユーザ(1301)は、遠隔地の会議室B全体の様子及び聴講者の反応を把握しながら説明を行うことが可能である。   Thus, the user (1301) who explains using the digitizer (1303, 5-11) can explain the situation of the entire conference room B in the remote location and the reaction of the audience.

また、図14のように受信した第一の撮像手段(903)により撮像された撮像情報(1405)をユーザ(1401)によるテキスト(1404)の入力を妨げないように半透明に透過させて入力された付近に表示させてもよい。   Further, as shown in FIG. 14, the image information (1405) captured by the first image capturing means (903) received is input by being translucently transmitted so as not to prevent the user (1401) from inputting the text (1404). It may be displayed in the vicinity.

これによりデジタイザ(1403、5−11)を使用し説明を行うユーザ(1401)は、入力における視点を動かさずに遠隔地の会議室B全体の様子及び聴講者の反応を把握しながら説明を行うことが可能である。   As a result, the user (1401) who explains using the digitizer (1403, 5-11) performs the explanation while grasping the state of the entire conference room B in the remote location and the reaction of the audience without moving the viewpoint in the input. It is possible.

図15は、会議室Bにおいて遠隔会議端末装置(1−3B)の入力手段付表示手段(1501)にデジタイザ(5−11)による入力がされていないことを図示したものである。   FIG. 15 illustrates that in the conference room B, no input is made by the digitizer (5-11) on the display means with input means (1501) of the remote conference terminal device (1-3B).

入力手段(906)がデジタイザ(5−11)による入力を検出せず、また音声入力手段(901)がユーザの発言による音声を検出しなかった場合の遠隔会議端末装置(1−3B)の制御手段(907)は、受信した第二の撮像手段(903)により撮像された撮像情報を会議室Aのユーザ(1301)により入力されたテキスト(1502)を妨げない位置に表示する(1503)。   Control of the remote conference terminal device (1-3B) when the input means (906) does not detect the input by the digitizer (5-11) and the voice input means (901) does not detect the voice by the user's speech The means (907) displays the received image information picked up by the second image pickup means (903) at a position that does not interfere with the text (1502) input by the user (1301) in the conference room A (1503).

これにより会議室Aのユーザ(1301)の説明を聴講する会議室Bのユーザは、説明者の詳細な様子を把握しながら説明を聴講することが可能である。   Thereby, the user of the conference room B who listens to the explanation of the user (1301) of the conference room A can listen to the explanation while grasping the detailed state of the presenter.

以上のような機能を有する複数の遠隔会議端末装置の間で通信回線を介して音声情報及び撮像情報により構成されるメディア情報と、画像情報及びテキスト情報により構成されるドキュメント情報を共有することにより複数の遠隔地間で会議を行う遠隔会議において、全方位を撮像可能な全方位カメラ及び任意の箇所を詳細に撮像可能なパン、チルト、ズームカメラにより撮像された撮像情報の表示を会議の状況に応じて適切に制御することにより、説明者には聴講者の反応及び会議室の様子を把握しながら説明を行うことができるだけではなく、聴講者は説明者の詳細な様子を把握しながら説明を聴講することも可能にする遠隔会議システムにおける制御方法を実現できる。   By sharing media information composed of audio information and imaging information and document information composed of image information and text information via a communication line among a plurality of remote conference terminals having the above functions In a remote conference where a conference is held between a plurality of remote locations, the omnidirectional camera capable of capturing an omnidirectional image and the display of imaging information captured by a pan, tilt, and zoom camera capable of capturing an image of any location in detail are displayed. By controlling appropriately according to the situation, the presenter can not only explain the reaction of the listener and the state of the conference room, but the listener can explain the detailed state of the presenter. It is possible to realize a control method in the remote conference system that enables the user to listen.

(その他の実施形態)
上述した実施形態では、遠隔会議について2つの遠隔会議端末装置を用いて説明したが本発明の遠隔会議システムは2つの遠隔会議端末装置に限定するものではなく、より多数の遠隔会議端末装置で遠隔会議を行う場合には上記実施形態で説明したメディア会議サーバ装置、会議制御サーバ装置を使用することも可能である。
(Other embodiments)
In the above-described embodiment, the remote conference has been described using two remote conference terminal devices. However, the remote conference system of the present invention is not limited to two remote conference terminal devices. When a conference is performed, the media conference server device and the conference control server device described in the above embodiment can also be used.

また、上記実施形態では、第一の撮像手段又は第二の撮像手段により撮像された撮像情報の送信は二者択一で行われていたが、第一の撮像手段及びは第二の撮像手段により撮像された両方の撮像情報を送信し、表示する撮像情報の選択は受信側の制御手段が決定することも可能である。   In the above embodiment, the transmission of the imaging information imaged by the first imaging unit or the second imaging unit is performed alternatively, but the first imaging unit and the second imaging unit are used. It is also possible to transmit both pieces of imaging information imaged in accordance with the above and the selection of the imaging information to be displayed can be determined by the control means on the receiving side.

また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体をシステム或いは装置に供給し、そのシステム等のコンピュータが記憶媒体からプログラムコードを読み出し実行することによっても達成される。   Another object of the present invention is to supply a storage medium storing software program codes for realizing the functions of the above-described embodiments to a system or apparatus, and a computer such as the system reads and executes the program codes from the storage medium. Is also achieved.

この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記憶媒体は本発明を構成することになる。   In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the program code itself and the storage medium storing the program code constitute the present invention.

プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。   As a storage medium for supplying the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.

また、コンピュータが読み出したプログラムコードの指示に基づき、コンピュータ上で稼動しているOS等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。   In addition, the case where the functions of the above-described embodiment are realized by performing part or all of the actual processing by an OS or the like running on the computer based on the instruction of the program code read by the computer. It is.

さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに接続された機能拡張ユニット等に備わるメモリに書込まれた後、そのプログラムコードの指示に基づきCPU等が実際の処理を行い、前述した実施形態の機能が実現される場合も含まれる。   Further, after the program code read from the storage medium is written in a memory provided in a function expansion unit connected to the computer, the CPU or the like performs actual processing based on the instruction of the program code, and the above-described processing is performed. The case where the functions of the embodiment are realized is also included.

本発明の実施形態に係る遠隔会議システムにおけるネットワークの構成を示す図である。It is a figure which shows the structure of the network in the remote conference system which concerns on embodiment of this invention. 従来の遠隔会議システムにおけるネットワークの構成を示す図である。It is a figure which shows the structure of the network in the conventional remote conference system. 従来の画面に直接入力可能な遠隔会議装置を示す図である。It is a figure which shows the remote conference apparatus which can be directly input into the conventional screen. 従来の全方位撮像可能且つパン、チルト及びズーム可能な撮像装置を示す図である。It is a figure which shows the conventional imaging device which can image omnidirectional and can pan, tilt, and zoom. 本発明の実施形態における遠隔会議端末装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the remote conference terminal device in embodiment of this invention. 本発明の実施形態における会議室及び遠隔会議端末装置の配置を示す構成図である。It is a block diagram which shows arrangement | positioning of the conference room and remote conference terminal device in embodiment of this invention. 本発明の実施形態における全方位撮像装置が撮像する映像を示す図である。It is a figure which shows the image | video which the omnidirectional imaging device in embodiment of this invention images. 本発明の実施形態におけるPTZ撮像装置が撮像する映像を示す図である。It is a figure which shows the image | video which the PTZ imaging device in embodiment of this invention images. 本発明の実施形態における遠隔会議端末装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the remote conference terminal device in embodiment of this invention. 本発明の実施形態における遠隔会議端末装置の処理を示すフローチャートである。It is a flowchart which shows the process of the remote conference terminal device in embodiment of this invention. 本発明の実施形態における遠隔地の会議室及び遠隔会議端末装置の配置を示す構成図である。It is a block diagram which shows arrangement | positioning of the remote conference room and remote conference terminal device in embodiment of this invention. 本発明の実施形態における遠隔地の全方位撮像装置が撮像する映像を示す図である。It is a figure which shows the image | video which the omnidirectional imaging device of the remote place in embodiment of this invention images. 本発明の実施形態における表示手段への表示方法を説明するための図である。It is a figure for demonstrating the display method to the display means in embodiment of this invention. 本発明一の実施形態における表示手段への表示方法を説明するための図である。It is a figure for demonstrating the display method to the display means in one Embodiment of this invention. 本発明の実施形態における表示手段への表示方法を説明するための図である。It is a figure for demonstrating the display method to the display means in embodiment of this invention.

符号の説明Explanation of symbols

1−1 メディア会議サーバ装置
1−2 会議制御サーバ装置
1−3 遠隔会議端末装置
1−4 撮像装置
1−5 ユーザ
2−1 遠隔会議端末装置
2−2 ユーザ
301 ユーザ
302 入力手段付表示装置
303 デジタイザ
304 テキスト及びイラスト
401 ミラー
402 撮像手段
403 雲台
404 撮像手段
5−1 CPU
5−2 RAM
5−3 ROM
5−4 HDD
5−5 ネットワークI/F
5−6 入力機器I/F
5−7 ディスプレイI/F
5−8 撮像装置I/F
5−9 音声入出力機器I/F
5−10 キーボード
5−11 デジタイザ
5−12 ディスプレイ
5−13 全方位撮像装置
5−14 PTZ撮像装置
5−15 音声入力装置
5−16 音声出力装置
601 表示装置
602 テーブル
603 撮像装置
604 ユーザ
605 ユーザ
901 音声入力手段
902 音声出力手段
903 第一の撮像手段
904 第二の撮像手段
905 表示手段
906 入力手段
907 制御手段
908 受信手段
909 送信手段
1101 表示装置
1102 テーブル
1103 撮像装置
1104 ユーザ
1301 ユーザ
1302 入力手段付表示手段
1303 デジタイザ
1304 テキスト
1305 撮像情報
1401 ユーザ
1402 入力手段付表示手段
1403 デジタイザ
1404 テキスト
1405 撮像情報
1501 入力手段付表示手段
1502 テキスト
1503 撮像情報
1-1 Media Conference Server Device 1-2 Conference Control Server Device 1-3 Remote Conference Terminal Device 1-4 Imaging Device 1-5 User 2-1 Remote Conference Terminal Device 2-2 User 301 User 302 Display Device with Input Means 303 Digitizer 304 Text and illustration 401 Mirror 402 Imaging means 403 Pan head 404 Imaging means 5-1 CPU
5-2 RAM
5-3 ROM
5-4 HDD
5-5 Network I / F
5-6 Input device I / F
5-7 Display I / F
5-8 Imaging device I / F
5-9 Audio input / output equipment I / F
5-10 keyboard 5-11 digitizer 5-12 display 5-13 omnidirectional imaging device 5-14 PTZ imaging device 5-15 audio input device 5-16 audio output device 601 display device 602 table 603 imaging device 604 user 605 user 901 Audio input means 902 Audio output means 903 First image pickup means 904 Second image pickup means 905 Display means 906 input means 907 control means 908 reception means 909 transmission means 1101 display device 1102 table 1103 image pickup device 1104 user 1301 user 1302 with input means Display means 1303 Digitizer 1304 Text 1305 Imaging information 1401 User 1402 Display means with input means 1403 Digitizer 1404 Text 1405 Imaging information 1501 Display hand with input means 1502 text 1503 imaging information

Claims (5)

全方位の映像を撮像可能な第一の撮像手段と、
パン、チルト及びズームにより任意の方向の詳細な映像を撮像可能な第二の撮像手段と、
遠隔地の第一の撮像手段又は第二の撮像手段により撮像された撮像情報を表示すると共に画像情報及びテキスト情報により構成されるドキュメント情報を表示する表示手段と、
表示手段が表示する撮像情報及びドキュメント情報の内容及びレイアウトを制御すると共に、遠隔地への撮像情報及びドキュメント情報の送信を制御する制御手段と、
表示手段への入力操作を検出する入力手段と、
音声入力手段と音声出力手段から構成される2つ以上の遠隔会議端末装置を用いて撮像情報及びドキュメント情報を共有することにより遠隔地と会議を行う遠隔会議システムにおいて、
上記制御手段は上記入力手段及び音声入力手段の状態により異なる制御を行うことを特徴とする遠隔会議システム。
A first imaging means capable of imaging an omnidirectional image;
A second imaging means capable of capturing a detailed image in an arbitrary direction by panning, tilting and zooming;
Display means for displaying imaging information imaged by the first imaging means or the second imaging means at a remote location and displaying document information composed of image information and text information;
Control means for controlling the contents and layout of the imaging information and document information displayed by the display means, and for controlling the transmission of the imaging information and document information to a remote place;
Input means for detecting an input operation to the display means;
In a remote conference system for performing a conference with a remote place by sharing imaging information and document information using two or more remote conference terminal devices composed of voice input means and voice output means,
The remote conferencing system characterized in that the control means performs different control depending on the states of the input means and the voice input means.
上記制御手段は、ユーザによる上記入力手段への入力を検出した際、第二の撮像手段が上記入力手段への入力を検出した付近の映像を撮像するように制御し撮像した撮像情報を遠隔地の遠隔会議端末装置における上記表示手段に表示すると共に、遠隔地の遠隔会議端末装置における第一の撮像手段が撮像した撮像情報を上記表示手段に表示するように制御することを特徴とする請求項1記載の遠隔会議システム。   When the control means detects an input to the input means by a user, the control means controls the second image pickup means to pick up an image in the vicinity where the input to the input means is detected. And displaying the imaging information captured by the first imaging unit in the remote conference terminal device at a remote location on the display unit. The remote conference system according to 1. 上記制御手段は、ユーザの発声による上記音声入力手段への音声入力を検出した際、第二の撮像手段がユーザの発声を検出した付近の映像を撮像するように制御し撮像した撮像情報を遠隔地の遠隔会議端末装置における上記表示手段に表示すると共に、遠隔地の遠隔会議端末装置における第一の撮像手段が撮像した撮像情報を上記表示手段に表示するように制御することを特徴とする請求項1記載の遠隔会議システム。   When the control means detects a voice input to the voice input means by the user's utterance, the control means controls the second imaging means to pick up an image of the vicinity where the user's utterance is detected. And displaying the image information captured by the first image capturing means in the remote teleconference terminal device at the local remote conference terminal device on the display means. Item 1. The teleconferencing system according to item 1. 上記第一の撮像手段及び第二の撮像手段は中心軸を一致させることにより同一の視点で撮像することを特徴とする請求項1記載の遠隔会議システム。   2. The teleconference system according to claim 1, wherein the first image pickup means and the second image pickup means pick up images from the same viewpoint by matching the central axes. 上記制御手段は、上記表示手段に撮像情報を表示する際、ユーザの上記入力手段による操作及びドキュメント情報の表示の妨げにならない位置と大きさで撮像情報を表示するように制御することを特徴とする請求項1記載の遠隔会議システム。   The control unit is configured to display the imaging information at a position and a size that do not hinder the operation of the user and the display of the document information when the imaging information is displayed on the display unit. The remote conference system according to claim 1.
JP2006039428A 2006-02-16 2006-02-16 Remote conference system Pending JP2007221437A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006039428A JP2007221437A (en) 2006-02-16 2006-02-16 Remote conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006039428A JP2007221437A (en) 2006-02-16 2006-02-16 Remote conference system

Publications (1)

Publication Number Publication Date
JP2007221437A true JP2007221437A (en) 2007-08-30

Family

ID=38498209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006039428A Pending JP2007221437A (en) 2006-02-16 2006-02-16 Remote conference system

Country Status (1)

Country Link
JP (1) JP2007221437A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5541384B1 (en) * 2013-02-27 2014-07-09 沖電気工業株式会社 Image processing apparatus, program, and image processing system
JP2016212262A (en) * 2015-05-08 2016-12-15 キヤノン株式会社 Communication system, control method of the same, and program
US10432895B2 (en) 2017-09-12 2019-10-01 Ricoh Company, Ltd. Communication terminal, image communication system communication method, and non-transitory recording medium
US10721116B2 (en) 2016-09-30 2020-07-21 Ricoh Company, Ltd. Communication terminal, method for controlling display of image, and non-transitory computer-readable storage medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5541384B1 (en) * 2013-02-27 2014-07-09 沖電気工業株式会社 Image processing apparatus, program, and image processing system
JP2016212262A (en) * 2015-05-08 2016-12-15 キヤノン株式会社 Communication system, control method of the same, and program
US10721116B2 (en) 2016-09-30 2020-07-21 Ricoh Company, Ltd. Communication terminal, method for controlling display of image, and non-transitory computer-readable storage medium
US10432895B2 (en) 2017-09-12 2019-10-01 Ricoh Company, Ltd. Communication terminal, image communication system communication method, and non-transitory recording medium

Similar Documents

Publication Publication Date Title
US9466222B2 (en) System and method for hybrid course instruction
US8638354B2 (en) Immersive video conference system
JP4228010B2 (en) Video conferencing equipment
JP6547496B2 (en) Communication apparatus, communication method, program and communication system
JP6171263B2 (en) Remote conference system and remote conference terminal
US20040254982A1 (en) Receiving system for video conferencing system
US20110216153A1 (en) Digital conferencing for mobile devices
US8264518B2 (en) Gesture-based actions in a video communication session
JP4809624B2 (en) Video conference system
JPH09247637A (en) Video audio communication system, video communication system and transmission and reception terminals
WO2010041954A1 (en) Method, device and computer program for processing images during video conferencing
CN111163280B (en) Asymmetric video conference system and method thereof
JP2007221437A (en) Remote conference system
US9131109B2 (en) Information processing device, display control system, and computer program product
JP2003339034A (en) Network conference system, network conference method, and network conference program
JP2003333561A (en) Monitor screen displaying method, terminal, and video conference system
JP2010278828A (en) Conference system between distant places
JP2006229902A (en) Conference supporting system, method and computer program
Rui et al. PING: A Group-to-individual distributed meeting system
JP2006093864A (en) Image display method, terminal, and two-way interaction system
Blahuš Technological Considerations Regarding the Use of Videoconferencing in Education