JPH09107534A - Video conference equipment and video conference system - Google Patents

Video conference equipment and video conference system

Info

Publication number
JPH09107534A
JPH09107534A JP7263174A JP26317495A JPH09107534A JP H09107534 A JPH09107534 A JP H09107534A JP 7263174 A JP7263174 A JP 7263174A JP 26317495 A JP26317495 A JP 26317495A JP H09107534 A JPH09107534 A JP H09107534A
Authority
JP
Japan
Prior art keywords
image
video conference
camera
display
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7263174A
Other languages
Japanese (ja)
Inventor
Hajime Sato
肇 佐藤
Atsushi Tanaka
淳 田中
Ryozo Yanagisawa
亮三 柳澤
Katsuyuki Kobayashi
克行 小林
Yuichiro Yoshimura
雄一郎 吉村
Masaki Tokioka
正樹 時岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7263174A priority Critical patent/JPH09107534A/en
Publication of JPH09107534A publication Critical patent/JPH09107534A/en
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a video conference equipment and a video conference system by which video conference is held with excellent naturality as if a participant were actually making conversation with opposite conference party face to face. SOLUTION: A position detection section 6 detects a position of an opposite image display area 10 on a display section 3 and sends the position information to a camera control section 2. An image recognition section 7 recognizes an image of an opposite party displayed on the opposite image display area 10 and sends position information representing a face or eye position of the person to the camera control section 2. A user position detection section detects a position of an utterance party from the position of a microphone picking up a voice of the utterance party and the position information is sent to the camera control section 2. The camera control section 2 is configured to move the position of a camera 1 in three axis directions XYZ and the camera 1 is moved so that the position of the camera 1 comes to a position reaching the line of sight of the user depending on the position information obtained from the position detection section 6, the image recognition section 7 and a user position detection section 9 or the like.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、テレビ会議に用い
るテレビ会議装置及び多地点間通信を行ってテレビ会議
を行うテレビ会議システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video conference device used for a video conference and a video conference system for performing a video conference by performing multipoint communication.

【0002】[0002]

【従来の技術】従来のテレビ会議システムは、図7に示
すように、パーソナルコンピュータ(パソコン)やワー
クステーション703に映像・音声コーデックが内蔵さ
れたシステム制御装置704及びカメラ701、モニタ
702、、マイク705、ビデオボード706、LAN
ボード707等の周辺機器を付加して構成されたテレビ
会議装置をLAN等の通信網を介して接続することによ
り構成されている。そしてこのテレビ会議システムは、
映像・音声の通信だけでなく、マルチウィンドウ、マル
チタスク、データ蓄積、電子メール等、パソコンやワー
クステーション703の機能と複合させたマルチメディ
ア通信システムが構成できることが特徴である。
2. Description of the Related Art As shown in FIG. 7, a conventional video conference system includes a system controller 704 having a video / audio codec built in a personal computer (personal computer) or a workstation 703, a camera 701, a monitor 702, and a microphone. 705, video board 706, LAN
It is configured by connecting a video conference apparatus configured by adding peripheral devices such as a board 707 via a communication network such as a LAN. And this video conferencing system
A feature of the present invention is that not only video / audio communication but also a multi-media communication system such as multi-window, multi-task, data storage, e-mail, and the like, which is combined with the functions of a personal computer or a workstation 703, can be configured.

【0003】ところで、このテレビ会議システムでは、
ヒューマンファクタが技術的に占める部分も多く、利用
者の心理的要因を考慮したヒューマンインタフェースの
設計が行われている。そしてテレビ会議システムは通
常、複数の参加者による意見交換に用いられるので、臨
場感、刺激感といったものが重要な要素になってくる。
By the way, in this video conference system,
There are many technical factors occupied by human factors, and human interface has been designed in consideration of psychological factors of users. Further, since the video conference system is usually used for exchanging opinions by a plurality of participants, a sense of presence and a sense of stimulation are important factors.

【0004】この臨場感、刺激感を感じるためには、会
議を行っている相手とのアイコンタクトが必要になるた
め、従来のテレビ会議装置では、相手先の画面と使用者
の視線のずれを考慮して、使用者を撮影するカメラ70
1はモニタ702の上部に配置されていることが多い。
これは、上記視線ずれは、上下(垂直)方向の許容度の
方が水平方向の許容度より大きいためである。
In order to feel the presence and the stimulus, it is necessary to make eye contact with the other party in the conference. Therefore, in the conventional video conference apparatus, there is a deviation between the screen of the other party and the line of sight of the user. In consideration, the camera 70 for photographing the user
1 is often arranged on the upper part of the monitor 702.
This is because the tolerance in the vertical (vertical) direction is larger than the tolerance in the horizontal direction for the above-mentioned line-of-sight deviation.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上記の
ように構成した場合でも、特に大型のディスプレイ(モ
ニタ)を用いたテレビ会議装置の場合には、視線ずれの
許容度が小さいため、使用者が意識してカメラ701に
目線を投じたとき以外は、モニタ702に出る相手先の
顔画像は目線がずれていることが多い。従って、このよ
うな構成のテレビ会議装置を用いてテレビ会議を行って
も、人が普通に会話を行っているような自然さに欠け、
目の前に相手がいるような臨場感、刺激感を得ることが
できない。
However, even in the case of the above configuration, especially in the case of a video conference apparatus using a large display (monitor), the tolerance of the line-of-sight deviation is small, so that the user is Except when the user consciously throws his / her eyes on the camera 701, the face image of the partner on the monitor 702 is often deviated. Therefore, even if a video conference is conducted using the video conference device having such a configuration, it lacks the naturalness that people normally have a conversation,
I can't get the feeling of being realistic and stimulating as if the other person is in front of me.

【0006】本発明は、上記の問題を解決するためにな
されたものであり、実際に対面して会話を行っているよ
うな自然性に優れたテレビ会議を行うことができるテレ
ビ会議装置及びテレビ会議システムを提供することを目
的とする。
The present invention has been made in order to solve the above problems, and a video conference apparatus and a TV capable of performing a video conference with excellent naturalness such as actually facing a conversation. The purpose is to provide a conference system.

【0007】[0007]

【課題を解決するための手段】請求項1の発明は、テレ
ビ会議に用いるテレビ会議装置において、画像を表示す
る表示手段と、使用者を撮影する撮影手段と、テレビ会
議の相手側の画像を上記表示手段の相手画像表示領域に
表示させる表示制御手段と、上記表示手段における上記
相手画像表示領域の位置を検出する位置検出手段と、上
記位置検出手段により検出された上記相手画像表示領域
の位置に応じて上記撮影手段の位置を変化させる撮影制
御手段とを有することを特徴とするものである。
According to a first aspect of the present invention, in a video conference apparatus used for a video conference, a display means for displaying an image, a photographing means for photographing a user, and an image on the other side of the video conference are displayed. Display control means for displaying in the partner image display area of the display means, position detecting means for detecting the position of the partner image display area in the display means, and position of the partner image display area detected by the position detecting means And a photographing control means for changing the position of the photographing means according to the above.

【0008】請求項2の発明は、テレビ会議に用いるテ
レビ会議装置において、画像を表示する表示手段と、使
用者を撮影する撮影手段と、テレビ会議の相手側の画像
を上記表示手段に表示させる表示制御手段と、上記相手
側の画像の画像認識を行う画像認識手段と、上記画像認
識手段によって認識された上記相手側の画像の所定部分
の表示位置に応じて上記撮影手段の位置を変化させる撮
影制御手段とを有することを特徴とするものである。
According to a second aspect of the present invention, in a video conference apparatus used for a video conference, display means for displaying an image, photographing means for photographing a user, and an image of the other party of the video conference are displayed on the display means. Display control means, image recognition means for performing image recognition of the image of the other party, and changing the position of the photographing means according to the display position of a predetermined portion of the image of the other party recognized by the image recognition means. It has a photographing control means.

【0009】請求項3の発明は、テレビ会議に用いるテ
レビ会議装置において、画像を表示する表示手段と、使
用者を撮影する撮影手段と、発言を行った使用者の位置
を検出する使用者位置検出手段と、上記使用者位置検出
手段によって検出された発言を行った使用者の位置に応
じて上記撮影手段の位置又は角度を変化させる撮影制御
手段とを有することを特徴とするものである。
According to a third aspect of the present invention, in a video conference apparatus used for a video conference, a display means for displaying an image, a photographing means for photographing the user, and a user position for detecting the position of the user who made the statement. It is characterized in that it has a detection means and an image pickup control means for changing the position or angle of the image pickup means according to the position of the user who made the speech detected by the user position detection means.

【0010】請求項4の発明は、多地点間通信を行って
テレビ会議を行うテレビ会議システムにおいて、画像を
表示する表示手段と、自分側の画像を撮影する撮影手段
と、テレビ会議の相手側の画像を上記表示手段の相手画
像表示領域に表示させる表示制御手段と、上記表示手段
における上記相手画像表示領域の位置を検出する位置検
出手段と、上記位置検出手段により検出された上記相手
画像表示領域の位置に応じて上記撮影手段の位置を変化
させる撮影制御手段とを有することを特徴とするもので
ある。
According to a fourth aspect of the present invention, in a video conference system for performing a video conference by performing multipoint communication, a display means for displaying an image, a photographing means for photographing an image of one's own side, and a partner side of the video conference. Display means for displaying the image of the other image on the partner image display area of the display means, position detecting means for detecting the position of the partner image display area on the display means, and the partner image display detected by the position detecting means. And a photographing control means for changing the position of the photographing means according to the position of the area.

【0011】[0011]

【作用】請求項1のテレビ会議装置及び請求項4のテレ
ビ会議システムによれば、撮影制御手段により例えば表
示手段における相手画像表示領域の位置と同じ位置に撮
影手段を移動させるようにすることにより、使用者が相
手と会話するために相手画像表示領域に目を投じると、
自然に撮影手段を見ることになるので、相手と目線を合
わせて対話を行っているかのような自然性に優れたテレ
ビ会議を行うことができる。
According to the video conference apparatus of claim 1 and the video conference system of claim 4, the photographing control means moves the photographing means to the same position as the position of the partner image display area on the display means. , When the user looks at the partner image display area to talk with the partner,
Since the photographing means is naturally seen, it is possible to hold a teleconference excellent in naturalness as if the user were talking with his / her eyes.

【0012】請求項2のテレビ会議装置によれば、画像
認識手段によって認識された相手の画像の例えば顔又は
目の位置に撮影制御手段により撮影手段を移動させるよ
うにすることにより、特に大型ディスプレイを用いた場
合でも、使用者が相手と会話するために相手の画像を見
ると自然に撮影手段を見ることになるので、相手と視線
ずれを生ずることなく相手と目線を合わせて対話を行っ
ているかのような自然性に優れたテレビ会議を行うこと
ができる。
According to the video conference apparatus of the second aspect, the photographing control means moves the photographing means to the position of, for example, the face or the eyes of the image of the other party recognized by the image recognition means, so that a particularly large display is provided. Even when using, the user naturally looks at the shooting means when looking at the image of the other party in order to talk to the other party. It is possible to hold a teleconference that is as natural as if it were an illusion.

【0013】請求項3のテレビ会議装置によれば、使用
者位置検出手段により発言者の位置を検出し、その位置
に応じて撮影制御手段により撮影手段の位置又は角度を
変化させることができるので、自機器側の使用者が複数
いる場合でも、発言者の方に撮影手段を向けたり、発言
者の正面に撮影手段を移動させることができ、従って相
手と対面して会話を行っているかのような自然性に優れ
たテレビ会議を行うことができる。
According to the video conference apparatus of the third aspect, the position of the speaker is detected by the user position detecting means, and the position or angle of the photographing means can be changed by the photographing control means according to the position. Even if there are multiple users on the device side, it is possible to direct the image capturing means toward the speaker or move the image capturing means in front of the speaker, and thus whether the person is conversing face to face. It is possible to hold such a teleconference excellent in naturalness.

【0014】[0014]

【発明の実施の形態】以下、本発明の実施例を図面に基
づき説明する。図8は、本発明の要素的特徴を示すブロ
ック図である。同図において、通信部5は通信網を介し
て相手側のテレビ会議装置との間で画像、音声、データ
等の送受信を行う。そして通信部5で受信された画像は
表示制御部4により表示部3に表示される。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. FIG. 8 is a block diagram showing the elemental features of the present invention. In the figure, the communication unit 5 transmits / receives images, voice, data, etc. to / from a video conference apparatus on the other side via a communication network. Then, the image received by the communication unit 5 is displayed on the display unit 3 by the display control unit 4.

【0015】一方、撮影手段を構成するカメラ1により
撮影された使用者(自分側)の画像は、通信部5及び通
信網を介して相手側のテレビ会議装置に送信される。
On the other hand, the image of the user (own side) photographed by the camera 1 constituting the photographing means is transmitted to the video conference apparatus of the other party via the communication section 5 and the communication network.

【0016】表示部3には、種々の情報が表示されると
共に、会議相手の画像が表示部3の一部に設けられた相
手画像表示領域10に表示されるように構成されてい
る。そしてこの相手画像表示領域10は、表示部3上で
任意の位置に移動させることができ、また、その表示領
域の大きさを変化させることができるようになされてい
る。
Various information is displayed on the display unit 3, and an image of the conference partner is displayed on a partner image display area 10 provided in a part of the display unit 3. The partner image display area 10 can be moved to an arbitrary position on the display unit 3, and the size of the display area can be changed.

【0017】位置検出部6は、表示部3上における相手
画像表示領域10の位置を検出し、その位置情報をカメ
ラ制御部2に送出する。
The position detection unit 6 detects the position of the partner image display area 10 on the display unit 3 and sends the position information to the camera control unit 2.

【0018】画像認識部7は、相手画像表示領域10に
表示される相手の人物の画像を認識し、その人物の顔あ
るいは目の位置を示す位置情報をカメラ制御部2に送出
する。
The image recognition unit 7 recognizes the image of the person of the partner displayed in the partner image display area 10 and sends the position information indicating the position of the face or eyes of the person to the camera control unit 2.

【0019】使用者位置検出部9は、発言者の音声が入
力されたマイクロフォン8の位置から発言者の位置を検
出し、その位置情報をカメラ制御部2に送出する。
The user position detecting unit 9 detects the position of the speaker from the position of the microphone 8 to which the voice of the speaker is input, and sends the position information to the camera control unit 2.

【0020】カメラ制御部2は、カメラ1の位置をXY
Zの3軸方向に移動させることができるように構成さ
れ、位置検出部6、画像認識部7、使用者位置検出部9
等から得られる位置情報に応じてカメラ1の位置が使用
者の目線の先の位置にくるようにカメラ1を移動させ
る。
The camera control unit 2 determines the position of the camera 1 to be XY.
The position detecting unit 6, the image recognizing unit 7, and the user position detecting unit 9 are configured so as to be movable in the three Z directions.
The camera 1 is moved so that the position of the camera 1 comes to a position ahead of the user's eyes according to the position information obtained from the above.

【0021】なお、カメラ制御部2は、位置検出部6、
画像認識部7、使用者位置検出部9等から得られる位置
情報に応じてカメラ1の角度も自由に変化させることが
できるように構成されている。
The camera controller 2 includes a position detector 6,
The angle of the camera 1 can be freely changed according to the position information obtained from the image recognition unit 7, the user position detection unit 9, and the like.

【0022】なお、上述の表示制御部4、位置検出部
6、画像認識部7、使用者位置検出部9は、後述するシ
ステム制御装置109、409により実現される。
The display control unit 4, the position detection unit 6, the image recognition unit 7, and the user position detection unit 9 described above are realized by system control devices 109 and 409 described later.

【0023】〔第1実施例〕図1は、本発明の第1の実
施例のテレビ会議装置の構成を示す図である。 同図に
おいて、109はこのテレビ会議装置全体を制御するシ
ステム制御装置である。図示しないマイクで検出する音
声とカメラ104で撮影される映像は、システム制御装
置109の内部の映像・音声コーデックで処理され、ビ
デオボード等を介してパソコンやワークステーションか
らなるコンピュータ108に入力される。そしてこのコ
ンピュータ108、システム制御装置109が、LAN
或いはISDN等の通信手段を介して他のテレビ会議装
置と接続されることによりテレビ会議システムが構築さ
れ、多地点での映像、音声、情報等の通信が可能とな
る。
[First Embodiment] FIG. 1 is a block diagram showing the arrangement of a video conference apparatus according to the first embodiment of the present invention. In the figure, reference numeral 109 is a system control device for controlling the entire video conference device. The audio detected by a microphone (not shown) and the video captured by the camera 104 are processed by the video / audio codec inside the system control device 109 and input to the computer 108 such as a personal computer or a workstation via a video board or the like. . The computer 108 and the system control device 109 are connected to the LAN
Alternatively, a video conference system is constructed by connecting to another video conference device via a communication means such as ISDN, and it becomes possible to communicate video, audio, information, etc. at multiple points.

【0024】101は透明な部材で構成されるデジタイ
ザであり、ペン型の指示具で座標入力を行うことができ
るように構成され、デジタイザ制御装置107で制御さ
れる。
Reference numeral 101 denotes a digitizer composed of a transparent member, which is constructed so that coordinates can be input by a pen-shaped pointing tool, and is controlled by a digitizer control device 107.

【0025】102は透過型液晶表示装置であり、この
液晶表示装置102には端末装置のモニタとして各種の
データが表示される。
Reference numeral 102 is a transmissive liquid crystal display device, and various data are displayed on the liquid crystal display device 102 as a monitor of the terminal device.

【0026】103はハーフミラーであり、使用者に対
するカメラ104の映り込みを避けるのと同時に、LA
N等の通信手段で接続されたシステム制御装置109に
設けられている映像コーデックで処理される画像が投写
装置106により投写される。この投写される画像は主
にテレビ会議の相手のポートレート画像であり、使用者
は液晶表示装置102及びデジタイザ101を通してこ
の画像を映像として認識することができる。
Reference numeral 103 denotes a half mirror, which prevents the camera 104 from being reflected on the user and, at the same time, LA
An image processed by the video codec provided in the system control device 109 connected by communication means such as N is projected by the projection device 106. This projected image is mainly a portrait image of the other party of the video conference, and the user can recognize this image as a video through the liquid crystal display device 102 and the digitizer 101.

【0027】コンピュータ108の制御により液晶表示
装置102に表示される各種情報の映像と、投写装置1
06で投写される映像は、重なって使用者に認識されな
いように、システム制御装置109によりその表示位置
等が制御される。
The image of various information displayed on the liquid crystal display device 102 under the control of the computer 108 and the projection device 1
The display position and the like of the image projected at 06 are controlled by the system control device 109 so that they are not recognized by the user as they are overlapped.

【0028】カメラ104は、カメラ制御装置105に
よりその撮影位置及び撮影条件等の制御がなされ、投写
装置106がハーフミラー103に対して投写する映像
の領域、すなわちポートレート画像表示ウィンドウ領域
(相手画像表示領域)の表示位置に応じてその移動制御
がなされる。カメラ104の移動は、XYZステージ等
と通称される3次元の位置決め移動装置で行われ、前述
のポートレート画像表示ウィンドウが位置する座標値に
その位置制御がなされる。
The camera control unit 105 controls the photographing position and photographing conditions of the camera 104, and the image area projected by the projection apparatus 106 onto the half mirror 103, that is, the portrait image display window area (the partner image). The movement control is performed according to the display position of the display area). The movement of the camera 104 is performed by a three-dimensional positioning movement device commonly referred to as an XYZ stage or the like, and its position control is performed on the coordinate value at which the above-mentioned portrait image display window is positioned.

【0029】図2は、カメラ104と、投写装置106
が投写するポートレート画像表示ウィンドウ領域が連動
して動作する様子を示したものである。なお、ここでは
ポートレート画像表示ウィンドウ領域の大きさは固定と
する。
FIG. 2 shows a camera 104 and a projection device 106.
3 shows how the portrait image display window area projected by is operated in conjunction with each other. The size of the portrait image display window area is fixed here.

【0030】使用者がデジタイザ101の操作により、
液晶表示装置102及びハーフミラー103で構成され
る画面201中のポートレート画像表示ウィンドウ領域
を202の位置から203の位置に移動させると、カメ
ラ104はカメラ制御装置105の制御により、このポ
ートレート画像表示ウィンドウ領域の移動に連動して2
05から206の位置に移動される。
When the user operates the digitizer 101,
When the portrait image display window area in the screen 201 composed of the liquid crystal display device 102 and the half mirror 103 is moved from the position 202 to the position 203, the camera 104 is controlled by the camera control device 105. 2 in conjunction with the movement of the display window area
Moved from position 05 to 206.

【0031】従って、使用者がポートレート画像表示ウ
ィンドウ領域に目を投じたときには、カメラ104を見
ていることになる。
Therefore, when the user looks at the portrait image display window area, he is looking at the camera 104.

【0032】図3は、拡大あるいは縮小できるポートレ
ート画像表示ウィンドウ領域に対してカメラ104の位
置制御がなされる様子を示したものである。
FIG. 3 shows how the position of the camera 104 is controlled with respect to the portrait image display window area which can be enlarged or reduced.

【0033】上記ポートレート画像表示ウィンドウ領域
は、使用者のペン或いはマウス等の操作により任意に拡
大、縮小できるように構成されているが、ポートレート
画像表示ウィンドウ領域の表示位置の移動がなされると
共にその領域の大きさの拡大、縮小がなされる場合に
は、カメラ制御装置105によりカメラ104の位置の
以下のような移動制御がなされる。
The portrait image display window area is constructed so that it can be arbitrarily enlarged or reduced by the user's operation with a pen or mouse, but the display position of the portrait image display window area is moved. At the same time, when the size of the area is enlarged or reduced, the camera controller 105 controls the movement of the position of the camera 104 as follows.

【0034】まず、ポートレート画像表示ウィンドウ領
域がカメラ104程度の大きさであればカメラ104は
ポートレート画像表示ウィンドウ領域の中心位置に移動
される。
First, if the portrait image display window area is about the size of the camera 104, the camera 104 is moved to the center position of the portrait image display window area.

【0035】また、ポートレート画像表示ウィンドウ領
域がカメラ104よりも大きな場合には、システム制御
装置109に設けられた画像認識部によりポートレート
画像表示ウィンドウ領域内の人物の画像の画像認識を行
い、その顔あるいは目の位置にカメラ104を移動させ
る。すなわち、図3に示すように、使用者が画面301
の中のポートレート画像表示ウィンドウ領域を302の
位置から303の位置に移動させると共に、ポートレー
ト画像表示ウィンドウ領域の拡大を行うと、カメラ10
4はカメラ制御装置105により305の位置から30
6の位置に移動される。この306の位置は、上述のよ
うに画像認識により特定された相手の人物の顔あるいは
目の位置である。従って、大型のディスプレイ(画面)
を使用している場合のように、使用者の目線の動きが大
きくなるような場合にも相手のポートレート画像を見た
ときにはカメラ104を見ているようになる。このよう
に構成することにより、画像認識は投写装置106によ
って投写される映像のみに対して行えば良いので、液晶
表示装置102に表示される画像の処理部には負荷がか
からない。そして、使用者は相手先の画像を見ると自然
にカメラ104を見ることになるので、実際に対面して
会話をするような自然性に優れたテレビ会議システムを
提供することができる。
If the portrait image display window area is larger than the camera 104, the image recognition unit provided in the system control device 109 performs image recognition of the image of the person in the portrait image display window area. The camera 104 is moved to the position of the face or eyes. That is, as shown in FIG.
When the portrait image display window area in the image is moved from the position 302 to the position 303 and the portrait image display window area is enlarged, the camera 10
4 is 30 from the position of 305 by the camera control device 105.
Moved to position 6. The position of this 306 is the position of the face or eyes of the person of the other party identified by the image recognition as described above. Therefore, a large display (screen)
Even when the eye movement of the user becomes large as in the case of using, the camera 104 looks like the camera 104 when looking at the portrait image of the partner. With this configuration, the image recognition only needs to be performed on the image projected by the projection device 106, and therefore the processing unit for the image displayed on the liquid crystal display device 102 is not burdened. Then, the user naturally sees the camera 104 when looking at the image of the other party, so that it is possible to provide a video conference system having an excellent naturalness such as actually facing each other and having a conversation.

【0036】〔第2実施例〕上述の第1実施例では、相
手先の画像を表示する表示部(ポートレート画像表示ウ
ィンドウ領域)とデータ等を表示する表示部(液晶表示
装置102)とは別々に構成されていた。本実施例で
は、相手先の画像とデータ等を同一の表示処理により表
示させる場合の例につき説明する。なお、図1の実施例
と同一部分には同一の符号を付してその説明を省略す
る。
[Second Embodiment] In the first embodiment described above, the display section (portrait image display window area) for displaying the image of the other party and the display section (liquid crystal display device 102) for displaying data and the like are provided. It was configured separately. In the present embodiment, an example in which an image and data of the other party are displayed by the same display processing will be described. The same parts as those in the embodiment of FIG. 1 are designated by the same reference numerals and the description thereof will be omitted.

【0037】図4において、402は液晶制御装置40
6によりその表示が制御される透過型液晶表示装置で、
システム制御装置409で一括処理される各種のデータ
および相手先の画像を表示する。403は使用者へのカ
メラ104の映り込みを防止するための部材である。
In FIG. 4, reference numeral 402 denotes a liquid crystal control device 40.
In a transmissive liquid crystal display device whose display is controlled by 6,
Various data collectively processed by the system control device 409 and the image of the other party are displayed. Reference numeral 403 is a member for preventing the reflection of the camera 104 on the user.

【0038】カメラ104の位置は、液晶表示装置40
2に表示された画像の内容に応じてカメラ制御装置10
5で制御される。すなわち、システム制御装置409で
は、液晶表示装置402に表示された画像から相手先の
画像のウィンドウ(相手画像表示領域)を認識し、さら
にそのウィンドウ領域内の画像から、相手の人物の顔あ
るいは目を画像認識する。そして認識された顔あるいは
目の位置情報はカメラ制御装置105に入力され、カメ
ラ制御装置105はその位置情報に基づきカメラ104
の位置を相手先の画像のウィンドウに表示された会議相
手の顔あるいは目の位置にカメラ104の位置を移動さ
せる。
The position of the camera 104 is the liquid crystal display device 40.
2 according to the contents of the image displayed on the camera control device 10
Controlled by 5. That is, the system control device 409 recognizes the window of the image of the other party (partner image display area) from the image displayed on the liquid crystal display device 402, and further recognizes the face or eyes of the person of the other party from the image in the window area. Image recognition. Then, the position information of the recognized face or eyes is input to the camera control device 105, and the camera control device 105 uses the position information to detect the position of the camera 104.
The position of the camera 104 is moved to the position of the face or eyes of the conference partner displayed in the window of the image of the other party.

【0039】このように、この実施例では、表示画面
(液晶表示装置402)全体の画像認識を段階を踏んで
実行し、その実行結果に基づいてカメラ104の移動制
御を行うことで、使用者は表示装置402の画面上で相
手先の画像を見ると自然にカメラ104を見ることとな
るので、実際に対面して会話をするような自然性に優れ
たテレビ会議システムを提供することができる。
As described above, in this embodiment, the image recognition of the entire display screen (the liquid crystal display device 402) is executed step by step, and the movement control of the camera 104 is performed based on the execution result, so that the user When the user sees the image of the other party on the screen of the display device 402, he or she naturally looks at the camera 104, so that it is possible to provide a video conference system with excellent naturalness such as actually facing each other and having a conversation. .

【0040】〔第3実施例〕次に、図5、図6に基づ
き、複数の地点の相手と複数の使用者がテレビ会議を行
う場合の例につき説明する。
[Third Embodiment] Next, an example of a case where a plurality of users and a plurality of users have a video conference will be described with reference to FIGS. 5 and 6.

【0041】この場合には、図6に示すように、複数の
地点の相手の画像が表示される各々のポートレート画像
表示ウィンドウ領域に対応してカメラ制御装置105及
びカメラ104を複数配置すると共に、自機器側の複数
の使用者の人数分のマイク1、2、3・・を各使用者に
対応して配置する。なお、図6において、「表示側」と
あるのは、図5の画面501側を表し、「使用者側」と
あるのは、図5の510で示される使用者が座っている
場所を表している。
In this case, as shown in FIG. 6, a plurality of camera control devices 105 and a plurality of cameras 104 are arranged corresponding to each portrait image display window area in which the images of the opponents at a plurality of points are displayed. , Microphones 1, 2, 3 ... for the number of users on the device side are arranged corresponding to each user. In FIG. 6, “display side” means the screen 501 side of FIG. 5, and “user side” means the place where the user shown at 510 in FIG. 5 is sitting. ing.

【0042】この構成において、ある使用者が発言する
と、その発言した使用者に対応させられているマイクに
より音声が検出され、その検出情報がシステム制御装置
109(409)に送られる。システム制御装置109
(409)は、予め登録されている各マイクの位置情報
に基づきその発言者の位置を特定し、その位置情報を、
画像認識により認識したポートレート画像表示ウィンド
ウ領域の人物の顔又は目の位置情報と共にカメラ制御装
置105に送出する。
In this structure, when a user speaks, a voice is detected by the microphone associated with the user who speaks, and the detection information is sent to the system control device 109 (409). System control device 109
(409) specifies the position of the speaker based on the position information of each microphone registered in advance, and
It is sent to the camera control device 105 together with the position information of the face or eyes of the person in the portrait image display window area recognized by the image recognition.

【0043】カメラ制御装置105は、それらの位置情
報を用いて、各カメラ104をポートレート画像表示ウ
ィンドウ領域の人物の顔又は目の位置に移動させると共
に、カメラ104の角度を変化させ、カメラ104を発
言者の方向に向けるように制御する。なお、この際、カ
メラ104の位置は固定で、発言者の位置情報のみを用
いてカメラ104の角度のみを変化させるようにしても
良い。
Using the position information, the camera control unit 105 moves each camera 104 to the position of the face or eyes of the person in the portrait image display window area, changes the angle of the camera 104, and changes the angle of the camera 104. Is controlled so as to face the speaker. At this time, the position of the camera 104 may be fixed and only the angle of the camera 104 may be changed using only the position information of the speaker.

【0044】図5は、図6の構成を具体的に説明するた
めの図である。図5に示すように、画面501には、グ
ラフ等のデータを表示するウィンドウ502、503が
表示されると共に、テレビ会議の相手であるA地点、B
地点、C地点の各々の会議参加者のポートレート画像が
ポートレート画像表示ウィンドウ領域504、505、
506に表示されている。そしてこのウィンドウ領域5
04、505、506の裏側にはそれぞれカメラ104
が配置されている。
FIG. 5 is a diagram for specifically explaining the configuration of FIG. As shown in FIG. 5, on the screen 501, windows 502 and 503 for displaying data such as graphs are displayed, and points A and B, which are video conference partners, are displayed.
The portrait images of the conference participants at the points C and C are displayed in the portrait image display window areas 504 and 505.
It is displayed at 506. And this window area 5
Cameras 104 are provided on the back sides of 04, 505, and 506, respectively.
Is arranged.

【0045】一方、自機器側の使用者はA〜Cの3名で
あり、この3名は図5の510に示すような配置で座っ
ており、このA〜Cの使用者の前にはそれぞれマイクA
〜Cが配置されているものとする。
On the other hand, there are three users A to C on the device side, and these three are sitting in the arrangement 510 shown in FIG. 5, and in front of the users A to C. Mike A
It is assumed that C are arranged.

【0046】今、使用者Cが発言したとすると、マイク
Cが使用者Cが発生する音声を検出する。この検出に基
づき、システム制御装置109(409)は、予め登録
されている各マイクの位置情報に基づきその発言者Cの
位置を特定し、その位置情報を、画像認識により認識し
たポートレート画像表示ウィンドウ領域の人物の顔又は
目の位置情報と共にカメラ制御装置105に送出する。
カメラ制御装置105は、それらの位置情報を用いて、
各カメラ104をポートレート画像表示ウィンドウ領域
の人物の顔又は目の位置に移動させると共に、カメラ1
04の角度を変化させ、各カメラ104を矢印507、
508、509で示すように発言者Cの方向に向けるよ
うに制御する。
Now, assuming that the user C speaks, the microphone C detects the voice generated by the user C. Based on this detection, the system control device 109 (409) identifies the position of the speaker C based on the position information of each microphone registered in advance, and displays the position information by image recognition in a portrait image display. It is sent to the camera control device 105 together with the position information of the face or eyes of the person in the window area.
The camera control device 105 uses the position information,
While moving each camera 104 to the position of a person's face or eyes in the portrait image display window area,
04 to change the angle of each camera 104, arrow 507,
Control is performed so as to face the speaker C as indicated by 508 and 509.

【0047】このように、自機器側に複数の使用者がい
る場合に、発言を行った使用者にカメラ104が向けら
れるので、実際に対面して会話をするような自然性に優
れたテレビ会議システムを提供することができる。
As described above, when there are a plurality of users on the device side, the camera 104 is aimed at the user who has made a statement, so that the television is excellent in nature and has a natural conversation. A conference system can be provided.

【0048】なお、図5の例では相手先はA、B、Cの
3地点であったが、これは何地点であっても良く、ま
た、カメラ104を各ポートレート画像表示ウィンドウ
領域に対応してそれぞれ設けるのではなく、1台のカメ
ラ104のみを用いてこのカメラ104を発言を行った
使用者の正面の位置に移動させたり、発言を行った使用
者の方向に向けたりするように構成しても良い。
In the example of FIG. 5, the destinations are three points A, B and C, but this may be any number of points, and the camera 104 corresponds to each portrait image display window area. Instead of providing each of them, only one camera 104 is used to move the camera 104 to the position in front of the user who made a statement, or to orient it toward the user who made a statement. It may be configured.

【0049】上述の実施例では、パソコン或いはワーク
ステーションにカメラ104等を組み合わせて本発明の
テレビ会議装置を構成する例につき説明したが、パソコ
ン或いはワークステーションの代わりにCPU等を用い
た専用機で本発明のテレビ会議装置を構成しても良い。
In the above-described embodiment, an example in which the camera 104 or the like is combined with a personal computer or a workstation to form the video conference apparatus of the present invention has been described, but a dedicated machine using a CPU or the like instead of the personal computer or the workstation. You may comprise the video conference apparatus of this invention.

【0050】また、上述の第1及び第2の実施例におい
て、カメラ104の移動後、カメラ制御部105により
カメラ104の角度も自動的に変え、使用者の目線がカ
メラ104のレンズに正対するように構成しても良い。
このようにすることにより、使用者と相手との視線のず
れが全くなくなり、より一層自然な対話を行うことが可
能となる。
In the above-described first and second embodiments, after the camera 104 is moved, the camera control unit 105 automatically changes the angle of the camera 104 so that the user's eyes directly face the lens of the camera 104. It may be configured as follows.
By doing so, there is no shift in the line of sight between the user and the other party, and a more natural dialogue can be performed.

【0051】[0051]

【発明の効果】以上説明したように、本発明のテレビ会
議装置及びテレビ会議システムによれば、会議の相手と
実際に対面して会話を行っているような自然性に優れた
テレビ会議を行うことができる。
As described above, according to the video conference apparatus and the video conference system of the present invention, it is possible to conduct a video conference having an excellent naturalness such as actually having a face-to-face conversation with the other party of the conference. be able to.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例に係るテレビ会議装置の
構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a video conference apparatus according to a first embodiment of the present invention.

【図2】本発明の第1の実施例におけるカメラの移動制
御例を示す図である。
FIG. 2 is a diagram showing an example of camera movement control according to the first embodiment of the present invention.

【図3】本発明の第1の実施例におけるカメラの移動制
御例を示す図である。
FIG. 3 is a diagram showing an example of movement control of a camera according to the first embodiment of the present invention.

【図4】本発明の第2の実施例に係るテレビ会議装置の
構成を示すブロック図である。
FIG. 4 is a block diagram showing a configuration of a video conference device according to a second embodiment of the present invention.

【図5】本発明の第3の実施例におけるカメラの制御例
を説明するための図である。
FIG. 5 is a diagram for explaining a control example of the camera according to the third embodiment of the present invention.

【図6】本発明の第3の実施例に係るテレビ会議装置の
構成を示すブロック図である。
FIG. 6 is a block diagram showing a configuration of a video conference device according to a third embodiment of the present invention.

【図7】従来のテレビ会議システムの構成を示した図で
ある。
FIG. 7 is a diagram showing a configuration of a conventional video conference system.

【図8】本発明の要素的特徴を示すブロック図である。FIG. 8 is a block diagram showing elemental features of the present invention.

【符号の説明】[Explanation of symbols]

1 カメラ(撮影手段) 2 カメラ制御部(撮影制御手段) 3 表示部 4 表示制御部 5 通信部 6 位置検出部 7 画像認識部 8 マイク 9 使用者位置検出部 10 相手画像表示領域 101 デジタイザ 102 透過型液晶表示装置 103 ハーフミラー 104 カメラ 105 カメラ制御装置 106 投写装置 107 デジタイザ制御装置 108 コンピュータ 109 システム制御装置 402 透過型液晶表示装置 406 液晶制御装置 409 システム制御装置 1 camera (imaging means) 2 camera control section (imaging control means) 3 display section 4 display control section 5 communication section 6 position detection section 7 image recognition section 8 microphone 9 user position detection section 10 partner image display area 101 digitizer 102 transparent Liquid crystal display device 103 Half mirror 104 Camera 105 Camera control device 106 Projection device 107 Digitizer control device 108 Computer 109 System control device 402 Transmissive liquid crystal display device 406 Liquid crystal control device 409 System control device

───────────────────────────────────────────────────── フロントページの続き (72)発明者 小林 克行 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 吉村 雄一郎 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 時岡 正樹 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 ─────────────────────────────────────────────────── ─── Continued Front Page (72) Inventor Katsuyuki Kobayashi 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Yuichiro Yoshimura 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Incorporated (72) Inventor Masaki Tokioka 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 テレビ会議に用いるテレビ会議装置にお
いて、 画像を表示する表示手段と、 使用者を撮影する撮影手段と、 テレビ会議の相手側の画像を上記表示手段の相手画像表
示領域に表示させる表示制御手段と、 上記表示手段における上記相手画像表示領域の位置を検
出する位置検出手段と、 上記位置検出手段により検出された上記相手画像表示領
域の位置に応じて上記撮影手段の位置を変化させる撮影
制御手段とを有することを特徴とするテレビ会議装置。
1. In a video conference apparatus used for a video conference, a display means for displaying an image, a photographing means for photographing a user, and an image of the other party of the video conference are displayed in a partner image display area of the display means. Display control means, position detecting means for detecting the position of the partner image display area on the display means, and changing the position of the photographing means according to the position of the partner image display area detected by the position detecting means A video conferencing apparatus comprising: a photographing control means.
【請求項2】 テレビ会議に用いるテレビ会議装置にお
いて、 画像を表示する表示手段と、 使用者を撮影する撮影手段と、 テレビ会議の相手側の画像を上記表示手段に表示させる
表示制御手段と、 上記相手側の画像の画像認識を行う画像認識手段と、 上記画像認識手段によって認識された上記相手側の画像
の所定部分の表示位置に応じて上記撮影手段の位置を変
化させる撮影制御手段とを有することを特徴とするテレ
ビ会議装置。
2. A video conference apparatus used for a video conference, a display unit for displaying an image, a photographing unit for photographing a user, and a display control unit for displaying the image of the other party of the video conference on the display unit. An image recognition means for recognizing the image of the other party, and a photographing control means for changing the position of the photographing means according to the display position of a predetermined portion of the image of the other party recognized by the image recognition means. A video conferencing device having.
【請求項3】 テレビ会議に用いるテレビ会議装置にお
いて、 画像を表示する表示手段と、 使用者を撮影する撮影手段と、 発言を行った使用者の位置を検出する使用者位置検出手
段と、 上記使用者位置検出手段によって検出された発言を行っ
た使用者の位置に応じて上記撮影手段の位置又は角度を
変化させる撮影制御手段とを有することを特徴とするテ
レビ会議装置。
3. A video conference apparatus used for a video conference, a display means for displaying an image, a photographing means for photographing a user, a user position detecting means for detecting a position of a user who made a statement, and A video conferencing apparatus comprising: an image pickup control unit that changes the position or angle of the image pickup unit according to the position of the user who has made a speech detected by the user position detection unit.
【請求項4】 多地点間通信を行ってテレビ会議を行う
テレビ会議システムにおいて、 画像を表示する表示手段と、 自分側の画像を撮影する撮影手段と、 テレビ会議の相手側の画像を上記表示手段の相手画像表
示領域に表示させる表示制御手段と、 上記表示手段における上記相手画像表示領域の位置を検
出する位置検出手段と、 上記位置検出手段により検出された上記相手画像表示領
域の位置に応じて上記撮影手段の位置を変化させる撮影
制御手段とを有することを特徴とするテレビ会議システ
ム。
4. A video conferencing system for performing a video conference by performing multipoint communication, a display means for displaying an image, a photographing means for capturing an image of one's own side, and an image for the other party of the video conference as the above display. Display control means for displaying in the partner image display area of the means, position detecting means for detecting the position of the partner image display area in the display means, and position of the partner image display area detected by the position detecting means. And a photographing control means for changing the position of the photographing means.
JP7263174A 1995-10-11 1995-10-11 Video conference equipment and video conference system Pending JPH09107534A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7263174A JPH09107534A (en) 1995-10-11 1995-10-11 Video conference equipment and video conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7263174A JPH09107534A (en) 1995-10-11 1995-10-11 Video conference equipment and video conference system

Publications (1)

Publication Number Publication Date
JPH09107534A true JPH09107534A (en) 1997-04-22

Family

ID=17385805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7263174A Pending JPH09107534A (en) 1995-10-11 1995-10-11 Video conference equipment and video conference system

Country Status (1)

Country Link
JP (1) JPH09107534A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2343945A (en) * 1998-11-18 2000-05-24 Sintec Company Limited Photographing or recognising a face
JP2001177813A (en) * 1999-12-16 2001-06-29 Oki Electric Ind Co Ltd Inter-device communication method
JP2004264844A (en) * 2003-02-28 2004-09-24 Xerox Corp Method, apparatus, and product for automatically managing conversation floor of computer intervention communication
EP2053853A1 (en) 2007-10-26 2009-04-29 Vestel Elektronik Sanayi ve Ticaret A.S. Detecting the location and identifying a user of an electronic device
JP2010219989A (en) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd Communication support system, display control apparatus, and display control method
US8126705B2 (en) 2003-02-28 2012-02-28 Palo Alto Research Center Incorporated System and method for automatically adjusting floor controls for a conversation
JP2013531309A (en) * 2010-06-29 2013-08-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Method and system for creating a virtual output image from data obtained by an array of image capture devices
US9247201B2 (en) 2009-06-23 2016-01-26 Tencent Holdings Limited Methods and systems for realizing interaction between video input and virtual network scene

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2343945A (en) * 1998-11-18 2000-05-24 Sintec Company Limited Photographing or recognising a face
GB2343945B (en) * 1998-11-18 2001-02-28 Sintec Company Ltd Method and apparatus for photographing/recognizing a face
JP2001177813A (en) * 1999-12-16 2001-06-29 Oki Electric Ind Co Ltd Inter-device communication method
JP2004264844A (en) * 2003-02-28 2004-09-24 Xerox Corp Method, apparatus, and product for automatically managing conversation floor of computer intervention communication
US8126705B2 (en) 2003-02-28 2012-02-28 Palo Alto Research Center Incorporated System and method for automatically adjusting floor controls for a conversation
US8463600B2 (en) 2003-02-28 2013-06-11 Palo Alto Research Center Incorporated System and method for adjusting floor controls based on conversational characteristics of participants
US8676572B2 (en) 2003-02-28 2014-03-18 Palo Alto Research Center Incorporated Computer-implemented system and method for enhancing audio to individuals participating in a conversation
US9412377B2 (en) 2003-02-28 2016-08-09 Iii Holdings 6, Llc Computer-implemented system and method for enhancing visual representation to individuals participating in a conversation
EP2053853A1 (en) 2007-10-26 2009-04-29 Vestel Elektronik Sanayi ve Ticaret A.S. Detecting the location and identifying a user of an electronic device
JP2010219989A (en) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd Communication support system, display control apparatus, and display control method
US9247201B2 (en) 2009-06-23 2016-01-26 Tencent Holdings Limited Methods and systems for realizing interaction between video input and virtual network scene
JP2013531309A (en) * 2010-06-29 2013-08-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Method and system for creating a virtual output image from data obtained by an array of image capture devices

Similar Documents

Publication Publication Date Title
EP3358835B1 (en) Improved method and system for video conferences with hmds
US6208373B1 (en) Method and apparatus for enabling a videoconferencing participant to appear focused on camera to corresponding users
EP3047356B1 (en) Configuration of a touch screen display for conferencing
KR101665229B1 (en) Control of enhanced communication between remote participants using augmented and virtual reality
US7092001B2 (en) Video conferencing system with physical cues
US7916165B2 (en) Systems and method for enhancing teleconferencing collaboration
US5438357A (en) Image manipulating teleconferencing system
US8508571B2 (en) Teleconference system
US7855726B2 (en) Apparatus and method for presenting audio in a video teleconference
US8384760B2 (en) Systems for establishing eye contact through a display
US20110216153A1 (en) Digital conferencing for mobile devices
JP6946684B2 (en) Electronic information board systems, image processing equipment, and programs
JP2016213674A (en) Display control system, display control unit, display control method, and program
JPH09107534A (en) Video conference equipment and video conference system
TW202018649A (en) Asymmetric video conferencing system and method thereof
EP4044589A1 (en) Context dependent focus in a video feed
JP3027983B2 (en) Two-way interactive system
TWI248021B (en) Method and system for correcting out-of-focus eyesight of attendant images in video conferencing
JPH08256316A (en) Communication conference system
CN108427195A (en) A kind of information processing method and equipment based on augmented reality
JPH06311510A (en) Conference supporting system for remote location
CN115280261A (en) Method and apparatus for invoking public or private interactions during a multi-user communication session
JP7306765B2 (en) Communication device, communication program and storage medium
JP4501171B2 (en) Image processing device
JP2003333561A (en) Monitor screen displaying method, terminal, and video conference system