JPH099234A - Video conference system - Google Patents

Video conference system

Info

Publication number
JPH099234A
JPH099234A JP7159205A JP15920595A JPH099234A JP H099234 A JPH099234 A JP H099234A JP 7159205 A JP7159205 A JP 7159205A JP 15920595 A JP15920595 A JP 15920595A JP H099234 A JPH099234 A JP H099234A
Authority
JP
Japan
Prior art keywords
camera
image
speaker
television
video conference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7159205A
Other languages
Japanese (ja)
Inventor
Shoichi Morokuma
彰一 諸隈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP7159205A priority Critical patent/JPH099234A/en
Publication of JPH099234A publication Critical patent/JPH099234A/en
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Details Of Television Scanning (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PURPOSE: To segment, magnify and display the image of a speaker from the video images of a television camera for projecting all conference participants by projecting the image of the speaker beforehand during zoom-up at the time of adjusting the direction of a camera. CONSTITUTION: Input images to a main television camera 5 arranged so as to project the conference participants are projected by an entire display television monitor 8 as they are. Also, the input images obtained by the camera 5 are sent to a moving body discrimination means 10 and the positions of the respective conference participants are discriminated. Further, a sub television camera 6 is arranged parallelly to the camera 5, the image of the camera 5 and the image of the camera 6 are compared and a distance from the television camera to an object is calculated in a distance calculation means 11. It is determined beforehand that the conference participant performs a motion such as raising a hand or the like before speaking. The speaker is discriminated in the means 10, position information decided in a speaker discrimination means 12 is sent to a controller 14, the camera 7 is focused, the speaker is acquired and the screen of the camera 7 is switched to from the image magnifying means 13 of the monitor 9.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、テレビ会議装置の画面
切り替えをスムーズに行うためのものであって、ズーム
アップ用テレビカメラが発言者を捉えるまでの間、会議
参加者全員を映し出すテレビカメラの映像の中から発言
者の画像を切り出して拡大表示するテレビ会議装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is for smoothly switching screens of a video conference device, and a video camera for showing all participants in a conference until the zoom-up TV camera catches a speaker. The present invention relates to a video conferencing device that cuts out an image of a speaker from the video and displays the enlarged image.

【0002】[0002]

【従来の技術】従来のテレビ会議装置においては、発言
者のみの映像を画面に表示させる場合、会議参加者全員
を映し出す画像の中から発言者の画像を切り出す方法
と、ズームアップ用のカメラを動かして発言者をフレー
ミングする方法とがある。前者については、HDTV等
の高解像度テレビで会議参加者全員を映し出しておき、
マイクロフォンから拾った音を手がかりに発言者を判断
し、その発言者の画像を切出し従来のNTSC方式テレ
ビ等で表示する方法が考えられるている。
2. Description of the Related Art In a conventional video conference apparatus, when a video of only a speaker is displayed on a screen, a method of cutting out the image of the speaker from the images showing all the participants in the conference and a camera for zooming up are provided. There is a method of framing the speaker by moving. For the former, show all participants in the conference on a high-definition TV such as HDTV.
A method has been considered in which a speaker is judged based on a sound picked up from a microphone, and an image of the speaker is cut out and displayed on a conventional NTSC system television or the like.

【0003】後者については、カメラの操作者がリモー
トコントロールにより発言者にカメラを向ける方法、発
言者のマイクロフォンから拾った音により自動的にテレ
ビカメラを発言者に向ける方法等が考えられている。
Regarding the latter, a method in which the operator of the camera points the camera at the speaker by remote control, a method in which the television camera is automatically pointed at the speaker by a sound picked up from the speaker's microphone, and the like are considered.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、このよ
うなテレビ会議装置にあっては、全体画像から発言者の
画像を切り出す方法では、HDTVと標準解像度のTV
といった解像度の異なるTVモニタ、TVカメラを用意
する必要があった。また、ズーム用カメラを移動させる
方法では、カメラがズーミング、向き調整している間は
発言者の画像が即座に映し出せず、カメラが発言者を捉
えるまで待たなければならなかった。
However, in such a video conference apparatus, in the method of cutting out the image of the speaker from the whole image, HDTV and standard definition TV are used.
It was necessary to prepare TV monitors and TV cameras with different resolutions. Further, in the method of moving the zoom camera, the image of the speaker cannot be immediately displayed while the camera is zooming and the direction is adjusted, and it is necessary to wait until the camera captures the speaker.

【0005】[0005]

【課題を解決するための手段】本発明はこれらの課題を
解決するためのものであり、カメラで撮影された被写体
が映し出される表示手段を有するテレビ会議装置におい
て、該被写体の動作を判別する動作判別手段と、該動作
判別手段によって判別された被写体を抽出する抽出手段
と、該抽出手段によって抽出された被写体の画像を拡大
する画像拡大手段と、該画像拡大手段によって拡大され
た画像を撮影する撮影手段と、該撮影手段によって撮影
された映像を表示する表示手段から構成されたテレビ会
議装置を提供する。
SUMMARY OF THE INVENTION The present invention is to solve these problems, and in a video conference apparatus having a display means for displaying an object photographed by a camera, an operation for discriminating the operation of the object. Discriminating means, extracting means for extracting the subject discriminated by the motion discriminating means, image enlarging means for enlarging the image of the subject extracted by the extracting means, and photographing the image enlarged by the image enlarging means. Provided is a video conference device including a photographing means and a display means for displaying an image photographed by the photographing means.

【0006】[0006]

【作用】本発明は、カメラの向き調整中にズームアップ
中に前もって発言者の画像を映し出すことにより、テレ
ビ会議の画面切り替えを円滑に行うことが可能となる。
According to the present invention, it is possible to smoothly switch the screen of a video conference by displaying the image of the speaker in advance while zooming up while adjusting the orientation of the camera.

【0007】[0007]

【実施例】以下、本発明の実施例について図面を用いて
説明する。図1は本発明のテレビ会議装置の基本構成を
示すブロック図であり、図2は本発明のテレビ会議装置
のブロック図であり、図3は本発明のテレビ会議装置の
距離算出手段を説明した図であり、図4は本発明のテレ
ビ会議装置の画像拡大手段を説明した図である。図1に
おいて、本発明のテレビ会議装置の基本構成は、画像入
力手段1と、距離検出手段2と、画像処理手段3および
表示手段4とから構成されている。画像入力手段1によ
って入力された画像情報に、距離検出手段2によって検
出された距離情報を付加し、画像処理手段3によって必
要な部分の画像だけを抽出し、それを拡大して表示手段
4によって映し出される。図2において、5は主テレビ
カメラ、6は副テレビカメラ、7はズームアップ用テレ
ビカメラ、8は全体表示テレビモニタ、9は発言者表示
テレビモニタ、10は動体判別手段、11は距離算出手
段、12は発言者判別手段、13は画像拡大手段、14
はカメラ制御装置とから構成されている。図2にもとず
いて動作説明を行う。会議参加者を映し出すように配置
された主テレビカメラ5に入力画像はそのまま全体表示
テレビモニタ8によって映し出される。また、主テレビ
カメラ5で得られた入力画像は動体判別手段10に送ら
れ、各会議参加者の位置を判別する。更に、主テレビカ
メラ5と並列に副テレビカメラ6を配置しておき、主テ
レビカメラ5の画像と副テレビカメラ6の画像とを比較
し、三角法を用いてテビカメラから被写体までの距離を
距離算出手段11によって計算する。会議参加者は発言
する前に手を挙げるなどの動作をすることを予め決めて
おく。発言しようとする人が何かしらの行動をとること
により、主テレビカメラ5および副テレビカメラ6の画
像に変化が生じる。そこで、動体判別手段10によって
認識されている各々の参加者の中から、その画像の変化
を基に発言者を識別する。発言者判別手段12によって
決定したその位置情報はカメラ制御装置14に送られ、
ズームアップ用テレビカメラ7を発言者の向きに調整す
る。このときに。距離算出手段11で計算した距離情報
もカメラ制御装置14に送ることにより、ズームアップ
用テレビカメラ7のピント合わせをカメラの向き調整中
にも開始できる。ズームアップ用テレビカメラ7が完全
に発言者を捕捉したら、発言者表示テレビモニタ9の画
像を画像拡大手段13の画像からズームアップ用テレビ
カメラ7の画面に切り換える。このとき、ズームアップ
用テレビカメラ7の画像と画像拡大手段13で作成した
画像とのマッチングを取り、最も似通った画像になるよ
うにズームアップ用テレビカメラ7のフレーミングを行
うことにより自然な画像切り換えが可能となる。図3に
おいて、(a)はテレビカメラと被写体の位置関係を示
した模式図であり、(b)は主テレビカメラ5から得ら
れた画像を示した図であり、(c)は副テレビカメラ6
から得られた画像を示した図である。主テレビカメラ5
と副テレビカメラ6は互いに平行になるように配置さ
れ、被写体はちょうど主テレビカメラ5の前方に位置し
ているとする。主テレビカメラ5と副テレビカメラ6の
画角は共に2θ、主テレビカメラ5と副テレビカメラ6
との距離をD、主テレビカメラ5と被写体の距離を1と
したとき、直線L上においてテレビカメラの据える映像
は正面を基準に±1tanθの範囲であり、テレビカメ
ラの据えた映像と副テレビカメラ6の据えた映像とでは
同じ被写体がdだけずれて映るとしたとき、このdはd
=D/1tanθで表される。つまり、1=D/dta
nθとなり、画面上のずれdより、テレビカメラから被
写体までの距離1が算出される。主テレビカメラ5の映
像と副テレビカメラ6の映像において、被写体の画像の
ずれを求める際にはブロックマッチング法などを用いる
ことができる。上述のことより、画面のI画素毎に対応
する奥行きが求められ、その求められた値を今後z値と
呼ぶことにする。図2で示される発言者判別手段12に
よって、発言者が手を上げることにより発言者の腕は後
方の壁もしくは発言者自身の身体の手前に来るため画面
上の腕に当たる部分のz値が減少することになる。この
z値の減少をもとに発言者を確定する。また、この挙手
の動作を確認する手段として動きベクトルを使うことが
考えられる。会議中において通常、人の動きは小さいと
思われる。その中において挙手の動作は比較的大きく、
速い動きである。これを2フレーム間から抽出した動き
ベクトルで表し、動きの大きさ、速さから発言者と認識
することができる。図4において、画像拡大手段として
簡単なものに線型補間が考えられる。画像を拡大しよう
とすると、単純に画素間の距離を広くとっただけでは隙
間が生じてしまう。この隙間を埋めるために線型補間を
行うことにする。補間する画素の値は周りの4近傍から
計算して求める。補間しようとする点をE、その値を
e、4近傍の点をA、B、C、D、その値をa、b、
c、dとする。拡大前の画素間の距離を1、点Eが点A
から水平方向にx、垂直方向にyだけ離れているとする
と、Eの値eは、 e=(1−x)(1−y)a+x(1−y)b+(1−
x)yc+xyz で表せる。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a basic configuration of a video conference apparatus of the present invention, FIG. 2 is a block diagram of the video conference apparatus of the present invention, and FIG. 3 describes a distance calculating means of the video conference apparatus of the present invention. FIG. 4 is a diagram for explaining the image enlarging means of the video conference apparatus of the present invention. In FIG. 1, the basic configuration of the video conference apparatus of the present invention comprises an image input means 1, a distance detection means 2, an image processing means 3 and a display means 4. The distance information detected by the distance detection unit 2 is added to the image information input by the image input unit 1, only the image of the necessary portion is extracted by the image processing unit 3, and the image is enlarged and displayed by the display unit 4. It is projected. In FIG. 2, 5 is a main TV camera, 6 is a sub TV camera, 7 is a zoom-up TV camera, 8 is an entire display TV monitor, 9 is a speaker display TV monitor, 10 is a moving body discrimination means, and 11 is a distance calculation means. , 12 is speaker determination means, 13 is image enlargement means, 14
Is composed of a camera controller. The operation will be described based on FIG. The input image is displayed as it is on the entire display TV monitor 8 on the main TV camera 5 arranged so as to display the conference participants. The input image obtained by the main TV camera 5 is sent to the moving body discriminating means 10 to discriminate the position of each conference participant. Further, the sub television camera 6 is arranged in parallel with the main television camera 5, the image of the main television camera 5 and the image of the sub television camera 6 are compared, and the distance from the television camera to the subject is calculated by using the trigonometry. It is calculated by the calculation means 11. It is preliminarily decided that the conference participants should raise their hands before speaking. When the person who is going to speak takes some action, the images of the main television camera 5 and the sub television camera 6 change. Therefore, the speaker is identified from among the participants recognized by the moving body determination unit 10 based on the change in the image. The position information determined by the speaker discrimination means 12 is sent to the camera control device 14,
The zoom-up TV camera 7 is adjusted to the direction of the speaker. At this time. By sending the distance information calculated by the distance calculation means 11 to the camera control device 14, the focus of the zoom-in television camera 7 can be started even while the camera orientation is being adjusted. When the zoom-up TV camera 7 completely captures the speaker, the image on the speaker display TV monitor 9 is switched from the image of the image enlarging means 13 to the screen of the zoom-up TV camera 7. At this time, a natural image switching is performed by matching the image of the zoom-up TV camera 7 with the image created by the image enlarging means 13 and framing the zoom-up TV camera 7 so as to obtain the most similar image. Is possible. In FIG. 3, (a) is a schematic diagram showing the positional relationship between the television camera and the subject, (b) is a diagram showing an image obtained from the main television camera 5, and (c) is a sub television camera. 6
It is the figure which showed the image obtained from. Main TV camera 5
It is assumed that the sub television camera 6 and the sub television camera 6 are arranged in parallel with each other, and the subject is located just in front of the main television camera 5. The angle of view of both the main TV camera 5 and the sub TV camera 6 is 2θ, and the main TV camera 5 and the sub TV camera 6
When the distance between and is D and the distance between the main TV camera 5 and the subject is 1, the image set by the TV camera on the straight line L is within a range of ± 1 tan θ with respect to the front, and the image set by the TV camera and the sub-TV are set. If the same subject as the image set by the camera 6 is deviated by d, this d is d
= D / 1 tan θ. That is, 1 = D / dta
nθ, and the distance 1 from the television camera to the subject is calculated from the shift d on the screen. A block matching method or the like can be used when obtaining the deviation between the images of the subject between the image of the main TV camera 5 and the image of the sub TV camera 6. From the above, the depth corresponding to each I pixel of the screen is obtained, and the obtained value will be referred to as the z value hereinafter. When the speaker raises his / her hand by the speaker determination means 12 shown in FIG. 2, the arm of the speaker comes to the rear wall or to the front of the speaker's own body, so that the z value of the portion that hits the arm on the screen decreases. Will be done. The speaker is determined based on this decrease in z value. Further, it is possible to use a motion vector as a means for confirming the motion of the raised hand. People usually seem to have little movement during a meeting. Among them, the motion of raising hands is relatively large,
It is a fast movement. This can be represented by a motion vector extracted from between two frames, and the speaker can be recognized from the magnitude and speed of the motion. In FIG. 4, linear interpolation can be considered as a simple image enlarging means. When trying to enlarge an image, a gap is created by simply increasing the distance between pixels. Linear interpolation is performed to fill this gap. The value of the pixel to be interpolated is calculated and calculated from the surrounding four neighbors. The point to be interpolated is E, its value is e, 4 neighboring points are A, B, C, D, its value is a, b,
Let c and d. The distance between pixels before enlargement is 1, point E is point A
Is x in the horizontal direction and y in the vertical direction, the value e of E is: e = (1-x) (1-y) a + x (1-y) b + (1-
x) yc + xyz.

【0008】これにより、擬似的にズームアップした画
像を作り出すことができる。
This makes it possible to create a pseudo zoomed-in image.

【0009】[0009]

【発明の効果】以上説明したように本発明は、テレビ会
議において発言者を追尾するためのズームアップ用テレ
ビカメラが向き調整時においても事前に、全体画像から
切り出し、拡大した発言者の画像を表示することによっ
ていち早く発言者の画像をテレビ会議の相手先へ送るこ
とができる。
As described above, according to the present invention, a zoom-up TV camera for tracking a speaker in a video conference cuts out the entire image and enlarges the speaker image in advance even when the orientation is adjusted. By displaying the image, it is possible to quickly send the image of the speaker to the other party of the video conference.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明のテレビ会議装置の基本構成を示すブ
ロック図である。
FIG. 1 is a block diagram showing a basic configuration of a video conference device of the present invention.

【図2】 本発明のテレビ会議装置のブロック図であ
る。
FIG. 2 is a block diagram of a video conference device of the present invention.

【図3】 本発明のテレビ会議装置の距離算出手段を説
明した図である。
FIG. 3 is a diagram illustrating a distance calculating unit of the video conference apparatus of the present invention.

【図4】 本発明のテレビ会議装置の画像拡大手段を説
明した図である。
FIG. 4 is a diagram illustrating an image enlarging unit of the video conference apparatus of the present invention.

【符号の説明】[Explanation of symbols]

1 画像入力手段 2 距離検出手段 3 画像処理手段 4 表示手段 5 主テレビカメラ 6 副テレビカメラ 7 ズームアップ用カメラ 8 全体表示モニタ 9 発言者表示テレビモニタ 10 動体判別手段 1 Image Input Means 2 Distance Detection Means 3 Image Processing Means 4 Display Means 5 Main TV Camera 6 Sub TV Camera 7 Zoom Camera 8 Whole Display Monitor 9 Speaker Display Television Monitor 10 Moving Object Discriminating Means

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】カメラで撮影された被写体が映し出される
表示手段を有するテレビ会議装置において、該被写体の
動作を判別する動作判別手段と、該動作判別手段によっ
て判別された被写体を抽出する抽出手段と、該抽出手段
によって抽出された被写体の画像を拡大する画像拡大手
段と、該画像拡大手段によって拡大された画像を撮影す
る撮影手段と、該撮影手段によって撮影された映像を表
示する表示手段とから構成されたことを特徴とするテレ
ビ会議装置。
1. A video conferencing apparatus having display means for displaying an object photographed by a camera, comprising: an operation judging means for judging an operation of the object; and an extracting means for extracting the object judged by the operation judging means. An image enlarging means for enlarging the image of the subject extracted by the extracting means, a photographing means for photographing the image enlarged by the image enlarging means, and a display means for displaying the image photographed by the photographing means. A video conferencing device characterized by being configured.
JP7159205A 1995-06-26 1995-06-26 Video conference system Pending JPH099234A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7159205A JPH099234A (en) 1995-06-26 1995-06-26 Video conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7159205A JPH099234A (en) 1995-06-26 1995-06-26 Video conference system

Publications (1)

Publication Number Publication Date
JPH099234A true JPH099234A (en) 1997-01-10

Family

ID=15688625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7159205A Pending JPH099234A (en) 1995-06-26 1995-06-26 Video conference system

Country Status (1)

Country Link
JP (1) JPH099234A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795106B1 (en) * 1999-05-18 2004-09-21 Intel Corporation Method and apparatus for controlling a video camera in a video conferencing system
JP2007235969A (en) * 2007-03-19 2007-09-13 Ricoh Co Ltd Video recording system, program and recording medium
JP2011244454A (en) * 2010-05-18 2011-12-01 Polycom Inc Videoconferencing endpoint having multiple voice-tracking cameras

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795106B1 (en) * 1999-05-18 2004-09-21 Intel Corporation Method and apparatus for controlling a video camera in a video conferencing system
JP2007235969A (en) * 2007-03-19 2007-09-13 Ricoh Co Ltd Video recording system, program and recording medium
JP2011244454A (en) * 2010-05-18 2011-12-01 Polycom Inc Videoconferencing endpoint having multiple voice-tracking cameras

Similar Documents

Publication Publication Date Title
EP0971537B1 (en) Video system
JP5929221B2 (en) Scene state switching system and method based on dynamic detection of region of interest
US7015954B1 (en) Automatic video system using multiple cameras
KR101782282B1 (en) Control device, camera system, and control method of performing camera control
US20100118112A1 (en) Group table top videoconferencing device
EP2722831A2 (en) Linking-up photographing system and control method for linked-up cameras thereof
JP2007189503A (en) Terminal device and program
WO2009011592A1 (en) Method and system for automatic camera control
US20080030585A1 (en) Method and apparatus for compensating for movement of a video surveillance camera
JP4581210B2 (en) Video conference system
CN111818304A (en) Image fusion method and device
EP4106326A1 (en) Multi-camera automatic framing
JP2007158680A (en) Tracking imaging apparatus and tracking imaging system utilizing it
JP2023164525A5 (en) Communication terminal, display method, and program
JP2001036898A (en) Camera system for generating panoramic video
JPH099234A (en) Video conference system
JPH09116886A (en) Picture information communication equipment
JPH06178295A (en) Picture signal processing unit for video conference and utterance party pattern mgnification synthesis device
KR102009988B1 (en) Method for compensating image camera system for compensating distortion of lens using super wide angle camera and Transport Video Interface Apparatus used in it
WO2018074262A1 (en) Communication device, communication method, and program
JPH0481088A (en) Coincident glance type figure picture display image pickup device
JPH07135646A (en) Video conference system
JP2001275096A (en) Image pickup and display device and videoconference device
JP2004289658A (en) Image pickup system and method for operating image pickup device
JPH1079881A (en) Image pickup device