JPH0937224A - Video conference equipment - Google Patents

Video conference equipment

Info

Publication number
JPH0937224A
JPH0937224A JP7185215A JP18521595A JPH0937224A JP H0937224 A JPH0937224 A JP H0937224A JP 7185215 A JP7185215 A JP 7185215A JP 18521595 A JP18521595 A JP 18521595A JP H0937224 A JPH0937224 A JP H0937224A
Authority
JP
Japan
Prior art keywords
image
video
signal
line
synthesizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7185215A
Other languages
Japanese (ja)
Inventor
Masabumi Yoshizawa
正文 吉澤
Koji Sugishita
幸司 杉下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7185215A priority Critical patent/JPH0937224A/en
Publication of JPH0937224A publication Critical patent/JPH0937224A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To synthesize and display immediately images in an optional direction and in a range desired by a user from a video image picked up with a fixed television camera by using an image synthesizer conducting see-through conversion. SOLUTION: A video signal outputted from a television camera 1 is inputted to a coder 2, in which the signal is compression-coded. The coded signal is sent to a line 4 by a communication controller 3. The video signal to be sent is obtained by picking up an entire scene of a conference room. When only a specific pattern in the video image is desired to be displayed, a direction commander 8 is used to designate a range and a direction of the required video image. Then an image synthesizer 9 applies see-trough conversion to video data written in a video memory 7 to generate a video image of a size and in a sight direction outputted from a command amount calculation section and synthesizes cursor image data based on position data from a cursor display section and the result is displayed by a display device 11.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、離れた地点間で映像と
音声の送受信を行なうテレビ会議装置において、ユーザ
が必要とする映像を表示する装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video conference apparatus for transmitting and receiving video and audio between distant points, and an apparatus for displaying a video required by a user.

【0002】[0002]

【従来の技術】従来、テレビ会議システムの映像表示に
関して、任意の方向の映像を表示する手段としては、例
えば特願平3−55148号公報のようにテレビカメラ
の撮影方向を何らかの手段で制御することが行なわれて
いる。
2. Description of the Related Art Conventionally, as a means for displaying an image in an arbitrary direction in displaying an image in a video conference system, for example, as shown in Japanese Patent Application No. 3-55148, the shooting direction of a television camera is controlled by some means. Is being done.

【0003】図2は、従来のテレビ会議装置における撮
影、表示に関する部分の構成図であり、21はテレビカ
メラ、22はテレビカメラ制御装置、23は符号化装
置、24は通信制御装置、25は回線、26は通信制御
装置、27は復号化装置、28は表示装置である。
FIG. 2 is a block diagram of a portion relating to shooting and display in a conventional video conference apparatus. Reference numeral 21 is a television camera, 22 is a television camera control device, 23 is an encoding device, 24 is a communication control device, and 25 is A line, 26 is a communication control device, 27 is a decoding device, and 28 is a display device.

【0004】会議参加者は、会場を撮影するテレビカメ
ラ21に対し、テレビカメラ制御装置22を用いて逐次
パン、チルト、ズームなどの操作を行ない、視聴したい
方向と範囲の映像を獲得する。撮影された映像データは
符号化装置23によって適当な符号に符号化され、通信
制御装置24によって回線25に送られる。送られたデ
ータは通信制御装置26によって受け取られ、復号化装
置27によってもとの映像データに復元され、最後に表
示装置28によって映像として表示される。
[0006] The conference participants successively perform panning, tilting, zooming, and the like on the television camera 21 for photographing the venue, using the television camera control device 22, to obtain the image in the desired direction and range. The captured video data is encoded into an appropriate code by the encoding device 23 and sent to the line 25 by the communication control device 24. The transmitted data is received by the communication control device 26, restored to the original video data by the decoding device 27, and finally displayed as a video by the display device 28.

【0005】このような構成では、話者が変わった時な
どにその方向の映像を見たいと思うと、ユーザが複雑な
カメラの制御を行なわなければならず、しかもカメラの
動作には時間がかかり、即座に見たい映像が得られるわ
けではない。また、あらかじめ複数のカメラで会場を撮
影しておき、話者が変わった時にその方向を映している
カメラの映像に手動で切替えたり、あるいは話者の方向
を音声認識で特定してその方向の映像に自動で切替えた
りする方法も行なわれているが、いずれにしても話者を
画面の中心に持ってこようとすればカメラの姿勢の制御
が必要であり、最終的に望む映像を獲得するまでには時
間がかかる。
With such a configuration, when the user wants to see the image in that direction when the speaker changes, the user must control the complicated camera, and the operation of the camera takes time. It takes a lot of time and does not mean that you can get the video you want to see immediately. You can also take pictures of the venue with multiple cameras in advance and manually switch the direction of the speaker when the speaker changes, or you can use voice recognition to identify the direction of the speaker and identify the direction. There is also a method of automatically switching to the image, but in any case, if you try to bring the speaker to the center of the screen, you need to control the posture of the camera and finally obtain the desired image. It takes time.

【0006】[0006]

【発明が解決しようとする課題】上記のような構成で
は、参加者が任意の方向の映像を視聴したいと思って
も、カメラの制御を行なう必要があり、そのため必要な
映像を即座に獲得できないという問題点を有していた。
With the above-mentioned structure, even if the participant wants to watch the image in any direction, he / she needs to control the camera, so that the required image cannot be immediately obtained. Had the problem.

【0007】また、上記のような構成では回線を通して
送られてくる映像は1種類だけであり、その映像をその
まま表示するので会場の複数の参加者は常に全員が同じ
映像を見なければならず、個々人の自由な視聴が制限さ
れるという問題点を有していた。
Further, in the above-mentioned structure, only one kind of image is sent through the line, and since that image is displayed as it is, all the participants in the venue must always see the same image. However, there is a problem that the free viewing of individual is restricted.

【0008】本発明は上記問題点に鑑み、テレビカメラ
の姿勢を制御することなく、任意の方向の映像を即座に
獲得することを第一の目的とする。
In view of the above problems, it is a first object of the present invention to immediately acquire an image in an arbitrary direction without controlling the attitude of the television camera.

【0009】また、会議の参加者が個々に、好みに応じ
た方向の映像を視聴できることを第二の目的とする。
A second object is that each participant in the conference can view the image in the direction according to his or her preference.

【0010】[0010]

【課題を解決するための手段】本発明の第一の目的を達
成するための第一の手段は、会場全体を撮影するテレビ
カメラと、表示したい映像の方向と範囲を指定する方向
指示装置と、映像信号の一部を幾何変換することによ
り、前記方向指示装置で指定された方向と範囲の映像信
号を合成する画像合成装置と、前記画像画像合成装置が
合成した映像を表示する表示装置を具備するものであ
る。
The first means for achieving the first object of the present invention is a television camera for photographing the entire venue, and a direction indicating device for specifying the direction and range of the image to be displayed. An image synthesizing device for synthesizing a video signal in a direction and a range designated by the direction indicating device by geometrically transforming a part of the video signal, and a display device for displaying a video synthesized by the image image synthesizing device. It is equipped with.

【0011】また、本発明の第一の目的を達成するため
の第二の手段は、映像の一部が重なるように配置し、全
体として会場全体を撮影する複数のテレビカメラと、表
示したい映像の方向と範囲を指定する方向指示装置と、
前記方向指示装置で指定された方向に基づき、複数の映
像信号の中から適切な映像信号を選択する映像選択装置
と、前記映像選択装置が選択した映像信号の一部を幾何
変換することにより前記方向指示装置で指定された方向
と範囲の映像信号を合成する画像合成装置と、前記画像
合成装置が合成した映像を表示する表示装置を具備する
ものである。
A second means for achieving the first object of the present invention is to arrange a plurality of video cameras so that a part of the video images overlap each other, and a plurality of television cameras for photographing the entire venue as a whole, and a video image to be displayed. A direction indicator that specifies the direction and range of
An image selection device that selects an appropriate image signal from a plurality of image signals based on the direction specified by the direction indicating device, and a geometric conversion of a part of the image signal selected by the image selection device. An image synthesizing device for synthesizing video signals in a direction and a range designated by the direction indicating device, and a display device for displaying a video image synthesized by the image synthesizing device.

【0012】また、本発明の第一の目的を達成するため
の第三の手段は、会場全体を撮影するテレビカメラと、
話者の方向を特定する話者位置測定装置と、その結果に
基づき話者を画面の中心に置く画像を合成する画像合成
装置と、前記画像合成装置が合成した映像を表示する表
示装置を具備するものである。
A third means for achieving the first object of the present invention is a television camera for photographing the entire venue,
A speaker position measuring device for specifying the direction of the speaker, an image synthesizing device for synthesizing an image in which the speaker is placed at the center of the screen based on the result, and a display device for displaying the image synthesized by the image synthesizing device are provided. To do.

【0013】また、本発明の第二の目的を達成するため
の第四の手段は、会場全体を撮影するテレビカメラと、
表示したい映像の方向と範囲を指定する複数の方向指示
装置と、映像信号の一部を幾何変換することにより、前
記複数の方向指示装置で指定された方向と範囲の映像信
号を合成する複数の画像合成装置と、前記複数の画像画
像合成装置が合成した映像を表示する複数の表示装置を
具備するものである。
A fourth means for achieving the second object of the present invention is a television camera for photographing the entire venue,
A plurality of direction indicating devices that specify the direction and range of the image to be displayed, and a plurality of direction combining devices that combine the video signals of the directions and ranges specified by the plurality of direction indicating devices by geometrically transforming a part of the video signals. An image synthesizing device and a plurality of display devices for displaying images synthesized by the plurality of image image synthesizing devices are provided.

【0014】[0014]

【作用】本発明は、上記した第一の手段の構成によれ
ば、テレビカメラで撮影された映像信号に対し、ユーザ
が方向指示装置を用いて視聴したい任意の方向と範囲を
指定し、画像合成装置が幾何変換を行なって指定された
方向と範囲の映像を合成し、表示装置が合成映像を表示
する。
According to the present invention, according to the structure of the above-mentioned first means, the user designates an arbitrary direction and range which he / she wants to view by using the direction indicating device for the video signal photographed by the television camera, and the image is displayed. The combining device performs geometric transformation to combine the images in the specified direction and range, and the display device displays the combined image.

【0015】また、第二の手段の構成によれば、会場を
重複するように撮影した複数の映像信号の中から、方向
指示装置で指定された方向と範囲に基づいて映像選択装
置が適切な信号を選択し、その信号から任意の映像を画
像合成装置が幾何変換によって合成し、表示装置が合成
映像を表示する。
Further, according to the structure of the second means, the image selection device is suitable based on the direction and range designated by the direction indicating device from the plurality of image signals taken so as to overlap the venue. A signal is selected, an arbitrary image is combined from the signal by an image combining device by geometric transformation, and a display device displays the combined image.

【0016】また、第三の手段の構成によれば、話者位
置測定装置が話者がいる方向を特定し、画像合成装置が
テレビカメラによって撮影された映像信号に対して幾何
変換を行なうことにより話者を画面の中心に置く映像を
合成し、表示装置が合成映像を表示する。
According to the structure of the third means, the speaker position measuring device specifies the direction in which the speaker is present, and the image synthesizing device geometrically transforms the video signal taken by the television camera. Causes the image to be placed with the speaker at the center of the screen to be combined, and the display device to display the combined image.

【0017】また、第四の手段の構成によれば、テレビ
カメラで撮影した映像信号に対し、複数の画像合成装置
が複数の方向指示装置で指定されたそれぞれ異なる方向
と範囲の映像を同時に合成し、その映像を個々の表示装
置が表示する。
Further, according to the structure of the fourth means, a plurality of image synthesizing devices simultaneously synthesize images of different directions and ranges designated by a plurality of direction indicating devices with respect to the video signals picked up by the television camera. Then, the image is displayed on each display device.

【0018】[0018]

【実施例】以下、本発明の実施例を、図面を参照しなが
ら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0019】図1は、本発明の第一の実施例の構成を示
したものである。図1において、1は会議の会場全体を
撮影するテレビカメラ、2はテレビカメラ1が出力する
映像信号を圧縮符号化する符号化装置、3は符号化装置
2によって符号化された信号を送信する通信制御装置、
4は信号が伝送される通信回線、5は送られた信号を受
信する通信制御装置、6は受信した信号を映像信号に復
元する復号化装置、7は復元された映像信号が書き込ま
れる画像メモリ、8は必要とする映像の方向と範囲を指
定する方向指示装置、9は方向指示装置8によって指定
された方向と範囲の映像を、画像メモリ7に書き込まれ
た映像信号から合成する画像合成装置、10は合成され
た映像信号が書き込まれる画像メモリ、11は画像メモ
リ10に書き込まれた映像信号を映像として表示する表
示装置である。
FIG. 1 shows the configuration of the first embodiment of the present invention. In FIG. 1, reference numeral 1 is a television camera for photographing the entire conference hall, 2 is an encoding device for compressing and encoding a video signal output from the television camera 1, and 3 is a signal transmitted by the encoding device 2. Communication control device,
4 is a communication line through which signals are transmitted, 5 is a communication control device that receives sent signals, 6 is a decoding device that restores the received signals into video signals, and 7 is an image memory in which the restored video signals are written , 8 is a direction indicating device for designating the direction and range of a required image, and 9 is an image synthesizing device for synthesizing the image of the direction and range designated by the direction indicating device 8 from the video signal written in the image memory 7. Reference numeral 10 is an image memory in which the synthesized video signal is written, and 11 is a display device for displaying the video signal written in the image memory 10 as a video.

【0020】テレビカメラ1は会議場の正面に設置し、
フレームに会議場全体が収まるようにズームなどを調整
して固定する。テレビカメラ1から出力される映像信号
は符号化装置2に入力し、圧縮符号化を行なう。符号化
方式としては、どのような種類のものを用いてもよい
が、例えばITU−TH.261などが考えられる。
The TV camera 1 is installed in front of the conference hall,
Adjust the zoom etc. and fix it so that the entire conference hall fits in the frame. The video signal output from the television camera 1 is input to the encoding device 2 and compression-encoded. Any type of encoding method may be used, for example, ITU-TH. 261 and the like are conceivable.

【0021】図3は、H.261を採用した場合の符号
化処理の一般的な流れである。入力された映像信号に対
して、S21でDCT量子化、動きベクトル検出などの
予測符号化、S22で信号の多重化による可変長符号
化、S23で符号発生量制御、誤り訂正符号の付加によ
る伝送符号化をそれぞれ行う。符号化された信号は通信
制御装置3によって回線4に送る。利用する回線はどの
ような種類のものでもよいが、例えばINS64が考え
られる。受信側では、通信制御装置5が信号を受信し、
復号化装置6が符号化と逆の処理を行なってもとの映像
信号に復元する。復元された映像信号は、逐次フレーム
単位で画像メモリ7に書き込む。
FIG. This is a general flow of encoding processing when H.261 is adopted. The input video signal is subjected to predictive coding such as DCT quantization and motion vector detection in S21, variable length coding by signal multiplexing in S22, code generation amount control in S23, and transmission by adding an error correction code. Encode each. The encoded signal is sent to the line 4 by the communication control device 3. Any type of line may be used, but INS64 is conceivable, for example. On the receiving side, the communication control device 5 receives the signal,
The decoding device 6 performs the reverse processing of the encoding to restore the original video signal. The restored video signal is sequentially written in the image memory 7 in frame units.

【0022】送られてきた映像は会場全体を撮影したも
のであるが、実際にはその映像の中の特定の一部分、例
えばその時点の話者だけを映したいという場合がある。
そのような場合、方向指示装置8を用いて必要とする映
像の方向と範囲を指定する。
The image sent is an image of the entire venue, but in reality, there is a case where it is desired to show only a specific part of the image, for example, the speaker at that time.
In such a case, the direction and range of the required image are designated by using the direction indicating device 8.

【0023】図4は、方向指示装置8の構成を示すもの
である。ポインティングデバイス41は、ユーザがそれ
を動かすことで画面上の特定の位置を指定し、またボタ
ンを押すことより種々の操作を指示する。操作量検出部
42はポインティングデバイス41の動きとボタン操作
を検出する。指示量算出部43は、操作量検出部42の
出力に基づき、単位時間後に画面に表示する映像の視線
方向と大きさを求め、画像合成装置9に送る。ユーザが
ポインティングデバイス41による指示を行なわい時に
は、指示量算出部43はその時点で表示している映像の
視線方向と画面全体の大きさを送る。カーソル表示部4
4は、映像の表示画面上にカーソルを表示するための表
示位置を画像合成装置9に送る。画像合成装置9は、指
示量算出部43の出力に基づいて作成した映像と、カー
ソル表示部44の出力に基づいて作成したカーソルの画
像を合成する。
FIG. 4 shows the structure of the direction indicator 8. The pointing device 41 specifies a specific position on the screen by the user moving the pointing device 41, and gives various instructions by pressing a button. The operation amount detection unit 42 detects the movement of the pointing device 41 and the button operation. The instruction amount calculation unit 43 obtains the line-of-sight direction and the size of the image displayed on the screen after a unit time based on the output of the operation amount detection unit 42, and sends it to the image synthesizing device 9. When the user gives an instruction with the pointing device 41, the instruction amount calculation unit 43 sends the line-of-sight direction of the image currently displayed and the size of the entire screen. Cursor display part 4
4 sends the display position for displaying the cursor on the image display screen to the image synthesizing device 9. The image synthesizing device 9 synthesizes the video created based on the output of the instruction amount calculation unit 43 and the image of the cursor created based on the output of the cursor display unit 44.

【0024】表示画面には、画面左上を原点、水平方向
右向きをX軸、垂直方向下向きをY軸とし、画面を構成
する画素の大きさを座標の単位とする座標系を設定す
る。画面上のカーソルの表示位置は、この座標系上で、
適当な初期値を設定しておく。
On the display screen, a coordinate system is set in which the upper left corner of the screen is the origin, the horizontal right direction is the X axis, and the vertical downward direction is the Y axis, and the size of the pixels forming the screen is the unit of coordinates. The display position of the cursor on the screen is on this coordinate system
Set an appropriate initial value.

【0025】ユーザは画面上のカーソルの位置を見なが
らポインティングデバイス41を動かし、操作量検出部
42が逐次その移動量を検出する。操作量検出部42は
さらに、その移動量を表示画面上の画素数に対応させ、
画面上のカーソルの新しい座標を求める。例えば、ポイ
ンティングデバイス42の1mmの移動を、1画素分の
カーソルの移動に対応させる。カーソル表示部44は、
カーソルの表示位置を求められた座標に変更する。
The user moves the pointing device 41 while looking at the position of the cursor on the screen, and the operation amount detection unit 42 sequentially detects the movement amount. The operation amount detection unit 42 further associates the movement amount with the number of pixels on the display screen,
Find the new coordinates of the cursor on the screen. For example, the movement of the pointing device 42 by 1 mm corresponds to the movement of the cursor for one pixel. The cursor display section 44 is
Change the cursor display position to the required coordinates.

【0026】また、ポインティングデバイス41にはボ
タンをつけ、このボタンを押しながら動かすことで、ユ
ーザは画面上の適当な領域を指定する。ボタンを押して
動かし始めた時点、およびボタンを離した時点でのカー
ソルの座標を操作量検出部42で求める。指示量算出部
43は、この2点を結ぶ直線を対角線とし各辺が座標軸
に平行な矩形領域を求め、さらに、この領域の中心点の
座標を求める。この中心点と原点を通る直線が、ユーザ
が求める画像の視線方向となる。また領域全体を完全に
包含し、かつ最小となるように、縦横比が表示画面の縦
横比と等しい領域のサイズを求める。求めた中心点の座
標と領域のサイズは、画像合成装置9に送る。
A button is attached to the pointing device 41, and the user designates an appropriate area on the screen by moving the button while pressing the button. The operation amount detection unit 42 obtains the coordinates of the cursor at the time when the button is pressed and started to move and when the button is released. The designated amount calculation unit 43 obtains a rectangular region whose sides are parallel to the coordinate axes with the straight line connecting these two points as a diagonal line, and further obtains the coordinates of the center point of this region. A straight line passing through the center point and the origin is the line-of-sight direction of the image desired by the user. Further, the size of the area whose aspect ratio is equal to the aspect ratio of the display screen is obtained so as to completely include the entire area and to minimize it. The obtained coordinates of the center point and the size of the area are sent to the image synthesizing device 9.

【0027】図5は、受信した映像の領域、画面に表示
中の領域、ポインティングデバイス41で指定した領
域、および指示量算出部43が求めた領域の関係を示し
たものである。これは、画面には受信した映像の一部が
表示されており、ユーザがさらにその一部を拡大して表
示しようとした場合の図である。
FIG. 5 shows the relationship among the area of the received image, the area being displayed on the screen, the area specified by the pointing device 41, and the area obtained by the instruction amount calculation unit 43. This is a diagram when a part of the received video is displayed on the screen, and the user further enlarges and displays the part.

【0028】ユーザはまた、ポインティングデバイス4
1を動かして画面上の適当な位置にカーソルを移動さ
せ、そこでポインティングデバイス41のボタンを押す
ことで、視線方向のみを指定する。この場合、指示量算
出部43が画像合成装置9に送る視線方向は画面上でカ
ーソルが置かれた画素の座標とし、表示領域のサイズは
その時点で画面に表示している領域のサイズに等しいも
のとする。
The user also uses the pointing device 4
By moving 1 to move the cursor to an appropriate position on the screen and pressing the button of the pointing device 41 there, only the line-of-sight direction is specified. In this case, the line-of-sight direction sent by the instruction amount calculation unit 43 to the image synthesizing device 9 is the coordinates of the pixel where the cursor is placed on the screen, and the size of the display area is equal to the size of the area currently displayed on the screen. I shall.

【0029】ユーザはまた、現在表示されている映像に
対して、相対的に視線方向と大きさを指定することも可
能とする。画面上に、「右」「左」「上」「下」「拡
大」「縮小」というボタンの絵を表示しておき、ユーザ
がカーソルをその絵の上に持っていってボタンを押した
ことを操作量検出部42が検出すると、指示量算出部4
3は、現在表示している映像の視線方向、およびサイズ
に対して、あらかじめ決められた単位変化量を加えて出
力する。方向の相対的な指定方法としては、カーソルを
画面の端に移動させた後もポインティングデバイス41
を同方向に動かしていることを検出することで、その方
向の映像を表示したいということを判断してもよい。
The user can also specify the line-of-sight direction and size relative to the currently displayed image. A picture of the buttons "Right,""Left,""Up,""Down,""Enlarge," and "Reduce" is displayed on the screen, and the user holds the cursor over the picture and presses the button. When the manipulated variable detector 42 detects the operation amount, the instruction amount calculator 4
3 outputs by adding a predetermined unit change amount to the line-of-sight direction and size of the currently displayed image. As a relative direction designation method, the pointing device 41 can be used even after the cursor is moved to the edge of the screen.
It may be possible to determine that the user wants to display an image in that direction by detecting that he is moving in the same direction.

【0030】画像合成装置9は、画像メモリ7に書き込
まれている映像データに透視変換を施すことによって、
指示量算出部43から出力された視線方向と大きさの映
像を作成し、さらに、カーソル表示部44からの位置デ
ータに基づくカーソル画像データとの合成を行なう。
The image synthesizing device 9 performs perspective transformation on the video data written in the image memory 7,
An image of the line-of-sight direction and size output from the pointing amount calculation unit 43 is created, and further, the image is combined with the cursor image data based on the position data from the cursor display unit 44.

【0031】図6は、テレビカメラを中心とする3次元
の撮影空間において、受信した映像における撮影画像面
と、新たに合成する映像の仮想的な撮影画像面の、幾何
的な関係を示したものである。
FIG. 6 shows a geometrical relationship between a photographed image plane of a received image and a virtual photographed image plane of a newly synthesized image in a three-dimensional photographing space centered on a television camera. It is a thing.

【0032】図6に示すように、テレビカメラで撮影す
る空間中に、テレビカメラのレンズ中心、すなわち実際
に撮影する映像の視点を原点、撮影方向をZ軸、水平右
方向をX軸、鉛直上向きをY軸とする座標系を設定す
る。そうすると、カメラで撮影する画像面は、原点から
Z軸方向にFだけ離れた平面上にあると考えることがで
きる。ここでFはテレビカメラの焦点距離に等しい。こ
の映像に対し、その中の特定の点と領域サイズを指定
し、その方向の映像を合成するということは、カメラの
視線方向を変更し、かつ焦点距離を変更して撮影した場
合の画像面を合成することである。この画像は、撮影し
た画像において視野角が合成画像の視野角と一致する部
分のデータを、仮想的な画像面に写像することで作成す
ることができる。ここで、この合成しようとしている画
像を仮想撮影画像と呼ぶことにする。
As shown in FIG. 6, in the space for shooting with a TV camera, the lens center of the TV camera, that is, the viewpoint of the image actually shot, is the origin, the shooting direction is the Z axis, the horizontal right direction is the X axis, and the vertical direction. Set the coordinate system with the Y-axis pointing upward. Then, the image plane photographed by the camera can be considered to be on a plane separated from the origin by F in the Z-axis direction. Here, F is equal to the focal length of the television camera. Specifying a specific point and area size in this image and combining the images in that direction means changing the line-of-sight direction of the camera and changing the focal length. Is to synthesize. This image can be created by mapping the data of the portion of the captured image whose viewing angle matches the viewing angle of the composite image onto a virtual image plane. Here, the image to be combined will be referred to as a virtual captured image.

【0033】図7は画像合成装置9における処理の流れ
を示したものである。また、図8は、テレビカメラによ
る撮影画像面、ある時点で表示装置11が表示している
画像面、そしてこれから画像合成装置9が合成しようと
している仮想撮影画像面を、Y軸の正の方向から見た平
面図である。
FIG. 7 shows the flow of processing in the image synthesizing device 9. Further, FIG. 8 shows the image plane taken by the television camera, the image plane displayed by the display device 11 at a certain point, and the virtual image plane being synthesized by the image synthesizing device 9 in the positive direction of the Y axis. It is the top view seen from.

【0034】以下、図7の流れに従って画像合成の手法
を具体的に説明する。 (S701)テレビカメラで撮影した映像について、焦
点距離f0、X軸方向の画角θh0、Y軸方向の画角θ
v0を求める。ただしf0は画素数に換算した値とす
る。まず、処理の開始前にテレビカメラの仕様より撮像
面の大きさ、および縦横の画素数を調べておき、さらに
テレビカメラを設置し、ズームなどを適当に調整した段
階で焦点距離の値を読みとる。テレビカメラの撮像面の
縦、横の長さと画素数をそれぞれW、H、nx、ny、
読みとった焦点距離をFとすると、f0、θh0、θv
0はそれぞれ次式で表される。
The image synthesizing method will be specifically described below with reference to the flow of FIG. (S701) Focal length f0, angle of view in the X-axis direction θh0, angle of view in the Y-axis direction θ of an image captured by a TV camera
Find v0. However, f0 is a value converted into the number of pixels. First of all, before starting the processing, the size of the image pickup surface and the number of pixels in the vertical and horizontal directions are checked from the specifications of the TV camera, and the value of the focal length is read when the TV camera is installed and the zoom is adjusted appropriately. . The vertical and horizontal lengths of the image pickup surface of the television camera and the number of pixels are W, H, nx, ny, and
When the read focal length is F, f0, θh0, θv
Each 0 is represented by the following equation.

【0035】[0035]

【数1】 [Equation 1]

【0036】[0036]

【数2】 [Equation 2]

【0037】[0037]

【数3】 (Equation 3)

【0038】(S702)方向指示装置8から、次の単
位時間後に表示する画像の視線方向と重なる画素の座標
(Iu,Iv)、および画像の範囲nx’,ny’が入
力される。これはこの時点で画面に表示している画像を
基準にした値で、視線方向は画面左上を原点とする画面
上の座標で、範囲は画面上の画素数で指定される。ここ
では、この座標(Iu,Iv)を、次式によって表示画
像の中央を原点とする座標系の値(Iu’,Iv’)に
変換する。
(S702) From the direction indicating device 8, the coordinates (Iu, Iv) of the pixel which overlaps the line-of-sight direction of the image to be displayed after the next unit time and the image ranges nx 'and ny' are input. This is a value based on the image displayed on the screen at this time, the line-of-sight direction is specified by coordinates on the screen with the origin at the upper left of the screen, and the range is specified by the number of pixels on the screen. Here, the coordinates (Iu, Iv) are converted into values (Iu ′, Iv ′) in the coordinate system having the center of the display image as the origin by the following equation.

【0039】[0039]

【数4】 (Equation 4)

【0040】[0040]

【数5】 (Equation 5)

【0041】なおここで、表示画面の大きさは、撮影画
像面の大きさnx*nyに等しいとしている。
Here, it is assumed that the size of the display screen is equal to the size nx * ny of the photographed image surface.

【0042】(S703)仮想撮影画像面の焦点距離
f’と、テレビカメラの撮影空間における視線方向θ
x’、θy’を求める。この視線方向は、原点を回転基
準として、視線ベクトルがZ軸から水平方向、垂直方向
にそれぞれどれだけ回転しているかで表す。Z軸方向を
基準として、X軸、Y軸方向への回転を、それぞれ正の
向きとする。
(S703) Focal length f'of the virtual image plane and line-of-sight direction θ in the image space of the television camera
Find x'and θy '. The line-of-sight direction is represented by how much the line-of-sight vector rotates from the Z axis in the horizontal direction and the vertical direction with the origin as the rotation reference. Rotation in the X-axis direction and the Y-axis direction with respect to the Z-axis direction is the positive direction.

【0043】まず、この時点で表示している画像の焦点
距離をf、視線方向をθx、θyとする。映像の表示開
始時点では送られてきた映像をそのまま表示することに
すると、これらの初期値は、f=f0、θx=0、θy
=0である。仮想撮影画像面の水平方向の画角をθv’
と置くと、
First, the focal length of the image displayed at this time is f, and the line-of-sight directions are θx and θy. If the transmitted image is displayed as it is at the start of displaying the image, these initial values are f = f0, θx = 0, θy.
= 0. The angle of view in the horizontal direction of the virtual image plane is θv '
And put

【0044】[0044]

【数6】 (Equation 6)

【0045】となり、求める仮想撮影画像面の焦点距離
f’は、このθv’を用いて、
Then, the focal length f ′ of the virtual image plane to be obtained is calculated by using this θv ′.

【0046】[0046]

【数7】 (Equation 7)

【0047】となる。ここではf’は水平方向の画角を
用いて求めたが、同様にして垂直方向の画角を用いて求
めても良い。
It becomes Here, f ′ is obtained using the horizontal angle of view, but it may be similarly obtained using the vertical angle of view.

【0048】また、視線方向θx’、θy’は、現在表
示中の画面の視線方向θx、θyに、差分に相当する角
度を加えることにより、
The line-of-sight directions θx ′ and θy ′ are obtained by adding an angle corresponding to the difference to the line-of-sight directions θx and θy of the currently displayed screen.

【0049】[0049]

【数8】 (Equation 8)

【0050】[0050]

【数9】 [Equation 9]

【0051】となる。 (S704)画像の左上頂点を原点とする仮想撮影画像
上の画素P(u,v)の座標を、視点を原点とする空間
の3次元座標P’(x,y,z)に変換する回転行列R
を求める。画素Pは、仮想撮影画像の視点を原点、視線
方向をZ軸、水平方向をX軸、垂直方向をY軸とする座
標系において、P(u’,v’,f’)と表せる。ただ
し、
It becomes (S704) Rotation for converting the coordinates of the pixel P (u, v) on the virtual captured image with the origin at the upper left apex of the image into the three-dimensional coordinates P ′ (x, y, z) in the space with the viewpoint as the origin. Matrix R
Ask for. The pixel P can be represented as P (u ′, v ′, f ′) in a coordinate system in which the viewpoint of the virtual captured image is the origin, the line-of-sight direction is the Z axis, the horizontal direction is the X axis, and the vertical direction is the Y axis. However,

【0052】[0052]

【数10】 (Equation 10)

【0053】[0053]

【数11】 [Equation 11]

【0054】である。この座標系は、カメラの撮影方向
をZ軸とする座標系に対して、Y軸まわりにθx’X軸
まわりにθy’だけ回転させたものに等しい。従って、
P’(x、y、z)は回転行列Rを用いて
Is as follows. This coordinate system is equivalent to a coordinate system in which the shooting direction of the camera is the Z axis rotated by θx ′ around the Y axis by θy ′ around the X axis. Therefore,
P '(x, y, z) is the rotation matrix R

【0055】[0055]

【数12】 (Equation 12)

【0056】として求められ、ここでRはWhere R is

【0057】[0057]

【数13】 (Equation 13)

【0058】となる。 (S705)仮想撮影画像面上の画素に、テレビカメラ
で撮影した画像中の画素データを写像する。空間中の任
意の位置に画像面を設定した場合、その画像面上の画素
の色濃度は、その画素を透視変換によって撮影画像上に
投影した時の対応する画素の色濃度に等しい。ここで、
撮影画像面はZ=f0の平面と考えることができ、透視
変換によって、空間内の点(x、y、z)はこの平面上
の点(f0*x/z、f0*y/z、f0)に投影され
る。したがって、仮想撮影画面上のすべての画素に対
し、(S704)で求めた回転行列Rを用いて空間内で
の3次元座標を求め、さらにそれを透視変換によって撮
影画像面上に投影して対応する画素を求め、その画素の
色濃度を仮想撮影画面上の画素の色濃度とすることによ
って、求める画像を合成する。ただし、撮影画像は離散
的なデータであり、投影点の座標が画素の座標と一致す
るとは限らない。その場合、投影点の近傍にある画素の
データを用い、それらを近似することによって投影点に
おける色濃度を求め、それを仮想撮影画面上の画素の値
とする。
It becomes (S705) Pixel data in the image captured by the television camera is mapped onto the pixels on the virtual captured image surface. When the image surface is set at an arbitrary position in space, the color density of the pixel on the image surface is equal to the color density of the corresponding pixel when the pixel is projected on the captured image by the perspective transformation. here,
The captured image plane can be considered as a plane of Z = f0, and the point (x, y, z) in the space is converted to the point (f0 * x / z, f0 * y / z, f0 on this plane by perspective transformation. ) Is projected. Therefore, for all the pixels on the virtual photographing screen, the three-dimensional coordinates in the space are obtained by using the rotation matrix R obtained in (S704), and further, the three-dimensional coordinates are projected on the photographed image surface by the perspective transformation. The desired image is synthesized, and the color density of the pixel is set as the color density of the pixel on the virtual photographing screen to synthesize the desired image. However, the captured image is discrete data, and the coordinates of the projection point do not always match the coordinates of the pixel. In that case, the data of the pixels in the vicinity of the projection point is used, and the color density at the projection point is obtained by approximating them, and this is used as the value of the pixel on the virtual photographing screen.

【0059】(S706)カーソル表示部44の出力に
基づき、(S705)で合成した画像にカーソルの画像
を重ねる。カーソルの形状データそのものは変化しない
ので、あらかじめ作成したものを保持しておく。カーソ
ル表示部44からは、カーソルの表示位置が指示される
ので、合成画像上の対応する位置の画素のデータを、カ
ーソルのデータと置き換える。
(S706) Based on the output of the cursor display section 44, the image of the cursor is superimposed on the image combined in (S705). Since the shape data of the cursor itself does not change, the data created in advance is retained. Since the cursor display position is designated from the cursor display unit 44, the pixel data at the corresponding position on the composite image is replaced with the cursor data.

【0060】(S707)合成した画像データを画像メ
モリ10に書き込む。画像合成装置9は、以上説明した
手順の処理を単位時間ごとに繰り返し行なう。
(S707) The combined image data is written in the image memory 10. The image synthesizing device 9 repeats the processing of the procedure described above every unit time.

【0061】表示装置11は、画像メモリ10に次々に
書き込まれる画像データを順に読みだし、画面上に表示
する。
The display device 11 sequentially reads out the image data written in the image memory 10 one after another and displays it on the screen.

【0062】このように、本発明の実施例のテレビ会議
装置によれば、透視変換を用いることによって、テレビ
カメラを固定し会場全体を撮影した映像から、ユーザが
望む任意の方向と範囲の画像を自由に合成、表示するこ
とができる。
As described above, according to the video conference apparatus of the embodiment of the present invention, by using the perspective transformation, the image of the arbitrary direction and range desired by the user can be obtained from the video image of the entire venue with the video camera fixed. Can be freely combined and displayed.

【0063】図9は、本発明の第二の実施例の構成を示
したものである。図9において、1−1〜nは会議の会
場を撮影する複数台のテレビカメラ、2−1〜nはテレ
ビカメラ1−1〜nが出力する映像信号を圧縮符号化す
る複数の符号化装置、93は符号化装置2−1〜nによ
って符号化された複数の信号をまとめて送信する通信制
御装置、94は信号が伝送される通信回線、95は送ら
れた信号を受信し、複数の信号に分ける通信制御装置、
6−1〜nは受信した信号を映像信号に復元する複数の
復号化装置、7−1〜nは復元された映像信号が書き込
まれる複数の画像メモリ、97は画像メモリ7−1〜n
から、適当なデータを選択する映像選択装置、98は必
要とする映像の方向と範囲を指定する方向指示装置、9
は方向指示装置98によって指定された方向と範囲の映
像を、映像選択装置97が選択した映像データから合成
する画像合成装置、10は合成された映像信号が書き込
まれる画像メモリ、11は画像メモリ10に書き込まれ
た映像信号を映像として表示する表示装置である。
FIG. 9 shows the configuration of the second embodiment of the present invention. In FIG. 9, reference numerals 1-1 to n denote a plurality of television cameras for photographing a conference venue, and reference numerals 2-1 to n denote a plurality of encoding devices for compressing and encoding video signals output by the television cameras 1-1 to n. , 93 is a communication control device that collectively transmits a plurality of signals encoded by the encoding devices 2-1 to n, 94 is a communication line through which the signals are transmitted, and 95 is a plurality of signals that receive the transmitted signals. Communication control device to divide into signals,
Reference numerals 6-1 to n denote a plurality of decoding devices that restore the received signals into video signals, 7-1 to n denote a plurality of image memories in which the restored video signals are written, and 97 denotes an image memory 7-1 to n.
, A video selection device for selecting appropriate data, 98 is a direction designating device for designating the direction and range of the required video, 9
Is an image synthesizing device for synthesizing the image in the direction and range designated by the direction indicating device 98 from the image data selected by the image selecting device 97, 10 is an image memory in which the synthesized image signal is written, 11 is the image memory 10 It is a display device for displaying the video signal written in the image as a video.

【0064】テレビカメラ1−1〜nは、放射線状に配
置して会場を分担して撮影する。出力されるn本の映像
信号は、符号化装置2−1〜nによって個別に圧縮符号
化し、通信制御装置93によって回線94にまとめて送
り出す。送られてきた信号は通信制御装置95が受信
し、複数の信号に戻す。個々の信号は復号化装置6−1
〜nによって映像信号に復元し、それぞれ画像メモリ7
−1〜nに書き込む。
The television cameras 1-1 to n are arranged in a radial pattern and share images of the venue. The output n video signals are individually compression-coded by the coding devices 2-1 to n, and are collectively sent to the line 94 by the communication control device 93. The communication control device 95 receives the transmitted signal and returns it to a plurality of signals. Each signal is decoded by the decoding device 6-1.
~ N to restore the video signal, and the image memory 7
Write to -1 to n.

【0065】ユーザは、方向指示装置98に対して、次
の単位時間後に表示する画像の方向と領域を指定するだ
けでなく、どの映像信号を元データとして利用するかを
指定する。例えば、複数の映像の大きさを縮小したもの
を画面に表示しておき、ポインティングデバイスなどで
見たい映像を指定する。指定された映像は、表示画面全
体に一旦表示し、さらにその映像に対して改めてユーザ
が視線方向と範囲を指定する。
The user not only specifies the direction and area of the image to be displayed after the next unit time to the direction indicating device 98, but also specifies which video signal is used as the original data. For example, a plurality of video images reduced in size are displayed on the screen, and a video image to be viewed is designated by a pointing device or the like. The designated video is once displayed on the entire display screen, and the user again designates the line-of-sight direction and range for the video.

【0066】映像選択装置97は、方向指示装置98の
出力に基づき、複数の映像信号の中から適当な信号を選
択して画像合成装置9に送る。
The image selecting device 97 selects an appropriate signal from a plurality of image signals based on the output of the direction indicating device 98 and sends it to the image synthesizing device 9.

【0067】画像合成装置9は、映像選択装置97が選
択した映像信号をもとに、方向指示装置98で指定した
方向と範囲の画像を透視変換によって合成し、画像メモ
リ10に書き込む。表示装置11は、書き込まれた画像
を画面に表示する。
The image synthesizing device 9 synthesizes the image in the direction and range designated by the direction indicating device 98 by perspective transformation based on the video signal selected by the video selecting device 97, and writes it in the image memory 10. The display device 11 displays the written image on the screen.

【0068】このように、本発明の実施例のテレビ会議
装置によれば、複数台のテレビカメラで撮影した映像を
元にすることで、ユーザが望む任意の方向と範囲の画像
を自由にかつ高精細に、合成、表示することができる。
As described above, according to the video conference apparatus of the embodiment of the present invention, an image in any direction and range desired by a user can be freely and freely obtained based on the images taken by a plurality of TV cameras. It is possible to synthesize and display in high definition.

【0069】図10は、本発明の第三の実施例の構成を
示したものである。図10において、1は会議の会場全
体を撮影するテレビカメラ、2は映像信号を圧縮符号化
する符号化装置、3は符号化装置2によって符号化され
た信号を送信する通信制御装置、4は信号が伝送される
通信回線、5は送られた信号を受信する通信制御装置、
6は受信した信号を映像信号に復元する復号化装置、7
は復元された映像信号が書き込まれる画像メモリ、11
は画像メモリ7に書き込まれた映像信号を映像として表
示する表示装置、107はテレビカメラからの出力信号
を書き込む画像メモリ、108は撮影された画像の中か
ら話者の方向と範囲を特定する話者位置測定装置、10
9は話者位置測定装置108によって指定された方向と
範囲の映像を、画像メモリ107に書き込まれた映像信
号から、透視変換によって合成する画像合成装置であ
る。
FIG. 10 shows the configuration of the third embodiment of the present invention. In FIG. 10, 1 is a television camera for photographing the whole meeting place, 2 is a coding device for compressing and coding a video signal, 3 is a communication control device for transmitting a signal coded by the coding device 2, and 4 is a communication control device. A communication line through which a signal is transmitted, 5 is a communication control device that receives the transmitted signal,
6 is a decoding device for restoring the received signal to a video signal, 7
Is an image memory into which the restored video signal is written, 11
Is a display device for displaying the video signal written in the image memory 7 as a video, 107 is an image memory for writing the output signal from the television camera, and 108 is a talk for specifying the direction and range of the speaker from the taken image. Person position measuring device, 10
An image synthesizing device 9 synthesizes a video image in the direction and range specified by the speaker position measuring device 108 from the video signal written in the image memory 107 by perspective transformation.

【0070】テレビカメラ1は会議場の正面に設置し、
フレームに会議場全体が収まるように撮影する。テレビ
カメラ1の出力信号は、一旦画像メモリ107に書き込
む。
The TV camera 1 is installed in front of the conference hall,
Shoot so that the entire conference hall fits in the frame. The output signal of the television camera 1 is once written in the image memory 107.

【0071】話者位置測定装置108は、音声認識によ
って話者の方向を検出する。複数のマイクへの音声入力
信号を解析し、音声の発信源の方向を検出してこれを話
者の方向とする。検出した方向は、テレビカメラの撮影
方向をZ軸とする座標系において、Z軸を基準とするX
軸、Y軸方向それぞれの回転角θx’、θy’で表し、
画像合成装置109に送る。これが合成画像の視線方向
となる。
The speaker position measuring device 108 detects the direction of the speaker by voice recognition. The voice input signals to a plurality of microphones are analyzed, the direction of the voice source is detected, and this is taken as the direction of the speaker. The detected direction is X based on the Z axis in the coordinate system with the shooting direction of the TV camera as the Z axis.
Represented by rotation angles θx ′ and θy ′ in the axis and Y-axis directions,
It is sent to the image synthesizer 109. This is the line-of-sight direction of the composite image.

【0072】画像合成装置109は、指定された視線方
向の画像を、画像メモリ107に書き込まれている画像
データに対して透視変換を行なうことで合成する。変換
の対象領域の大きさについては、あらかじめ参加者数な
どを考慮して撮影画像をn分割した領域の画素数n
x’、ny’を設定しておき、この大きさの領域を視線
方向に投影して仮想的な撮影画像面を合成する。
The image synthesizing device 109 synthesizes the image in the designated line-of-sight direction by performing perspective transformation on the image data written in the image memory 107. Regarding the size of the conversion target area, the number of pixels n in the area obtained by dividing the captured image into n in consideration of the number of participants in advance.
By setting x'and ny 'in advance, a region of this size is projected in the direction of the line of sight to synthesize a virtual photographed image plane.

【0073】合成した画像のデータは、符号化装置2に
よって逐次圧縮符合化し、通信制御装置3によって回線
4に送る。受信側では通信制御装置5が信号を受信し、
復号化装置6が符号化と逆の処理を行なってもとの映像
信号に復元する。復元された映像信号は、逐次フレーム
単位で画像メモリ7に書き込む。表示装置11は、画像
メモリ7に書き込まれた画像データを読み出して、画面
に表示する。
The data of the combined image is sequentially compressed and encoded by the encoder 2 and sent to the line 4 by the communication controller 3. On the receiving side, the communication control device 5 receives the signal,
The decoding device 6 performs the reverse processing of the encoding to restore the original video signal. The restored video signal is sequentially written in the image memory 7 in frame units. The display device 11 reads out the image data written in the image memory 7 and displays it on the screen.

【0074】このように、本発明の実施例のテレビ会議
装置によれば、会場全体を撮影した映像に対して話者が
写っている領域を特定し、その方向の画像を透視変換に
よって合成することにより、話者が替わった時点で、即
座にその話者を中心とする映像を画面に表示することが
できる。
As described above, according to the video conference apparatus of the embodiment of the present invention, the region in which the speaker is shown is specified in the video image of the entire hall, and the image in that direction is synthesized by perspective transformation. As a result, when the speaker is changed, an image centering on the speaker can be immediately displayed on the screen.

【0075】図11は、本発明の第四の実施例の構成を
示したものである。図11において、1は会議の会場全
体を撮影するテレビカメラ、2はテレビカメラ1が出力
する映像信号を圧縮符号化する符号化装置、3は符号化
装置2によって符号化された信号を送信する通信制御装
置、4は信号が伝送される通信回線、5は送られた信号
を受信する通信制御装置、6は受信した信号を映像信号
に復元する復号化装置、117は復元された映像信号が
書き込まれる画像メモリ、8−1〜nは必要とする映像
の方向と範囲を指定する複数の方向指示装置、9−1〜
nは方向指示装置8−1〜nによって指定された方向と
範囲の映像を、画像メモリ117に書き込まれた映像信
号から合成する複数の画像合成装置、10−1〜nは合
成された映像信号が書き込まれる複数の画像メモリ、1
1−1〜nは画像メモリ10−1〜nに書き込まれた映
像信号を映像として表示する複数の表示装置である。
FIG. 11 shows the configuration of the fourth embodiment of the present invention. In FIG. 11, reference numeral 1 is a television camera for photographing the entire conference hall, 2 is an encoding device for compressing and encoding the video signal output by the television camera 1, and 3 is a signal transmitted by the encoding device 2. A communication control device, 4 is a communication line through which a signal is transmitted, 5 is a communication control device that receives a sent signal, 6 is a decoding device that restores the received signal to a video signal, and 117 is a restored video signal. The image memory to be written, 8-1 to n are a plurality of direction indicating devices for designating the direction and range of the required video, 9-1 to 9-
n is a plurality of image synthesizing devices for synthesizing the image in the direction and range designated by the direction indicating devices 8-1 to 8-n from the video signals written in the image memory 117, and 10-1 to n are the synthesized video signals. Multiple image memories into which 1 is written
Reference numerals 1-1 to n are a plurality of display devices for displaying the video signals written in the image memories 10-1 to 10-n as video images.

【0076】テレビカメラ1は会議場の正面に設置し、
フレームに会議場全体が収まるようにする。テレビカメ
ラ1から出力される映像信号は符号化装置2に入力し、
適当な圧縮符号化を行なう。符号化された信号は通信制
御装置3によって回線4に送る。送られた信号は通信制
御装置5が受信し、復号化装置6が符号化と逆の処理を
行なってもとの映像信号に復元する。復元された映像信
号は、逐次フレーム単位で画像メモリ117に書き込
む。
The TV camera 1 is installed in front of the conference hall,
Make sure that the entire conference room fits in the frame. The video signal output from the television camera 1 is input to the encoding device 2,
Appropriate compression encoding is performed. The encoded signal is sent to the line 4 by the communication control device 3. The transmitted signal is received by the communication control device 5, and the decoding device 6 restores the original video signal by performing the processing opposite to the encoding. The restored video signal is sequentially written in the image memory 117 in frame units.

【0077】複数のユーザは、個々に用意された表示装
置11−1〜nの画面に表示される映像を見ながら、そ
れぞれ方向指示装置8−1〜nを用いて見たい映像の視
線方向と範囲を指定する。
While watching the images displayed on the screens of the individually prepared display devices 11-1 to 11-n, the plurality of users respectively use the direction indicating devices 8-1 to 8-n to determine the line-of-sight directions of the images to be viewed. Specify the range.

【0078】画像合成装置9−1〜nは、それぞれ独立
に、指定された方向と範囲の画像を合成する。まず、指
定された方向と範囲に基づき仮想的な撮影画像面を設定
し、この画像面を構成する個々の画素に対して、透視変
換によって対応する撮影画像面上の画素を求める。さら
に、求めた画素の色濃度、もしくはその近傍の画素の色
濃度を、画像メモリ117に書き込まれたデータから読
み出し、仮想撮影画像面上の画素の色濃度を決定するこ
とにより、画像を合成する。
The image synthesizing devices 9-1 to 9-n independently synthesize the images in the designated direction and range. First, a virtual photographed image plane is set on the basis of the designated direction and range, and for each pixel constituting this image plane, the corresponding pixel on the photographed image plane is obtained by perspective transformation. Further, the obtained color density of the pixel or the color density of the pixel in the vicinity thereof is read from the data written in the image memory 117, and the color density of the pixel on the virtual photographed image plane is determined to synthesize the image. .

【0079】合成した画像はそれぞれ画像メモリ10−
1〜nに書き込み、それらを表示装置11−1〜nが読
み出して、個々のユーザの前に設置された表示画面に表
示する。
The synthesized images are respectively stored in the image memory 10-
1 to n, and the display devices 11-1 to 11-n read them and display them on a display screen installed in front of each user.

【0080】このように、本発明の実施例のテレビ会議
装置によれば、複数台の画像合成装置や方向指示装置、
表示装置を用いることにより、受信側会場の複数の参加
者に対して、それぞれ独立して任意の方向と範囲の画像
を合成、表示することができる。
As described above, according to the video conference apparatus of the embodiment of the present invention, a plurality of image synthesizing apparatuses and direction indicating apparatuses,
By using the display device, it is possible to synthesize and display images in arbitrary directions and ranges independently for a plurality of participants at the reception site.

【0081】図12は、本発明の第五の実施例の構成を
示したものである。図12において、1−1〜nは会議
の会場を撮影する複数台のテレビカメラ、2−1〜nは
テレビカメラ1−1〜nが出力する映像信号を圧縮符号
化する複数の符号化装置、93は符号化装置2−1〜n
によって符号化された複数の信号をまとめて送信する通
信制御装置、94は信号が伝送される通信回線、95は
送られた信号を受信し、複数の信号に分ける通信制御装
置、6−1〜nは受信した信号を映像信号に復元する複
数の復号化装置、117−1〜nは復元された映像信号
が書き込まれる複数の画像メモリ、97−1〜nは画像
メモリ117−1〜nから適当なデータを選択する複数
の映像選択装置、98−1〜nは必要とする映像の方向
と範囲を指定する複数の方向指示装置、9−1〜nは方
向指示装置98−1〜nによって指定された方向と範囲
の映像を、映像選択装置97−1〜nが選択した映像デ
ータから合成する複数の画像合成装置、10−1〜nは
合成された映像信号が書き込まれる複数の画像メモリ、
11−1〜nは画像メモリ10に書き込まれた映像信号
を映像として表示する複数の表示装置である。
FIG. 12 shows the configuration of the fifth embodiment of the present invention. In FIG. 12, 1-1 to n are a plurality of television cameras for photographing the meeting place, 2-1 to n are a plurality of encoding devices for compressing and encoding the video signals output by the television cameras 1-1 to n. , 93 are encoding devices 2-1 to n
A communication control device for collectively transmitting a plurality of signals encoded by the above, a communication line 94 for transmitting the signals, a communication control device 95 for receiving the transmitted signals and dividing them into a plurality of signals, 6-1 to 6-1 n is a plurality of decoding devices that restore the received signal to a video signal, 117-1 to n are a plurality of image memories in which the restored video signals are written, and 97-1 to n are image memories 117-1 to n. A plurality of image selection devices for selecting appropriate data, 98-1 to n are a plurality of direction indicating devices for specifying the direction and range of a required image, and 9-1 to n are direction indicating devices 98-1 to 98n. A plurality of image synthesizing devices for synthesizing the image in the designated direction and range from the image data selected by the image selecting devices 97-1 to 97-n are a plurality of image memories in which the synthesized image signals are written. ,
Reference numerals 11-1 to 11-n denote a plurality of display devices for displaying the video signals written in the image memory 10 as video.

【0082】テレビカメラ1−1〜nは、放射線状に配
置して会場を分担して撮影する。出力されるn本の映像
信号は、符号化装置2−1〜nによって個別に圧縮符号
化し、通信制御装置93によって回線94にまとめて送
り出す。送られてきた信号は通信制御装置95が受信
し、複数の信号に戻す。個々の信号は復号化装置6−1
〜nによって映像信号に復元し、それぞれ画像メモリ1
17−1〜nに書き込む。
The television cameras 1-1 to n are arranged in a radial pattern so as to share the space for photographing. The output n video signals are individually compression-coded by the coding devices 2-1 to n, and are collectively sent to the line 94 by the communication control device 93. The communication control device 95 receives the transmitted signal and returns it to a plurality of signals. Each signal is decoded by the decoding device 6-1.
~ N to restore the video signal, each image memory 1
Write to 17-1 to n.

【0083】複数のユーザは、個々に用意された表示装
置11−1〜nの画面に表示される映像を見ながら、そ
れぞれ方向指示装置98−1〜nを用いて、見たい映像
の視線方向と範囲を指定する。また同時に、送られてき
た複数の映像信号の中から、どの映像信号を元データと
して利用するかを指定する。
The plurality of users use the direction indicating devices 98-1 to 98-n while watching the images displayed on the screens of the individually prepared display devices 11-1 to 11-n, respectively. And specify the range. At the same time, which of the plurality of video signals has been sent is designated as the original data.

【0084】映像選択装置97−1〜nは、方向指示装
置98−1〜nの出力に基づき、それぞれ複数の映像信
号の中から適当な信号を選択して画像合成装置9−1〜
nに送る。
The image selecting devices 97-1 to 97-n select an appropriate signal from a plurality of image signals based on the outputs of the direction indicating devices 98-1 to 98-n, and the image synthesizing devices 9-1 to 9-1.
send to n.

【0085】画像合成装置9−1〜nは、それぞれ独立
に、指定された方向と範囲の画像を透視変換によって合
成する。まず、指定された方向と範囲に基づき仮想的な
撮影画像面を設定し、この画像面を構成する個々の画素
に対して、透視変換によって対応する撮影画像面上の画
素を求める。さらに、求めた画素の色濃度、もしくはそ
の近傍の画素の色濃度を、映像選択装置97−1〜nか
ら送られるデータから読み取り、仮想撮影画像面上の画
素の色濃度を決定することにより、画像を合成する。
The image synthesizing devices 9-1 to 9-n independently synthesize images in a specified direction and range by perspective transformation. First, a virtual photographed image plane is set on the basis of the designated direction and range, and for each pixel constituting this image plane, the corresponding pixel on the photographed image plane is obtained by perspective transformation. Further, by reading the obtained color density of the pixel or the color density of the pixel in the vicinity thereof from the data sent from the image selection devices 97-1 to 97-n, and determining the color density of the pixel on the virtual photographed image surface, Combine images.

【0086】合成した画像はそれぞれ画像メモリ10−
1〜nに書き込む。表示装置11−1〜nは、書き込ま
れた画像を画面に表示する このように、本発明の実施例のテレビ会議装置によれ
ば、複数台のテレビカメラで撮影した映像を元にすると
ともに、複数台の画像合成装置や方向指示装置、表示装
置を用いることにより、受信側会場の複数の参加者に対
して、それぞれ独立して任意の方向と範囲の高精細な画
像を合成、表示することができる。
The synthesized images are stored in the image memory 10-
Write to 1-n. The display devices 11-1 to 11-n display the written image on the screen. As described above, according to the video conference apparatus of the embodiment of the present invention, the video images taken by a plurality of TV cameras are used as the basis, and By using multiple image synthesizers, direction indicators, and display devices, it is possible to independently synthesize and display high-definition images in any direction and range to multiple participants at the reception site. You can

【0087】[0087]

【発明の効果】以上のように、本発明によれば、透視変
換を行なう画像合成装置を用いることにより、テレビカ
メラを固定して撮影した映像から、ユーザが望む任意の
方向と範囲の画像を即座に合成、表示することができ
る。
As described above, according to the present invention, an image in an arbitrary direction and range desired by a user can be obtained from an image taken with a television camera fixed by using an image synthesizing device for performing perspective transformation. Can be combined and displayed instantly.

【0088】また、複数台の画像合成装置や方向指示装
置、表示装置を用いることにより、受信側会場の複数の
参加者に対して、それぞれ独立して任意の方向と範囲の
画像を合成、表示することができる。
Further, by using a plurality of image synthesizing devices, a direction indicating device, and a display device, images of arbitrary directions and ranges are independently synthesized and displayed to a plurality of participants at the reception site. can do.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第一の実施例におけるテレビ会議装置
の構成図
FIG. 1 is a configuration diagram of a video conference apparatus according to a first embodiment of the present invention.

【図2】従来例におけるテレビ会議装置の構成図FIG. 2 is a configuration diagram of a video conference device in a conventional example.

【図3】H.261による符号化処理の一般的な流れを
示す図
FIG. Diagram showing the general flow of the encoding process by H.261.

【図4】本発明の第一の実施例におけるテレビ会議装置
の方向指示装置の構成図
FIG. 4 is a configuration diagram of a direction indicating device of the video conference device according to the first embodiment of the present invention.

【図5】本発明の第一の実施例におけるテレビ会議装置
の領域指定の摸式図
FIG. 5 is a schematic diagram of area designation of the video conference apparatus according to the first embodiment of the present invention.

【図6】本発明の第一の実施例におけるテレビ会議装置
の画像面の幾何的関係の摸式図
FIG. 6 is a schematic diagram of a geometrical relationship of image planes of the video conference apparatus according to the first embodiment of the present invention.

【図7】本発明の第一の実施例におけるテレビ会議装置
の画像合成装置の処理の流れを示す図
FIG. 7 is a diagram showing a flow of processing of the image synthesizing device of the video conference device in the first embodiment of the present invention.

【図8】本発明の第一の実施例におけるテレビ会議装置
の画像面の幾何的関係図
FIG. 8 is a geometrical relationship diagram of the image plane of the video conference apparatus according to the first embodiment of the present invention.

【図9】本発明の第二の実施例におけるテレビ会議装置
の構成図
FIG. 9 is a configuration diagram of a video conference device according to a second embodiment of the present invention.

【図10】本発明の第三の実施例におけるテレビ会議装
置の構成図
FIG. 10 is a configuration diagram of a video conference device according to a third embodiment of the present invention.

【図11】本発明の第四の実施例におけるテレビ会議装
置の構成図
FIG. 11 is a configuration diagram of a video conference device according to a fourth embodiment of the present invention.

【図12】本発明の第五の実施例におけるテレビ会議装
置の構成図
FIG. 12 is a configuration diagram of a video conference device according to a fifth embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 テレビカメラ 2 符号化装置 3 通信制御装置 4 通信回線 5 通信制御装置 6 復号化装置 7 画像メモリ 8 方向指示装置 9 画像合成装置 10 画像メモリ 11 表示装置 DESCRIPTION OF SYMBOLS 1 TV camera 2 Encoding device 3 Communication control device 4 Communication line 5 Communication control device 6 Decoding device 7 Image memory 8 Direction indicator 9 Image synthesizing device 10 Image memory 11 Display device

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】会場全体を撮影するテレビカメラと、 前記テレビカメラが出力する映像信号を送信する送信装
置と、 送信された信号を伝送する回線と、 前記回線を通って来た信号を受信する受信装置と、 表示したい映像の方向と範囲を指定する方向指示装置
と、 前記受信装置が受信した映像信号の一部を幾何変換する
ことにより前記方向指示装置で指定した方向と範囲の映
像信号を合成する画像合成装置と、 前記画像合成装置が合成した映像を表示する表示装置と
を具備するテレビ会議装置。
1. A television camera for photographing the entire venue, a transmitting device for transmitting a video signal output by the television camera, a line for transmitting the transmitted signal, and a signal received through the line. A receiving device, a direction indicating device that specifies the direction and range of an image to be displayed, and a video signal in the direction and range specified by the direction indicating device by geometrically transforming a part of the video signal received by the receiving device. A video conference apparatus comprising: an image synthesizing device for synthesizing; and a display device for displaying a video synthesized by the image synthesizing device.
【請求項2】映像の一部が重なるように配置し、全体と
して会場全体を撮影する複数のテレビカメラと、 前記複数のテレビカメラが個々に出力する映像信号をま
とめて送信する送信装置と、送信された信号を伝送する
回線と、 前記回線を通って来た信号を受信する受信装置と、 受信した複数の信号表示したい映像の方向と範囲を指定
する方向指示装置と、 前記方向指示装置で指定された方向に基づき、前記受信
装置が受信した複数の映像信号の中から適切な映像信号
を選択する映像選択装置と、 前記映像選択装置が選択した映像信号の一部を幾何変換
することにより前記方向指示装置で指定された方向と範
囲の映像信号を合成する画像合成装置と、 前記画像合成装置が合成した映像を表示する表示装置と
を具備するテレビ会議装置。
2. A plurality of television cameras arranged so that a part of the images are overlapped with each other and photographing the entire venue as a whole, and a transmission device for collectively transmitting the video signals individually output by the plurality of television cameras, A line for transmitting the transmitted signal, a receiving device for receiving the signal transmitted through the line, a direction indicating device for specifying the direction and range of the received plurality of signals to be displayed, and the direction indicating device. A video selection device that selects an appropriate video signal from a plurality of video signals received by the reception device based on a designated direction, and geometrically transforms a part of the video signal selected by the video selection device. A video conference apparatus comprising: an image synthesizing device for synthesizing video signals in a direction and range designated by the direction indicating device; and a display device for displaying a video image synthesized by the image synthesizing device.
【請求項3】会場全体を撮影するテレビカメラと、 前記テレビカメラが出力する信号を書き込む画像メモリ
と、 話者の方向を特定する話者位置測定装置と、 前記話者位置測定装置が特定した話者の方向を中心にし
た映像を、前記画像メモリが保持する画像データを幾何
変換することによって合成する画像合成装置と、 前記画像合成装置が合成した映像信号を送信する送信装
置と、 送信された信号を伝送する回線と、前記回線を通って来
た信号を受信する受信装置と、 前記受信装置が受信した映像信号を表示する表示装置と
を具備するテレビ会議装置。
3. A television camera for photographing the entire hall, an image memory for writing a signal output by the television camera, a speaker position measuring device for specifying a direction of a speaker, and a speaker position measuring device for specifying. An image synthesizing device for synthesizing a video centered on the direction of the speaker by geometrically transforming the image data held in the image memory; a transmitting device for transmitting the video signal synthesized by the image synthesizing device; A video conferencing apparatus comprising: a line for transmitting the received signal, a receiving device for receiving the signal transmitted through the line, and a display device for displaying the video signal received by the receiving device.
【請求項4】方向指示装置、画像合成装置、表示装置の
少なくとも何れか1種を複数個備えた請求項1記載のテ
レビ会議装置。
4. The video conference apparatus according to claim 1, comprising a plurality of at least one of a direction indicating device, an image synthesizing device, and a display device.
【請求項5】方向指示装置、映像選択装置、画像合成装
置、表示装置の少なくとも何れか1種を複数個備えたこ
とを特徴とする請求項2記載のテレビ会議装置。
5. The video conference apparatus according to claim 2, further comprising a plurality of at least one of a direction indicating device, a video selecting device, an image synthesizing device, and a display device.
JP7185215A 1995-07-21 1995-07-21 Video conference equipment Pending JPH0937224A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7185215A JPH0937224A (en) 1995-07-21 1995-07-21 Video conference equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7185215A JPH0937224A (en) 1995-07-21 1995-07-21 Video conference equipment

Publications (1)

Publication Number Publication Date
JPH0937224A true JPH0937224A (en) 1997-02-07

Family

ID=16166896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7185215A Pending JPH0937224A (en) 1995-07-21 1995-07-21 Video conference equipment

Country Status (1)

Country Link
JP (1) JPH0937224A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285392B1 (en) 1998-11-30 2001-09-04 Nec Corporation Multi-site television conference system and central control apparatus and conference terminal for use with the system
JP2004193962A (en) * 2002-12-11 2004-07-08 Sony Corp Image communication equipment, image communication method, and computer program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285392B1 (en) 1998-11-30 2001-09-04 Nec Corporation Multi-site television conference system and central control apparatus and conference terminal for use with the system
JP2004193962A (en) * 2002-12-11 2004-07-08 Sony Corp Image communication equipment, image communication method, and computer program

Similar Documents

Publication Publication Date Title
US10645369B2 (en) Stereo viewing
JP6587113B2 (en) Image processing apparatus and image processing method
US7224382B2 (en) Immersive imaging system
JP3992045B2 (en) Video signal processing apparatus and method, and virtual reality generation apparatus
US6977676B1 (en) Camera control system
JP3792901B2 (en) Camera control system and control method thereof
US9858643B2 (en) Image generating device, image generating method, and program
US7298400B2 (en) Video system for use with video telephone and video conferencing
US7643064B1 (en) Predictive video device system
JP2003115050A (en) Video data processor and its method, data distributor and its method, data receiver and its method, storage medium, and computer program
JP7196421B2 (en) Information processing device, information processing system, information processing method and program
JPH08149356A (en) Moving picture display device
CN110730340B (en) Virtual audience display method, system and storage medium based on lens transformation
JP2010219581A (en) Image communication system
JP2002351438A (en) Image monitor system
JP2000341574A (en) Camera device and camera control system
JPH11308608A (en) Dynamic image generating method, dynamic image generator, and dynamic image display method
JP6004978B2 (en) Subject image extraction device and subject image extraction / synthesis device
JPH0937224A (en) Video conference equipment
WO2008012983A1 (en) Imaging device and imaging system
KR20170055455A (en) Camera system for compensating distortion of lens using super wide angle camera and Transport Video Interface Apparatus used in it
JP2000209569A (en) Remote monitor, remote monitoring method and remote monitoring system
US11928775B2 (en) Apparatus, system, method, and non-transitory medium which map two images onto a three-dimensional object to generate a virtual image
JP2644031B2 (en) Multipoint image composition method
TW201734569A (en) Image capturing device on a moving body