JPS62209985A - Video conference equipment - Google Patents

Video conference equipment

Info

Publication number
JPS62209985A
JPS62209985A JP5305686A JP5305686A JPS62209985A JP S62209985 A JPS62209985 A JP S62209985A JP 5305686 A JP5305686 A JP 5305686A JP 5305686 A JP5305686 A JP 5305686A JP S62209985 A JPS62209985 A JP S62209985A
Authority
JP
Japan
Prior art keywords
image
conference
information
picture
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5305686A
Other languages
Japanese (ja)
Inventor
Kazuhiro Mori
和宏 森
Takashi Kondo
隆志 近藤
Shozo Abe
省三 阿部
Seishi Kageyama
景山 聖之
Yasushi Nakamura
靖 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5305686A priority Critical patent/JPS62209985A/en
Publication of JPS62209985A publication Critical patent/JPS62209985A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To attain the efficient display and to remarkably reduce transmission information by segmenting a picture with an area having only to include conference participants. CONSTITUTION:Inputted picture information is segmented as a picture having an area as small as possible having only to include the conference participants at conference participant segment sections 3a, 3b and each segmented picture is added with a picture number. Then talker recognition sections 4a, 4b use the segmented picture to recognize the talker in the conference participants. Then the picture information is sent to a remote conference hall by sending sections 5a, 5b together with a picture number and voice information representing the talker and received by reception sections 6b, 6a of an opposite conference hall. The received picture information and the picture number representing the talker are transferred to layout sections 7a, 7b and the voice information is outputted from voice information output sections 9a, 9b.

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、遠隔地間にてそれぞれ会議場の画像情報およ
び音声情報を相手の会議場に送信し、表示、放音するこ
とにより会議を行なうテレビ会議装置に関する。
[Detailed Description of the Invention] [Technical Field of the Invention] The present invention conducts a conference between remote locations by transmitting image information and audio information of each conference hall to the conference hall of the other party, and displaying and emitting sound. The present invention relates to a video conference device.

[発明の技術的背景とその問題点コ 従来のテレビ会議装置では、会議場の画像を遠隔地に送
信し表示する上において、−会議場における会議出席者
が複数の場合、一画面に表示すると会議出席者それぞれ
の画像が小さく見ずらいものとなるという問題があった
[Technical background of the invention and its problems] In conventional video conferencing devices, when transmitting and displaying images of a conference hall to a remote location, it is difficult to display images on one screen when there are multiple conference attendees at the conference hall. There was a problem in that the images of each conference attendee were small and difficult to see.

また送信される画像情報のうち、第9図において斜線で
示される会議出席者間や会議出席者上部の背頭部分は、
本来会議情報としては無意味な画像であり、これを送信
、表示することは送信効率あるいは表示効率の低下を招
くという問題があった。
In addition, among the image information to be transmitted, the areas between the conference attendees and the dorsal head portions above the conference attendees, which are indicated by diagonal lines in FIG.
This image is essentially meaningless as conference information, and transmitting and displaying it has the problem of reducing transmission efficiency or display efficiency.

さらに通常、発言者以外の人は発言者に注目するもので
あるが、従来のテレビ会議装置では音声情報の出所が同
じであり、また前述したように会議出席者それぞれの画
像が小さいため発言者を明確に表現できない。公開特許
公報60−116293号では、会議出席者ごとに対応
させた表示装置を点灯させることなどにより発言者を表
現しようとしているが、前述の理由により発言者の表情
などの情報が不足し、発言者を明確に表現できないとい
う問題もあった。
Furthermore, normally people other than the speaker pay attention to the speaker, but in conventional video conferencing devices, the source of the audio information is the same, and as mentioned above, the images of each conference participant are small, so it is difficult to focus on the speaker. cannot be expressed clearly. Published Patent Publication No. 60-116293 attempts to represent the speaker by lighting up a display device that corresponds to each conference attendee, but due to the aforementioned reasons, information such as the speaker's facial expression is insufficient, and There was also the problem of not being able to clearly express who the person was.

[発明の目的コ 本発明は、上記の事情に対処してなされたもので、送信
および表示効率が高く、発言者を明確に表現することの
できるテレビ会議装置を提供することを目的とする。
[Object of the Invention] The present invention has been made in response to the above-mentioned circumstances, and an object of the present invention is to provide a video conference device that has high transmission and display efficiency and can clearly represent the speaker.

[発明の概要] 本発明は、画像情報、音声情報、および制御情報を伝送
路を介して伝送するテレビ会議装置において、画像入力
手段と、この画像入力手段により入力された画像を蓄積
する蓄積手段と、この蓄積された画像と画像入力手段に
より入力された現画像とを比較し変化部分を包含する領
域を抽出する手段と、発言者を認識し話者識別情報を出
力する手段と、蓄積された画像と抽出された領域とをこ
の話者識別情報により編集配置して一画面上に分。
[Summary of the Invention] The present invention provides a video conference device that transmits image information, audio information, and control information via a transmission path, and includes an image input means and a storage means for accumulating images input by the image input means. a means for comparing the accumulated image with the current image inputted by the image inputting means and extracting a region including a changed part; a means for recognizing a speaker and outputting speaker identification information; The extracted image and the extracted area are edited and arranged on one screen using this speaker identification information.

割表示するレイアウト表示手段とを設けたことににす、
送信および表示効率を高め、発言者を明確に表現できる
ようにしたものである。
We decided to provide a layout display means for displaying the screen separately.
This improves transmission and display efficiency and allows the speaker to be clearly expressed.

[発明の実施例] 以下、本発明を図面を参照しながら詳細に説明する。[Embodiments of the invention] Hereinafter, the present invention will be explained in detail with reference to the drawings.

第1図は本発明の一実施例を示す構成ブロック図である
FIG. 1 is a block diagram showing an embodiment of the present invention.

この会議出席者を移すテレビカメラ1a、1bと、各会
議出席者ごとに収音するマイク2a+、2a2・・・、
2b1.2b2・・・と、背景画像と現画像を比較して
会議出席者のみの画像を切り出す会議者画像切り出し部
3a、3bと、この切り出した画像より発言者を認識す
る発言者認識部4a、4bと、これら画像情報、音声情
報、制御情報を送信する送信部5a、5bと、信金議場
からの情報を受信する受信部6a、6bと、受信した情
報のうら画像情報を編集配置するレイアウト部7a、7
bと、このレイアウトされた画像を表示する画像情報表
示部8a、8bと、音声情報を放音する音声情報出力部
9a、9bとから構成されている。
TV cameras 1a, 1b for transferring conference attendees, and microphones 2a+, 2a2, . . . for collecting sound from each conference attendee.
2b1, 2b2..., conference participant image cropping units 3a and 3b that compare the background image and the current image and crop out an image of only conference attendees, and a speaker recognition unit 4a that recognizes the speaker from this cropped image. , 4b, transmitting sections 5a and 5b that transmit these image information, audio information, and control information, receiving sections 6a and 6b that receive information from the Shinkin Chamber, and a layout that edits and arranges image information behind the received information. Part 7a, 7
b, image information display units 8a and 8b that display the laid out images, and audio information output units 9a and 9b that output audio information.

次にこのテレビ会ia装置の動作を説明する。Next, the operation of this TV conference IA device will be explained.

このテレビ会議装置においては、まず会議場画像情報は
テレビカメラ1a、1bにより、音声情報はマイク2a
1.2a2・・・、2b1.2b2=により入力される
In this video conference device, first, conference room image information is transmitted by television cameras 1a and 1b, and audio information is transmitted by microphones 2a and 1b.
1.2a2..., 2b1.2b2= is input.

この入力された画像情報は、会議者画像切り出し部3a
、3bにおいて、第2図に示すように会議出席者それぞ
れを包含するできるだけ小さな領域の画像(第2図A1
〜G+)として切り出され、それぞれ切り出された画像
には画像番号が付される。
This input image information is stored in the conference participant image cutting section 3a.
, 3b, an image of an area as small as possible encompassing each conference attendee as shown in FIG. 2 (A1
~G+), and an image number is assigned to each cut-out image.

次に発言者認識部4a、4bでは、この切り出された画
像を用いて会議出席者中の発言者を認識する。これは第
3図に示すように、会議者画像の相対的位置より口を含
む検出領域を設定し、その領域内における画像の変化、
すなわち口の動きを検出することにより発言者の認識を
行なうものである。
Next, the speaker recognition units 4a and 4b recognize speakers among the conference attendees using the cut out images. As shown in Figure 3, this is done by setting a detection area including the mouth based on the relative position of the conferee image, and detecting changes in the image within that area.
That is, the speaker is recognized by detecting mouth movements.

すなわち画像の変化■が一定値以上で、かつ一定時間以
上この変化が検出されたなら、発言者として認識し、そ
の画像番号を出力する。
That is, if the image change (2) is greater than a certain value and this change is detected for a certain period of time or more, the person is recognized as the speaker and the image number is output.

そして画像情報は発言者を示す画像番号および音声情報
とともに、送信部5a、5bにより遠隔地の会議場に送
られ、相手会議場の受信部6b、6aにより受信される
The image information, together with the image number indicating the speaker and the audio information, is sent to a remote conference hall by the transmitters 5a and 5b, and is received by the receivers 6b and 6a at the other party's conference center.

この受信された画像情報および発言者を示す画像番号は
、レイアウト部7a、7bに転送され、また音声情報は
音声情報出力部9a、9bにおいて放音される。
The received image information and the image number indicating the speaker are transferred to the layout sections 7a, 7b, and the audio information is outputted at the audio information output sections 9a, 9b.

さらにレイアウト部7a、7bでは、発言者を示す画像
番号が存在しない場合には、第4図に示すようにすべて
の画像(第4図A2〜C2)が同じ大ぎさで一画面上に
レイアウトされ、発言者を示す画像¥II号が存在する
場合には、第5図に示すようにその番号の会議者の画像
(第5図03)が拡大され、それ以外の人の画像(第5
図A3、B3)が縮小されて一画面上にレイアウトされ
、画像情報表示部8a、8bにおいて表示される。
Furthermore, in the layout sections 7a and 7b, if there is no image number indicating the speaker, all the images (A2 to C2 in FIG. 4) are laid out in the same size on one screen as shown in FIG. , if there is an image number II indicating the speaker, the image of the conference person with that number (Figure 5 03) is enlarged as shown in Figure 5, and the image of the other person (Figure 5
A3 and B3) are reduced and laid out on one screen, and displayed on the image information display sections 8a and 8b.

第6図は会議者画像切り出し部3a、3bの構成を示す
ブロック図である。
FIG. 6 is a block diagram showing the configuration of the conference participant image cutting sections 3a and 3b.

この会議者画像切り出し部3a、3bは、背景画像が記
憶された背景画像記録部10と、この背景画像と入力画
像とを比較し、変化部分を検出する変化検出部11と、
変化部分を包含する矩形領域の座標を算出する切り出し
座標計算部12と、この座標値より矩形領域を切り出す
切り出し部13とより構成されている。
These conference participant image cutting units 3a and 3b include a background image recording unit 10 in which a background image is stored, a change detection unit 11 that compares this background image with an input image, and detects a changed part;
It is comprised of a cutout coordinate calculation unit 12 that calculates the coordinates of a rectangular area that includes the changed portion, and a cutout unit 13 that cuts out the rectangular area from these coordinate values.

この会議者画像切り出し部3a、3bでは、あらかじめ
会議出席者のいない背景画像を背景画像記録部10に蓄
えておく。
In the conference participant image cutting units 3a and 3b, background images without conference attendees are stored in the background image recording unit 10 in advance.

次に変化検出部11において、テレビカメラ1a、1b
から入力された会議場の画像と蓄えられた背景画像との
差をとることにより、第7図に示ずように会議出席者の
みの画像が識別される。
Next, in the change detection section 11, the television cameras 1a, 1b
By taking the difference between the image of the conference hall input from the source and the stored background image, images of only conference attendees are identified as shown in FIG.

そして切り出し座標計算部12において、第8図に示す
ように会議者の画像を包含する最小窓より縦、横それぞ
れaだけ外側の窓の座標を算出する。このaは、会議者
の画像が見ずらくない範囲でできるだけ小さく設定され
ている。
Then, the cutout coordinate calculation unit 12 calculates the coordinates of a window that is vertically and horizontally a distance a from the minimum window that includes the image of the conferee, as shown in FIG. This a is set to be as small as possible without making the images of the conference participants difficult to see.

最後にit Iされた切り出し座標を元に、切り出し部
13において会議者を包含するできるだけ小さな領域の
画像を切り出す。
Based on the last cutout coordinates, the cutout unit 13 cuts out an image of the smallest possible area that includes the conference participants.

なお会議者の画像は、ある一定面積以上の連結領域を見
ることで容易に検出できる。
Note that images of conference participants can be easily detected by looking at connected regions of a certain area or more.

このテレビ会議装置においては、テレビカメラ1a、1
bにより入力された画像から会議出席者それぞれを包含
するできるだけ小ざい領域の画像を切り出すので、送信
画像情報量を削減し、送信および表示の効率を良くする
ことができる。
In this television conference device, television cameras 1a, 1
Since an image of an area as small as possible that includes each conference attendee is cut out from the image input in step b, the amount of transmitted image information can be reduced and the efficiency of transmission and display can be improved.

また、発言者を認識し、会議者画像切り出し部3a、3
bにより切り出された会議者の画像中の発言者の画像を
レイアウト部7a、7bにおいて拡大表示し、それ以外
の人を縮小表示することにより発言者を明確に表現する
ことができる。
In addition, the speaker is recognized and the conference participant image cutting units 3a, 3
By enlarging and displaying the image of the speaker in the image of the conference participants cut out by b in the layout sections 7a and 7b, and displaying the other people in a reduced size, the speaker can be clearly expressed.

なおこの実施例では、説明を簡単化するため、送信側、
受信側が1対1で構成されているが、本発明は上記実施
例に限定されるものではなく、たとえば3つ以上の会議
場で送信、受信を行なわせることもできる。またテレビ
カメラについても、−会議場一台に限定されるものでは
ない。
Note that in this embodiment, in order to simplify the explanation, the transmitting side,
Although the receiving side is configured one-to-one, the present invention is not limited to the above embodiment, and for example, transmission and reception can be performed at three or more conference halls. Also, the television camera is not limited to one in the conference room.

また会議者画像の切り出しにおいても、この実施例では
、背景画像と入力画像との差により切り出しを行なって
いるが、これ以外にも一定時間ごとに前画像と現画像を
比較することにより変化検出を行なうこともできる。
In addition, in this embodiment, when cropping out conferee images, clipping is performed based on the difference between the background image and the input image, but in addition to this, changes can be detected by comparing the previous image and the current image at regular intervals. You can also do this.

ざらにこの実施例では、発言者を口の動きの検出により
認識しているが、これ以外にもマイクごとの音声レベル
より発言者を検出する方法などもある。
Roughly speaking, in this embodiment, the speaker is recognized by detecting the movement of the mouth, but there are other methods such as detecting the speaker based on the audio level of each microphone.

またレイアウト部7a、7bにおける拡大表示は、発言
者を認識することにより自動的に行なっているが、マニ
ュアルによる拡大表示も考えられる。
Further, although the enlarged display in the layout sections 7a and 7b is automatically performed by recognizing the speaker, manual enlarged display is also possible.

[発明の効果] 以上説明したように本発明によれば、会議出席者を包含
するできるだけ小ざい領域の画像を切り出すことができ
るので、送信情報が大幅に削減され、また効率のよい表
示を行なうことができる。
[Effects of the Invention] As explained above, according to the present invention, it is possible to cut out an image of as small an area as possible that includes conference participants, thereby significantly reducing the amount of transmitted information and performing efficient display. be able to.

ざらに発言者を認識して発言者を拡大表示するとともに
、それ以外の人を縮小表示する等のレイアウト表示がで
きるので、発言者を明確に表現することができる。
Since it is possible to roughly recognize the speaker and display the speaker in an enlarged manner while displaying other people in a reduced size, the speaker can be clearly expressed.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す構成ブロック図、第2
図は同実施例における会議者画像の切り出しを説明する
図、第3図は同実施例の発言者の口の動きを検出する領
域を示す図、第4図は同実施例における発言者のない場
合の会議者画像のレイアウト表示を説明する図、第5図
は同実施例において発言者のいる場合のレイアウト表示
を説明する図、第6図は会議者画像切り出し部の構成ブ
ロック図、第7図は会議者のみの画像を抽出するアルゴ
リズムを説明する図、第8図は会議者を切り出す窓を示
す図、第9図は従来のテレビ会議装置の画面を説明する
図である。 1a、1b・・・テレビカメラ 3a、3b・・・会議者画像切り出し部4a、4b・・
・発言者認識部 7a、7b・・・レイアウト部 10・・・・・・・・・・・・背景画像記録部11・・
・・・・・・・・・・変化検出部12・・・・・・・・
・・・・切り出し座標計算部13・・・・・・・・・・
・・切り出し品出願人      株式会社 東芝 代理人 弁理士  須 山 佐 − 第1図 第2図 第3図 3L 第4図 第5図 第6図 第7図
FIG. 1 is a configuration block diagram showing one embodiment of the present invention, and FIG.
The figure is a diagram illustrating the cutting out of a meeting person's image in the same embodiment, FIG. FIG. 5 is a diagram illustrating the layout display of conference participant images in the case where there is a speaker in the same embodiment. FIG. 6 is a configuration block diagram of the conference participant image cutting section. FIG. 8 is a diagram illustrating an algorithm for extracting images of only conference participants, FIG. 8 is a diagram showing a window for cutting out conference participants, and FIG. 9 is a diagram illustrating a screen of a conventional video conference device. 1a, 1b...TV cameras 3a, 3b...Member image cutting units 4a, 4b...
-Speaker recognition units 7a, 7b...Layout unit 10...Background image recording unit 11...
......Change detection section 12...
... Cutting coordinate calculation section 13 ......
... Cutout product applicant Toshiba Corporation Agent Patent attorney Satoshi Suyama - Figure 1 Figure 2 Figure 3 Figure 3L Figure 4 Figure 5 Figure 6 Figure 7

Claims (2)

【特許請求の範囲】[Claims] (1)画像情報、音声情報、および制御情報を伝送路を
介して伝送するテレビ会議装置において、画像入力手段
と、この画像入力手段により入力された画像を蓄積する
蓄積手段と、この蓄積された画像と前記画像入力手段に
より入力された現画像とを比較し変化部分を包含する領
域を抽出する手段と、発言者を認識し話者識別情報を出
力する手段と、前記蓄積された画像と前記抽出された領
域とを前記話者識別情報より編集配置して一画面上に分
割表示するレイアウト表示手段とを設けたことを特徴と
するテレビ会議装置。
(1) In a television conference device that transmits image information, audio information, and control information via a transmission path, an image input means, a storage means for accumulating images input by the image input means, and a storage means for accumulating images input by the image input means; means for comparing an image with the current image input by the image input means and extracting a region including a changed part; means for recognizing a speaker and outputting speaker identification information; 1. A television conference device comprising: layout display means for editing and arranging the extracted areas based on the speaker identification information and displaying the edited areas on one screen in a divided manner.
(2)レイアウト表示手段は、発言者を拡大し、それ以
外の人を縮小して表示する特許請求の範囲第1項記載の
テレビ会議装置。
(2) The video conference device according to claim 1, wherein the layout display means enlarges the speaker and displays other people in a reduced size.
JP5305686A 1986-03-11 1986-03-11 Video conference equipment Pending JPS62209985A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5305686A JPS62209985A (en) 1986-03-11 1986-03-11 Video conference equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5305686A JPS62209985A (en) 1986-03-11 1986-03-11 Video conference equipment

Publications (1)

Publication Number Publication Date
JPS62209985A true JPS62209985A (en) 1987-09-16

Family

ID=12932194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5305686A Pending JPS62209985A (en) 1986-03-11 1986-03-11 Video conference equipment

Country Status (1)

Country Link
JP (1) JPS62209985A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01270107A (en) * 1988-04-21 1989-10-27 Okuma Mach Works Ltd Program generation device for numerically controlled working device
JPH0258486A (en) * 1988-08-24 1990-02-27 Nec Corp Animation information transmitting system, encoder and decoder
JPH0267890A (en) * 1988-09-02 1990-03-07 Nippon Telegr & Teleph Corp <Ntt> Inter-multipoint video conference system
US5684527A (en) * 1992-07-28 1997-11-04 Fujitsu Limited Adaptively controlled multipoint videoconferencing system
JP2000175170A (en) * 1998-12-04 2000-06-23 Nec Corp Multi-point video conference system and its communication method
JP2015507416A (en) * 2011-12-28 2015-03-05 グーグル・インコーポレーテッド Video conferencing with unlimited dynamic active participants

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01270107A (en) * 1988-04-21 1989-10-27 Okuma Mach Works Ltd Program generation device for numerically controlled working device
JPH0258486A (en) * 1988-08-24 1990-02-27 Nec Corp Animation information transmitting system, encoder and decoder
JPH0267890A (en) * 1988-09-02 1990-03-07 Nippon Telegr & Teleph Corp <Ntt> Inter-multipoint video conference system
US5684527A (en) * 1992-07-28 1997-11-04 Fujitsu Limited Adaptively controlled multipoint videoconferencing system
JP2000175170A (en) * 1998-12-04 2000-06-23 Nec Corp Multi-point video conference system and its communication method
JP2015507416A (en) * 2011-12-28 2015-03-05 グーグル・インコーポレーテッド Video conferencing with unlimited dynamic active participants

Similar Documents

Publication Publication Date Title
US9641585B2 (en) Automated video editing based on activity in video conference
US20040254982A1 (en) Receiving system for video conferencing system
US10771694B1 (en) Conference terminal and conference system
KR100210546B1 (en) Television conferencing system
JP2006197505A (en) Camera controller, camera system, electronic conference system and camera control method
WO2010072075A1 (en) Method, device and system of video communication
JP2022133366A (en) Moving image editing device, moving image editing method, and program
US11405584B1 (en) Smart audio muting in a videoconferencing system
US10979666B2 (en) Asymmetric video conferencing system and method
JP2006254064A (en) Remote conference system, sound image position allocating method, and sound quality setting method
JPH09271006A (en) Multi-point video conference equipment
US10469800B2 (en) Always-on telepresence device
JPS62209985A (en) Video conference equipment
JP5120020B2 (en) Audio communication system with image, audio communication method with image, and program
JPH11234640A (en) Communication control system
JPH09307870A (en) Camera automatic direction controller in video conference system
JP2007251355A (en) Relaying apparatus for interactive system, interactive system, and interactive method
JPH0758859A (en) Information transmitter and information receiver for conference
JPH0267889A (en) Displayed person identifying communication conference system
JP2020053882A (en) Communication device, communication program, and communication method
US10986310B2 (en) Information processing apparatus, information processing method, and program
JP4768578B2 (en) Video conference system and control method in video conference system
JPH09162995A (en) Remote conference system
JP2010028299A (en) Conference photographed image processing method, conference device, and the like
JPS61198891A (en) Image pickup device for conference