JPH08223551A - Video conference system - Google Patents

Video conference system

Info

Publication number
JPH08223551A
JPH08223551A JP7024008A JP2400895A JPH08223551A JP H08223551 A JPH08223551 A JP H08223551A JP 7024008 A JP7024008 A JP 7024008A JP 2400895 A JP2400895 A JP 2400895A JP H08223551 A JPH08223551 A JP H08223551A
Authority
JP
Japan
Prior art keywords
microphone
video camera
image
video
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7024008A
Other languages
Japanese (ja)
Other versions
JP2737682B2 (en
Inventor
Yoko Shimada
洋子 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7024008A priority Critical patent/JP2737682B2/en
Publication of JPH08223551A publication Critical patent/JPH08223551A/en
Application granted granted Critical
Publication of JP2737682B2 publication Critical patent/JP2737682B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PURPOSE: To receive an audio signal and a video image automatically by detecting a talker from a direction of a maximum sound pressure level of a turning microphone and directing a sound collection microphone and a video camera in the direction. CONSTITUTION: A direction detection microphone 1a is turned under the control of a microphone direction control section 5 and a voice direction detection section 2 detects a deviation angle of a highest sound pressure level within one period and a sound collection microphone 1b is turned in the direction by the control section 5 via a system control section 3. Simultaneously the control section 3 allows a video camera direction control section 6 to direct a camera in the direction and to zoom at an image pickup distance. A outline extract section 7 extracts an image contour from a video signal of camera 4 and gives it to the control section 3, in which the outline is compared with a basic figure stored in advance to detect a head top and a position deviation of both shoulder tips and to adjust the direction of the camera 4 and its zooming so that each position deviation is maximized via the control section 6. Thus, number of cameras and microphones for detecting the talker.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数の参加者から発言
者を選択してその音声と映像をマイクロホンとビデオカ
メラとにより入力するテレビ会議システムに関し、特に
そのマイクロホンとビデオカメラの制御方法およびその
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video conference system for selecting speakers from a plurality of participants and inputting their voices and images with a microphone and a video camera, and more particularly to a method for controlling the microphone and the video camera. Regarding the device.

【0002】[0002]

【従来の技術】上述のテレビ会議システムは、ビデオカ
メラとマイクロホンとを用いて、交互に発言する出席者
ごとの音声と身振りや表情などの映像とを同時にキャッ
チして別室あるいは遠方の会場などに伝送することを目
的とする装置であって、順序不同に発言する出席者を個
々に追尾するために従来種々の案が提示されている。
2. Description of the Related Art The above-mentioned video conference system uses a video camera and a microphone to simultaneously capture the voice of each attendee who speaks alternately and the images of gestures and facial expressions, so that they can be used in a separate room or a distant venue. Various devices have been proposed in the past for tracking individual attendees who speak in an out-of-order manner, which is a device intended for transmission.

【0003】例えば、特開昭61−87489号、特開
平2−7775号、特開平3−76385号などには、
図4に示すように、予め個々の出席者に対応させてそれ
ぞれの位置の記憶情報を有するマイクロホン1’と、各
出席者または全景を写す複数のビデオカメラ4’と、各
マイクロホンの出力から検出された音声信号により発言
者の位置を検出する話者検出回路25とを設けて、検出
された発言者に応じてビデオカメラ4’を各発言者また
は全景用に切替えたり、ズーミングを行う案が開示され
ている。
For example, JP-A-61-87489, JP-A-2-7775, JP-A-3-76385, etc.
As shown in FIG. 4, a microphone 1 ′ having memory information of respective positions corresponding to individual attendees in advance, a plurality of video cameras 4 ′ showing each attendee or the whole view, and detection from the output of each microphone A speaker detection circuit 25 for detecting the position of the speaker based on the generated audio signal is provided, and the video camera 4 ′ is switched to each speaker or the whole view or zooming is performed according to the detected speaker. It is disclosed.

【0004】また、各マイクロホンの出力から音声を識
別して発言者を特定する方法については、特開平1−1
58880号、特開平5−122689号などに開示さ
れている。
A method for identifying the speaker by identifying the voice from the output of each microphone is disclosed in Japanese Patent Laid-Open No. 1-1.
It is disclosed in Japanese Patent Application Laid-Open No. 58880, Japanese Patent Application Laid-Open No. 5-122689 and the like.

【0005】さらに、特開平5−122689号には、
図5に示すように、話者検出判定部20、画像記憶部7
aなどに各出席者ごとの音声と顔画像との情報を予め全
員について記憶しておき、各マイクロホン1’に入力さ
れた音声を話者検出判定部20で記憶情報と対照して発
言者を特定し、画像記憶部7aの顔画像の記憶情報から
特定された顔画像を検索して、該当の発言者を捉えるよ
うにビデオカメラを操作する案が開示されている。
Further, in Japanese Patent Laid-Open No. 5-122689,
As shown in FIG. 5, the speaker detection determination unit 20, the image storage unit 7
Information such as voices and face images for each attendee is stored in advance in a for each person, and the voice input to each microphone 1'is compared with the stored information by the speaker detection determination unit 20 to identify the speaker. A plan is disclosed in which the specified face image is specified and searched from the stored information of the face image in the image storage unit 7a, and the video camera is operated to catch the speaker.

【0006】[0006]

【発明が解決しようとする課題】上述のように従来のテ
レビ会議システムにおいては、各マイクロホンを個々の
出席者に向けて固定的に配置し、各マイクロホンごとの
入力音圧レベルを測定してそれぞれ比較し、入力音圧レ
ベルの最大なマイクロホンから発言者を判別してビデオ
カメラを操作していたので、出席者と同数かまたはそれ
に近い数のマイクロホンを必要とするという欠点があっ
た。
As described above, in the conventional video conference system, each microphone is fixedly arranged toward each attendant, and the input sound pressure level of each microphone is measured to measure the input sound pressure level. In comparison, since the speaker was discriminated from the microphone having the highest input sound pressure level to operate the video camera, there was a disadvantage in that the same number of microphones as the attendees or a number close thereto was required.

【0007】また、出席者ごとに個別のマイクロホンを
用意しないと、マイクロホンの正面に発言者が入らない
場合が起きる。その場合には、発言者なのに体の一部し
かビデオカメラに映らない、あるいは全く発言者の画像
が映らないという状態が発生し、マニュアル操作が必要
になるという欠点があった。
Further, unless an individual microphone is prepared for each attendee, the speaker may not be able to enter the front of the microphone. In that case, there is a problem that only a part of the body is displayed on the video camera even if the speaker is present, or the image of the speaker is not displayed at all, and manual operation is required.

【0008】この欠点は、上述の特開平5−12268
9号によって解消されるが、この案では、予め全出席者
について各人ごとの音声および顔画像の情報を記憶して
おく準備作業が必要であり、顔画像の記憶情報と発言者
の映像とを一致させるビデオカメラの操作を含めてテレ
ビ会議システムの構成装置やその操作が複雑になるとい
う恐れがある。
This drawback is caused by the above-mentioned JP-A-5-12268.
Although this problem will be solved by No. 9, this plan requires preparatory work to store in advance the voice and face image information of each person for all attendees. There is a possibility that the constituent devices of the video conference system and the operation thereof may be complicated, including the operation of the video camera that matches the above.

【0009】本発明の目的は、出席者数より少ないマイ
クロホンとビデオカメラにより、順序不同に発生する発
言者を検出してその音声と映像を正しく送ることができ
る簡易なテレビ会議システムの制御方法とその装置を提
供することにある。
An object of the present invention is to provide a control method for a simple video conference system capable of detecting speakers who are generated out of order and sending the audio and video correctly by using a microphone and a video camera which are smaller than the number of attendees. To provide the device.

【0010】[0010]

【課題を解決するための手段】本発明のテレビ会議シス
テムの制御方法は、複数の参加者に向けて回動可能なマ
イクロホンに入力される音圧により発言者を検出し、検
出した発言者の方向にマイクロホンの集音基準軸正面を
向けて停止し、ビデオカメラのレンズ正面を停止したマ
イクロホンの集音基準軸に沿って該マイクロホンの前方
へ向けて移動しながら映像を入力してその輪郭像を抽出
し、輪郭像が所定の図形と一致した位置でビデオカメラ
の回動を停止して映像を入力する手順を有する。
According to a control method of a video conference system of the present invention, a speaker is detected by a sound pressure input to a microphone rotatable toward a plurality of participants, and the detected speaker is detected. The front of the microphone's sound collection reference axis in the direction of the stop, and the front of the microphone is moved along the sound collection reference axis of the stopped microphone in front of the lens of the video camera, and the image is input and its outline image Is extracted, and the rotation of the video camera is stopped at the position where the contour image coincides with the predetermined figure to input the image.

【0011】また、所定の図形が肩より上の部分の人型
の輪郭像であるのが望ましい。
Further, it is desirable that the predetermined figure is a human-shaped contour image of a portion above the shoulder.

【0012】本発明のテレビ会議システムの制御装置
は、回動可能に支持されるマイクロホンと、制御信号を
受けてマイクロホンの回動および停止の動作を制御する
マイクロホン制御手段と、マイクロホンが回動される過
程で入力される音圧レベルを比較し、最高音圧レベルが
検出されたときのマイクロホンの正面の方向を検出する
最高感度の方向検出手段と、回動可能に支持されるビデ
オカメラと、ビデオカメラの映像信号から画像の輪郭を
抽出して所定の図形と比較する画像輪郭抽出手段と、制
御信号を受けてビデオカメラの動作を制御するビデオカ
メラ制御手段と、方向検出手段および画像輪郭抽出手段
の出力信号を解析して、マイクロホンとビデオカメラの
制御信号を出力するシステム制御手段とを有する。
The control device of the video conference system of the present invention comprises a microphone rotatably supported, a microphone control means for receiving control signals to control the operation of turning and stopping the microphone, and the microphone being turned. Comparing the sound pressure level input in the process of detecting the direction of the front of the microphone when the highest sound pressure level is detected, direction detection means of the highest sensitivity, and a video camera rotatably supported, Image contour extraction means for extracting the contour of an image from the video signal of the video camera and comparing it with a predetermined figure, video camera control means for controlling the operation of the video camera in response to a control signal, direction detection means and image contour extraction It has a system control means for analyzing the output signal of the means and outputting the control signal of the microphone and the video camera.

【0013】また、画像輪郭抽出手段は、所定の図形と
して肩より上の部分の人型の輪郭像が画面中央部に記憶
され、ビデオカメラの映像信号から抽出した画像の輪郭
と前記記憶された輪郭像との画面上の位置の差を検出し
て出力するのが望ましい。
Further, the image contour extracting means stores a human-shaped contour image of a portion above the shoulder as a predetermined figure in the center of the screen, and stores the contour of the image extracted from the video signal of the video camera. It is desirable to detect and output the difference in position on the screen from the contour image.

【0014】また、マイクロホンが各参加者の席から略
等距離の位置に各参加者に向けて水平方向に回動可能に
支持され、そのマイクロホンの支持位置付近の上方にビ
デオカメラが各参加者に向けて垂直方向および水平方向
に回動可能に支持されるのが望ましい。
A microphone is supported rotatably in a horizontal direction toward each participant at a position approximately equidistant from each participant's seat, and a video camera is provided above each microphone near the support position of the participant. It is desirable to be rotatably supported in the vertical and horizontal directions toward.

【0015】また、マイクロホンは、所定の時間周期で
回動して最高音圧の方向を検出する第1の狭角度指向性
のマイクロホンと、指示された方向に回動して停止し、
その正面の音声を入力する第2のマイクロホンとからな
るのが望ましい。
Further, the microphone rotates in a predetermined time period to detect the direction of the highest sound pressure, and the first narrow angle directional microphone rotates in the indicated direction to stop.
It preferably comprises a second microphone for inputting the sound in front of it.

【0016】本発明のテレビ会議システムの制御装置
は、複数の参加者に向けて回動可能に支持されるマイク
ロホンと、制御信号を受けてマイクロホンの回動および
停止の動作を制御するマイクロホン制御手段と、マイク
ロホンが回動される過程で入力される音圧レベルが所定
の閾値以上となったときのマイクロホンの正面の方向を
検出する方向検出手段と、複数の参加者に向けて回動可
能に支持されるビデオカメラと、ビデオカメラの映像信
号から画像の輪郭を抽出して所定の図形と比較する画像
輪郭抽出手段と、制御信号を受けてビデオカメラの動作
を制御するビデオカメラ制御手段と、方向検出手段およ
び画像輪郭抽出手段の出力信号を解析して、マイクロホ
ンとビデオカメラの制御信号を出力するシステム制御手
段とを有する。
The control device of the video conference system of the present invention is a microphone that is rotatably supported toward a plurality of participants, and a microphone control means that receives a control signal and controls the operation of turning and stopping the microphone. And direction detecting means for detecting the direction of the front of the microphone when the sound pressure level input during the process of rotating the microphone exceeds a predetermined threshold value, and it is possible to rotate toward a plurality of participants. A supported video camera, image contour extraction means for extracting the contour of an image from the video signal of the video camera and comparing it with a predetermined figure, and video camera control means for receiving the control signal and controlling the operation of the video camera, It has a system control means for analyzing the output signals of the direction detection means and the image contour extraction means and outputting the control signals of the microphone and the video camera.

【0017】[0017]

【作用】マイクロホンが最高感度方向検出手段の検出し
た方向に正面をむけられ、ビデオカメラがその方向に追
随して人物像を検出して撮影するので、交互に発言する
会議出席者中の発言者を逐次追跡してそれぞれの音声と
映像を自動的に入力することができる。
[Function] Since the microphone is turned to the front in the direction detected by the maximum sensitivity direction detecting means and the video camera follows the direction to detect and photograph the person image, the speakers of the conference attendees who alternately speak Can be sequentially tracked and each audio and video can be automatically input.

【0018】[0018]

【実施例】以下、本発明の実施例について図面を参照し
て説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0019】図1は本発明の第1実施例のブロック図、
図2は輪郭抽出部7に記憶される人型の図形、図3は第
2実施例のブロック図である。
FIG. 1 is a block diagram of a first embodiment of the present invention,
FIG. 2 is a human-shaped figure stored in the contour extracting unit 7, and FIG. 3 is a block diagram of the second embodiment.

【0020】図1において、本実施例のテレビ会議シス
テムは、マイクロホン1と、マイクロホン方向制御部5
と、音声方向検出部2と、ビデオカメラ4と、ビデオカ
メラ方向制御部6と、輪郭抽出部7と、システム制御部
3とからなる。
Referring to FIG. 1, the video conference system of this embodiment includes a microphone 1 and a microphone direction controller 5.
The audio direction detection unit 2, the video camera 4, the video camera direction control unit 6, the contour extraction unit 7, and the system control unit 3.

【0021】マイクロホン1は、発言者の方向検出用の
狭角度指向性の第1のマイクロホン1aと音声集音用の
第2のマイクロホン1bとが1組となり、各出席者から
略等距離の位置に水平方向に回動可能に同一の回転軸に
支持される。マイクロホン方向制御部5は、請求項3の
マイクロホン制御手段に相当し、制御信号を受けてマイ
クロホン1a,1bの回動および停止の動作を制御す
る。音声方向検出部2は、最高感度の方向検出手段に相
当し、マイクロホン1aが回動される過程で入力される
音圧レベルを比較し、最高音圧レベルが検出されたとき
のマイクロホン1aの正面の方向を検出する。ビデオカ
メラ4は、マイクロホン1a,1bの支持位置付近の上
方に各参加者に向けて垂直方向および水平方向に回動可
能に支持される。輪郭抽出部7は、画像輪郭抽出手段に
相当し、ビデオカメラ4の映像信号から画像の輪郭を抽
出して、メモリに記憶された図2に示すような人型の図
形71と比較し、抽出した輪郭画像とメモリの人型図形
71の画面上の位置の差を検出して出力する。ビデオカ
メラ方向制御部6は、ビデオカメラ制御手段に相当し、
制御信号を受けてビデオカメラ4の回動およびズーミン
グ動作を制御する。システム制御部3は、システム制御
手段に相当し、音声方向検出部2と輪郭抽出部7の出力
信号を解析して、マイクロホン方向制御部5とビデオカ
メラ方向制御部6に制御信号を出力する。
The microphone 1 includes a first microphone 1a having a narrow-angle directivity for detecting the direction of a speaker and a second microphone 1b for collecting sound, and the microphones 1 are located at positions substantially equidistant from each attendee. Are supported by the same rotary shaft so as to be horizontally rotatable. The microphone direction control unit 5 corresponds to the microphone control means of claim 3, and receives the control signal to control the turning and stopping operations of the microphones 1a and 1b. The voice direction detecting unit 2 corresponds to the direction detecting means having the highest sensitivity, compares the sound pressure levels input in the process of rotating the microphone 1a, and front of the microphone 1a when the highest sound pressure level is detected. Detect the direction of. The video camera 4 is rotatably supported in the vertical direction and the horizontal direction toward the participants above and near the support positions of the microphones 1a and 1b. The contour extraction unit 7 corresponds to image contour extraction means, extracts the contour of the image from the video signal of the video camera 4, compares it with the human-shaped figure 71 as shown in FIG. The difference between the contour image and the position on the screen of the human figure 71 in the memory is detected and output. The video camera direction control unit 6 corresponds to video camera control means,
Receiving the control signal, it controls the rotation and zooming operation of the video camera 4. The system control unit 3 corresponds to system control means, analyzes the output signals of the voice direction detection unit 2 and the contour extraction unit 7, and outputs control signals to the microphone direction control unit 5 and the video camera direction control unit 6.

【0022】次に、本実施例の動作について説明する。Next, the operation of this embodiment will be described.

【0023】マイクロホン1aは、マイクロホン方向制
御部5からの回動指令信号により、一定の回転周期で回
転または反転を繰り返しており、狭角度指向性のマイク
ロホンの正面の音声信号を入力して音声方向検出部2へ
出力する。音声方向検出部2は、音声方向検出信号とし
て1周期内で音圧レベルが最高となったときのマイクロ
ホン1aの基準線(参加者の略中央の方向に設定され
る)からの回転偏位角度を検出してシステム制御部3に
出力する。システム制御部3は、この音声方向検出信号
により、マイクロホン方向制御部5に集音用のマイクロ
ホン1bを検出した方向に向けるようにマイクロホン方
向制御部5に信号を送ると共に、ビデオカメラ方向制御
部6にもビデオカメラ4をマイクロホン1bの向けられ
た方向に回動するようにビデオカメラ方向制御部6に信
号を送出する。ビデオカメラ方向制御部6は、ビデオカ
メラ4を指示された方向に向けながら撮影距離に応じて
ズーミング動作を制御する。輪郭抽出部7は、ビデオカ
メラ4の映像信号から画像の輪郭を抽出してそのデータ
をシステム制御部3に出力する。システム制御部3は、
このデータを予め記憶された図2の基本の人型の図形7
1と比較して、その頭部頂点ア、両肩先イ、ウの3点の
位置のずれを検出し、そのデータをビデオカメラ方向制
御部6に送り、各点の位置のずれが最小になるようにビ
デオカメラ4の方向とズーミング動作を調整させる。
The microphone 1a repeats rotation or reversal at a constant rotation cycle in response to a rotation command signal from the microphone direction control unit 5, and inputs a voice signal in front of a microphone having a narrow angle directivity to output a voice direction. Output to the detection unit 2. The voice direction detection unit 2 detects the rotational deviation angle from the reference line of the microphone 1a (set in the substantially central direction of the participant) when the sound pressure level becomes the highest within one cycle as the voice direction detection signal. Is detected and output to the system control unit 3. Based on the audio direction detection signal, the system control unit 3 sends a signal to the microphone direction control unit 5 so that the microphone direction control unit 5 faces the direction in which the microphone 1b for sound collection is detected, and the video camera direction control unit 6 Also, a signal is sent to the video camera direction control unit 6 so as to rotate the video camera 4 in the direction in which the microphone 1b is directed. The video camera direction control unit 6 controls the zooming operation according to the shooting distance while pointing the video camera 4 in the instructed direction. The contour extraction unit 7 extracts the contour of the image from the video signal of the video camera 4 and outputs the data to the system control unit 3. The system control unit 3
The basic human-shaped figure 7 of FIG. 2 in which this data is stored in advance
Compared with 1, the positional deviations of the three points of the head vertex a, both shoulders a, and c are detected, and the data are sent to the video camera direction control unit 6, and the positional deviations of the respective points are minimized. Thus, the direction of the video camera 4 and the zooming operation are adjusted.

【0024】ビデオカメラ4は、また、その水平回転軸
8aをマイクロホン1bの回転軸と同一として同時に回
転し、マイクロホン1bとビデオカメラ4が常に同一水
平方向を向くように制御してもよい。
The video camera 4 may be controlled so that its horizontal rotation axis 8a is the same as the rotation axis of the microphone 1b and rotated simultaneously so that the microphone 1b and the video camera 4 are always oriented in the same horizontal direction.

【0025】次に、本発明の第2の実施例について図3
により説明する。
Next, a second embodiment of the present invention will be described with reference to FIG.
This will be described below.

【0026】第2の実施例は、発言者の方向検出と集音
とを1つのマイクロホン1cで行ない、その入力音圧レ
ベルを所定の閾値と比較することにより発言者を検出す
る以外の各部の構成と動作は第1の実施例と同様であ
る。
In the second embodiment, the direction of the speaker is detected and the sound is collected by one microphone 1c, and the input sound pressure level is compared with a predetermined threshold to detect the speaker. The configuration and operation are similar to those of the first embodiment.

【0027】マイクロホン1cは、ビデオカメラ4と同
じ水平方向回転軸8aを有し、参加者の方向に向って所
定の周期で回動しながら集音している。方向検出部2
は、マイクロホン1cからの入力の音圧レベルを所定の
閾値と比較して、閾値以上の音圧が検出されたときのマ
イクロホン1cの向けられている方向を発言者の方向と
認定してシステム制御部3に通知する。システム制御部
3は、その方向をビデオカメラ方向制御部6に通知し
て、ビデオカメラ4の回転軸8bのまわりの垂直方向の
回動およびズーミング開始を指示するとともに、マイク
ロホン制御部5に対してマイクロホン1cの回動停止信
号を送る。
The microphone 1c has the same horizontal rotation axis 8a as the video camera 4, and collects sound while rotating in a predetermined cycle in the direction of the participants. Direction detector 2
Compares the sound pressure level of the input from the microphone 1c with a predetermined threshold value, recognizes the direction in which the microphone 1c is directed when the sound pressure above the threshold value is detected as the direction of the speaker, and performs system control. Notify Part 3. The system control unit 3 notifies the video camera direction control unit 6 of the direction to instruct the video camera 4 to rotate in the vertical direction around the rotation axis 8b and start zooming, and to the microphone control unit 5. A rotation stop signal of the microphone 1c is sent.

【0028】システム制御部3は、音声方向検出部2の
検出するマイクロホン1の入力音圧レベルが閾値より低
くなると、マイクロホン方向制御部5に対してマイクロ
ホン1の回動開始を指示する。
When the input sound pressure level of the microphone 1 detected by the voice direction detecting section 2 becomes lower than the threshold value, the system control section 3 instructs the microphone direction control section 5 to start the rotation of the microphone 1.

【0029】第2の実施例では、同時に2人以上の発言
者があるときは、最初に検出した発言者の方向を指示す
ることになるが、マイクロホンの数が1つで済み、装置
構成が簡単になる利点がある。
In the second embodiment, when there are two or more speakers at the same time, the direction of the first detected speaker is instructed, but the number of microphones is one and the device configuration is It has the advantage of being simple.

【0030】[0030]

【発明の効果】以上説明したように、本発明によるテレ
ビ会議システムは、複数の参加者に向けてマイクロホン
を回動して入力される音圧レベルにより発言者を検出
し、その方向に向けて集音用マイクロホンとビデオカメ
ラの正面を向けるように制御するので、発言者検出およ
びその音声集音用のマイクロホンの本数を削減できる効
果がある。
As described above, the video conference system according to the present invention detects the speaker based on the sound pressure level input by rotating the microphones toward a plurality of participants and directs the speaker in that direction. Since the microphones for collecting sound and the front of the video camera are controlled so as to face each other, there is an effect that the number of microphones for detecting a speaker and collecting the sound can be reduced.

【0031】また、ビデオカメラの映像入力信号から人
型の輪郭を抽出し、画面中央部に記憶した人型の図形と
合わせることによって、ビデオカメラとマイクロホンを
発言者の方へ向けてその音声と映像を正確に送ることが
できる効果がある。
Further, by extracting a human-shaped contour from the video input signal of the video camera and matching it with the human-shaped figure stored in the center of the screen, the video camera and the microphone are directed to the speaker and the voice is reproduced. The effect is that the image can be sent accurately.

【0032】また、方向検出用の狭角度指向性マイクロ
ホンを発言者の音声集音用のマイクロホンと別に用いる
ことにより、方向検出の誤差を縮小できる効果がある。
Further, by using the narrow-angle directional microphone for direction detection separately from the microphone for collecting voice of the speaker, there is an effect that error in direction detection can be reduced.

【0033】また、1つのマイクロホンを回動して所定
の閾値以上の入力音圧レベルが検出された方向にマイク
ロホンとビデオカメラを向けることにより、発言者の検
出と装置の構成を簡単にすることができる効果がある。
Further, by rotating one microphone and pointing the microphone and the video camera in the direction in which the input sound pressure level above a predetermined threshold is detected, the speaker detection and the configuration of the apparatus can be simplified. There is an effect that can be.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のテレビ会議システムの第1実施例のブ
ロック図である。
FIG. 1 is a block diagram of a first embodiment of a video conference system of the present invention.

【図2】輪郭抽出部7のメモリに記憶される人型の図形
である。
FIG. 2 is a human-shaped figure stored in a memory of a contour extraction unit 7.

【図3】本発明のテレビ会議システムの第2実施例のブ
ロック図である。
FIG. 3 is a block diagram of a second embodiment of the video conference system of the present invention.

【図4】従来のテレビ会議システムの1例のブロック図
である。
FIG. 4 is a block diagram of an example of a conventional video conference system.

【図5】従来のテレビ会議システムの他の1例のブロッ
ク図である。
FIG. 5 is a block diagram of another example of a conventional video conference system.

【符号の説明】[Explanation of symbols]

1,1’,1a,1b,1c マイクロホン 2 音声方向検出部 3 システム制御部 4,4’ ビデオカメラ 5 マイクロホン方向制御部 6 ビデオカメラ方向制御部 7 輪郭抽出部 71 人型記憶画像、 8a,8b 回転軸 1, 1 ', 1a, 1b, 1c Microphone 2 Voice direction detection unit 3 System control unit 4, 4'Video camera 5 Microphone direction control unit 6 Video camera direction control unit 7 Contour extraction unit 71 Humanoid memory image, 8a, 8b Axis of rotation

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 複数の参加者から発言者を選択してその
音声と映像をマイクロホンとビデオカメラとにより入力
して伝送するテレビ会議システムの制御方法において、 前記複数の参加者に向けて回動可能なマイクロホンに入
力される音圧により発言者を検出し、 前記マイクロホンの集音基準軸正面を前記検出した発言
者の方向に向けて停止し、 前記ビデオカメラのレンズ正面を前記停止したマイクロ
ホンの集音基準軸に沿って該マイクロホンの前方へ向け
て移動しながら映像を入力してその輪郭像を抽出し、 前記輪郭像が所定の図形と一致した位置でビデオカメラ
の回動を停止して映像を入力することを特徴とするテレ
ビ会議システムの制御方法。
1. A control method for a video conference system, comprising: selecting a speaker from a plurality of participants and inputting and transmitting audio and video of the speaker with a microphone and a video camera, wherein the speaker is rotated toward the plurality of participants. A speaker is detected by a sound pressure input to a possible microphone, and the front surface of the microphone pickup reference axis is stopped toward the detected speaker, and the front surface of the lens of the video camera is stopped by the stopped microphone. While moving toward the front of the microphone along the sound collection reference axis, the image is input and the contour image is extracted, and the rotation of the video camera is stopped at the position where the contour image matches a predetermined figure. A method for controlling a video conference system, which comprises inputting an image.
【請求項2】 所定の図形が人の肩より上の部分の人型
輪郭像である請求項1に記載のテレビ会議システムの制
御方法。
2. The control method for a video conference system according to claim 1, wherein the predetermined figure is a humanoid contour image of a portion above a person's shoulder.
【請求項3】 複数の参加者から発言者を選択してそ
の音声と映像をマイクロホンとビデオカメラとにより入
力して伝送するテレビ会議システムの制御装置におい
て、 前記複数の参加者に向けて回動可能に支持されるマイク
ロホンと、 制御信号を受けて前記マイクロホンの回動および停止の
動作を制御するマイクロホン制御手段と、 前記マイクロホンが回動される過程で入力される音圧レ
ベルを比較し、最高音圧レベルが検出されたときの前記
マイクロホンの正面の方向を検出する方向検出手段と、 前記複数の参加者に向けて回動可能に支持されるビデオ
カメラと、 前記ビデオカメラの映像信号から画像の輪郭を抽出して
所定の図形と比較する画像輪郭抽出手段と、 制御信号を受けて前記ビデオカメラの回動およびズーミ
ング動作を制御するビデオカメラ制御手段と、 前記方向検出手段および画像輪郭抽出手段の出力信号を
解析して、前記マイクロホンとビデオカメラの制御信号
を出力するシステム制御手段とを有することを特徴とす
るテレビ会議システムの制御装置。
3. A control device of a video conferencing system for selecting a speaker from a plurality of participants and inputting and transmitting the voice and the image with a microphone and a video camera, wherein the speaker is rotated toward the plurality of participants. The maximum supported microphone is compared with the microphone control means that receives the control signal to control the turning and stopping operations of the microphone, and the sound pressure level input during the turning of the microphone. Direction detecting means for detecting the direction of the front of the microphone when the sound pressure level is detected, a video camera rotatably supported toward the plurality of participants, and an image from a video signal of the video camera. Image contour extracting means for extracting the contour of the video camera and comparing it with a predetermined figure, and controlling the rotation and zooming operation of the video camera by receiving a control signal. And a video camera control means for analyzing the output signals of the direction detecting means and the image contour extracting means, and a system control means for outputting control signals of the microphone and the video camera. Control device.
【請求項4】 画像輪郭抽出手段は、所定の図形として
人の肩より上の部分の人型の輪郭像が画面中央部に記憶
され、ビデオカメラの映像信号から抽出した画像の輪郭
と前記記憶された輪郭像との画面上の位置の差を検出し
て出力する請求項3に記載のテレビ会議システムの制御
装置。
4. The image contour extraction means stores a human-shaped contour image of a portion above a person's shoulder as a predetermined figure in the center of the screen, and the contour of the image extracted from the video signal of the video camera and the storage. The control device of the video conference system according to claim 3, which detects and outputs a difference between a position of the contour image and a position on the screen.
【請求項5】 マイクロホンが、所定の時間周期で回動
しており、その基準線からの偏位角度により最高音圧の
方向を検出する第1の狭角度指向性のマイクロホンと、
指示された方向に回動して停止し、その正面の音声を入
力する第2のマイクロホンとからなる請求項3または4
に記載のテレビ会議システムの制御装置。
5. A first narrow-angle directional microphone, wherein the microphone rotates in a predetermined time period, and detects the direction of the highest sound pressure by the deviation angle from the reference line.
5. A second microphone, which rotates in a direction instructed and stops, and which inputs a voice in front of the microphone.
The control device for the video conference system described in 1.
【請求項6】 複数の参加者から発言者を選択してその
音声と映像をマイクロホンとビデオカメラとにより入力
して伝送するテレビ会議システムの制御装置において、 前記複数の参加者に向けて回動可能に支持されるマイク
ロホンと、 制御信号を受けて前記マイクロホンの回動および停止の
動作を制御するマイクロホン制御手段と、 前記マイクロホンが回動される過程で入力される音圧レ
ベルが所定の閾値以上となったときの前記マイクロホン
の正面の方向を検出する方向検出手段と、 前記複数の参加者に向けて回動可能に支持されるビデオ
カメラと、 前記ビデオカメラの映像信号から画像の輪郭を抽出して
所定の図形と比較する画像輪郭抽出手段と、 制御信号を受けて前記ビデオカメラの回動およびズーミ
ングの動作を制御するビデオカメラ制御手段と、 前記方向検出手段および画像輪郭抽出手段の出力信号を
解析して、前記マイクロホンとビデオカメラの制御信号
を出力するシステム制御手段とを有することを特徴とす
るテレビ会議システムの制御装置。
6. A control device of a video conference system for selecting a speaker from a plurality of participants and inputting and transmitting the voice and the image with a microphone and a video camera, wherein the speaker is rotated toward the plurality of participants. A microphone that can be supported, a microphone control means that receives a control signal to control the rotation and stop operations of the microphone, and the sound pressure level input during the rotation of the microphone is equal to or greater than a predetermined threshold value. Direction detecting means for detecting the direction of the front of the microphone when it becomes, a video camera rotatably supported toward the plurality of participants, and an outline of an image extracted from a video signal of the video camera. Image contour extracting means for comparing with a predetermined figure, and a video camera for controlling the rotation and zooming operations of the video camera in response to a control signal. A control device for a video conference system, comprising: a camera control means; and a system control means for analyzing output signals of the direction detecting means and the image contour extracting means and outputting control signals of the microphone and the video camera. .
【請求項7】 マイクロホンが各参加者の席から略等距
離の位置に各参加者に向けて水平方向に回動可能に支持
され、そのマイクロホンの支持位置付近の上方にビデオ
カメラが各参加者に向けて垂直方向および水平方向に回
動可能に支持される請求項6に記載のテレビ会議システ
ムの制御装置。
7. A microphone is supported rotatably in a horizontal direction toward each participant at a position approximately equidistant from each participant's seat, and a video camera is provided above each microphone near the position where the microphone is supported. 7. The control device for the video conference system according to claim 6, which is supported so as to be vertically and horizontally rotatable toward.
JP7024008A 1995-02-13 1995-02-13 Video conference system Expired - Lifetime JP2737682B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7024008A JP2737682B2 (en) 1995-02-13 1995-02-13 Video conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7024008A JP2737682B2 (en) 1995-02-13 1995-02-13 Video conference system

Publications (2)

Publication Number Publication Date
JPH08223551A true JPH08223551A (en) 1996-08-30
JP2737682B2 JP2737682B2 (en) 1998-04-08

Family

ID=12126533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7024008A Expired - Lifetime JP2737682B2 (en) 1995-02-13 1995-02-13 Video conference system

Country Status (1)

Country Link
JP (1) JP2737682B2 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002516535A (en) * 1998-05-15 2002-06-04 ピクチャーテル コーポレイション Audio source positioning
JP2004193661A (en) * 2002-12-06 2004-07-08 Sony Corp Two-way communication system, video communication apparatus, and photographing processing control method for video communication apparatus
US6788337B1 (en) 1998-03-02 2004-09-07 Nec Corporation Television voice control system capable of obtaining lively voice matching with a television scene
US6795106B1 (en) * 1999-05-18 2004-09-21 Intel Corporation Method and apparatus for controlling a video camera in a video conferencing system
JP2004304560A (en) * 2003-03-31 2004-10-28 Fujitsu Ltd Electronic apparatus
EP1705911A1 (en) * 2005-03-24 2006-09-27 Alcatel Video conference system
JP2009296142A (en) * 2008-06-03 2009-12-17 Canon Inc Imaging device
JP2010239499A (en) * 2009-03-31 2010-10-21 Brother Ind Ltd Communication terminal unit, communication control unit, method of controlling communication of communication terminal unit, and communication control program
US8525870B2 (en) 2009-08-20 2013-09-03 Oki Electric Industry Co., Ltd. Remote communication apparatus and method of estimating a distance between an imaging device and a user image-captured

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339703A (en) 2000-05-26 2001-12-07 Nec Corp Video conference system, control apparatus of camera in video conference system and control method of camera
JP4669041B2 (en) 2006-02-28 2011-04-13 パナソニック株式会社 Wearable terminal

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05268599A (en) * 1992-03-17 1993-10-15 Fujitsu Ltd Automatic control system for portrait pickup camera in television conference system
JPH05300411A (en) * 1992-04-20 1993-11-12 Canon Inc Video camera apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05268599A (en) * 1992-03-17 1993-10-15 Fujitsu Ltd Automatic control system for portrait pickup camera in television conference system
JPH05300411A (en) * 1992-04-20 1993-11-12 Canon Inc Video camera apparatus

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6788337B1 (en) 1998-03-02 2004-09-07 Nec Corporation Television voice control system capable of obtaining lively voice matching with a television scene
JP2002516535A (en) * 1998-05-15 2002-06-04 ピクチャーテル コーポレイション Audio source positioning
US6795106B1 (en) * 1999-05-18 2004-09-21 Intel Corporation Method and apparatus for controlling a video camera in a video conferencing system
JP2004193661A (en) * 2002-12-06 2004-07-08 Sony Corp Two-way communication system, video communication apparatus, and photographing processing control method for video communication apparatus
JP2004304560A (en) * 2003-03-31 2004-10-28 Fujitsu Ltd Electronic apparatus
EP1705911A1 (en) * 2005-03-24 2006-09-27 Alcatel Video conference system
JP2009296142A (en) * 2008-06-03 2009-12-17 Canon Inc Imaging device
JP2010239499A (en) * 2009-03-31 2010-10-21 Brother Ind Ltd Communication terminal unit, communication control unit, method of controlling communication of communication terminal unit, and communication control program
US8525870B2 (en) 2009-08-20 2013-09-03 Oki Electric Industry Co., Ltd. Remote communication apparatus and method of estimating a distance between an imaging device and a user image-captured

Also Published As

Publication number Publication date
JP2737682B2 (en) 1998-04-08

Similar Documents

Publication Publication Date Title
US10491809B2 (en) Optimal view selection method in a video conference
US6850265B1 (en) Method and apparatus for tracking moving objects using combined video and audio information in video conferencing and other applications
US11128793B2 (en) Speaker tracking in auditoriums
US6005610A (en) Audio-visual object localization and tracking system and method therefor
EP2388996B1 (en) Videoconferencing endpoint having multiple voice-tracking cameras
CN111432115B (en) Face tracking method based on voice auxiliary positioning, terminal and storage device
EP1117076A2 (en) Self-service terminal
JP2011244456A (en) Voice tracking camera with speaker identification
WO2002079792A3 (en) Method and apparatus for audio/image speaker detection and locator
JP2737682B2 (en) Video conference system
JPH11331827A (en) Television camera
CN104349040B (en) For the camera base and its method in video conferencing system
TWI725340B (en) Holder of mobile communication device and operation method therefor
CN111551921A (en) Sound source orientation system and method based on sound image linkage
EP1705911A1 (en) Video conference system
JPH05122689A (en) Video conference system
JPH06351015A (en) Image pickup system for video conference system
JPH05244587A (en) Camera controller for television conference
KR20110085160A (en) Stenography input system and method for conference using face recognition
CN107438169A (en) Alignment system, pre-determined bit method and real-time location method
KR100264035B1 (en) Method and device of perceiving a voice in a monitor
JP6191333B2 (en) Information processing apparatus, communication system, and program
JPH06276514A (en) Camera control system in video conference system
JP2020115609A (en) Voice recording device, control method of the same, and program
JP2021197658A (en) Sound collecting device, sound collecting system, and sound collecting method