JPH10304329A - Conference image pickup device - Google Patents

Conference image pickup device

Info

Publication number
JPH10304329A
JPH10304329A JP9112227A JP11222797A JPH10304329A JP H10304329 A JPH10304329 A JP H10304329A JP 9112227 A JP9112227 A JP 9112227A JP 11222797 A JP11222797 A JP 11222797A JP H10304329 A JPH10304329 A JP H10304329A
Authority
JP
Japan
Prior art keywords
participant
imaging
unit
conference
position data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9112227A
Other languages
Japanese (ja)
Inventor
A Migdoll Michael
マイケル・A・ミグドル
Masaru Hashimoto
勝 橋本
Mitsuhide Maeda
光英 前田
Hitoshi Sakakibara
仁 榊原
W Haller Stephan
ステファン・W・ハラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP9112227A priority Critical patent/JPH10304329A/en
Publication of JPH10304329A publication Critical patent/JPH10304329A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain a conference image pickup device in which a setting work is simple and the number of participants is not limited by providing an image pickup direction determination part which retrieves voiceprint data from a data base, and outputs corresponding seated position data. SOLUTION: In conference, a non-directional microphone 1 collects a voice in the surrounding of a conference image pickup device, and outputs it as a voice signal S1 to a speaker identification part 4a. The speaker identification part 4a extracts the voiceprint of a participant P1 having the voice signal S1, retrieves the equivalent voiceprint from a data base 3, and outputs data S2 of the name of a participant P1 corresponding to the voiceprint to a seated position data capturing part 4b. The seated position data capturing part 4b reads seated position data S3 of the participant P1 with the name from the data base 3, and outputs it to a driving part 8. The driving part 8 rotates the image pickup direction of a video camera 9 so that the seated place of the participant P1 being a position indicated by the seated position data S3 can be picked-up.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、会議撮像装置に関
し、特にテレビ会議システム等に用いられ、ビデオカメ
ラの撮像方向を発言する参加者に自動的に合わせる会議
撮像装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a conference imaging apparatus, and more particularly to a conference imaging apparatus used in a video conference system or the like, which automatically adjusts the imaging direction of a video camera to a participant who speaks.

【0002】[0002]

【従来の技術】従来、この種の会議撮像システムとして
は、特開平4−1221184号公報に示されるよう
に、会議の参加者の一人一人の前に発言用のマイクを設
置して、これらマイクからの音声信号と予め登録された
音声の声紋とを比較して、どのマイクから音声入力され
たかを判断して、音声入力のあるマイクの位置にビデオ
カメラの撮像方向を合わせるものがあった。そして、こ
のビデオカメラの撮像映像と、マイクから入力される音
声とが、他の場所に設けられた相手先のテレビ会議シス
テムのモニタに映し出され、また音声出力されるように
なされている。
2. Description of the Related Art Conventionally, as this type of conference imaging system, as disclosed in Japanese Patent Application Laid-Open No. 4-121218, a microphone for speech is installed in front of each participant in a conference, and these microphones are used. In some cases, an audio signal from a user is compared with a pre-registered voice voiceprint to determine from which microphone the voice is input, and the imaging direction of the video camera is adjusted to the position of the microphone having the voice input. The image captured by the video camera and the sound input from the microphone are displayed on a monitor of the other party's video conference system provided in another place, and are output as sound.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上述の
ような会議撮像システムにあっては、発言する参加者の
一人一人にマイクを設置するため、配線が多くなり、設
置作業に手間を要するという問題点があった。また、参
加者が多くなるとマイクの数もそれに応じて多くする必
要があるので、マイクの数が制限されている場合には、
参加者の数が制限されるという問題点もあった。
However, in the above-described conference imaging system, since a microphone is installed for each participant who speaks, the number of wirings increases, and the installation work is troublesome. There was a point. Also, as the number of participants increases, the number of microphones must be increased accordingly, so if the number of microphones is limited,
There was also a problem that the number of participants was limited.

【0004】本発明は、上記問題点を改善するために成
されたもので、その目的とするところは、設置作業が容
易であって、参加者の数に制限のない会議撮像装置を提
供することにある。
SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and it is an object of the present invention to provide a conference imaging apparatus which can be easily installed and has an unlimited number of participants. It is in.

【0005】[0005]

【課題を解決するための手段】本発明は上記の問題を解
決するために、請求項1記載の発明にあっては、参加者
を撮像する撮像部と、周囲音声を集音する無指向性マイ
クと、撮像部の撮像方向と略一致した集音方向からの音
声を集音する指向性マイクと、参加者の声紋データと該
参加者の着席位置データとを対応させて記憶するデータ
ベースと、無指向性マイクの集音した音声に含まれる参
加者の音声の声紋を抽出し該声紋と一致する声紋データ
を前記データベースから検索して対応する着席位置デー
タを出力する撮像方向決定部と、該着席位置データに示
される位置を撮像するように前記撮像部の撮像方向を変
更する駆動部と、を有することを特徴とするものであ
る。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention provides an image pickup section for picking up a participant, and an omnidirectional pickup for collecting surrounding sounds. A microphone, a directional microphone that collects sound from a sound collection direction that substantially matches the imaging direction of the imaging unit, a database that stores the voiceprint data of the participant and the seating position data of the participant in association with each other, An imaging direction determining unit that extracts a voiceprint of a participant's voice included in the voice collected by the omnidirectional microphone, searches the database for voiceprint data that matches the voiceprint, and outputs corresponding seating position data; A driving unit that changes an imaging direction of the imaging unit so as to image the position indicated by the seating position data.

【0006】請求項2記載の発明にあっては、指向性マ
イクの集音する音声から参加者の音声以外のノイズを除
去するノイズ除去部を有することを特徴とするものであ
る。
According to a second aspect of the present invention, there is provided a noise removing unit for removing noise other than the participant's voice from the voice collected by the directional microphone.

【0007】請求項3記載の発明にあっては、前記ノイ
ズ除去部は、指向性マイクの集音した音声から無指向性
マイクの集音した音声を差し引くことによりノイズ除去
を行うことを特徴とするものである。
According to a third aspect of the present invention, the noise elimination section performs noise elimination by subtracting the voice collected by the omnidirectional microphone from the voice collected by the directional microphone. Is what you do.

【0008】請求項4記載の発明にあっては、撮像部の
撮像する参加者の微妙な動きに応じて、参加者が撮像映
像内の所定位置に位置するように、撮像部の撮像方向を
微調整する微調整部を有することを特徴とするものであ
る。
According to the invention described in claim 4, the imaging direction of the imaging unit is changed so that the participant is positioned at a predetermined position in the captured image in accordance with the subtle movement of the participant to be imaged by the imaging unit. It has a fine adjustment unit for performing fine adjustment.

【0009】請求項5記載の発明にあっては、前記微調
整部は、赤外線画像を出力する赤外線センサを有し、参
加者が赤外線画像内の所定位置に位置するように、撮像
部の撮像方向を微調整することを特徴とするものであ
る。
[0009] In the invention described in claim 5, the fine adjustment unit has an infrared sensor for outputting an infrared image, and the imaging unit uses the imaging unit so that the participant is located at a predetermined position in the infrared image. It is characterized in that the direction is finely adjusted.

【0010】[0010]

【発明の実施の形態】本発明の実施の形態を図1〜図3
を用いて説明する。図1は会議撮像装置の構成を示すブ
ロック図である。図2は会議撮像装置の撮像部の外観を
示す斜視図である。図3は会議撮像装置を設置した様子
を示す平面図である。
1 to 3 show an embodiment of the present invention.
This will be described with reference to FIG. FIG. 1 is a block diagram showing the configuration of the conference imaging device. FIG. 2 is a perspective view illustrating an appearance of an imaging unit of the conference imaging device. FIG. 3 is a plan view showing a state where the conference imaging device is installed.

【0011】図1において、会議撮像装置Aは、無指向
性マイク1、指向性マイク2、データベース3、撮像方
向決定部4、ノイズ除去部5、微調整部6、駆動部8、
撮像部に相当するビデオカメラ9を有して構成してあ
る。
In FIG. 1, a conference imaging apparatus A includes an omnidirectional microphone 1, a directional microphone 2, a database 3, an imaging direction determining unit 4, a noise removing unit 5, a fine adjustment unit 6, a driving unit 8,
The camera includes a video camera 9 corresponding to an imaging unit.

【0012】無指向性マイク1は、図2に示すように、
基台10に設けて有り、会議撮像装置Aの周囲の音声を
集音して、音声信号S1を撮像方向決定部4に出力する
ものである。無指向性マイク1は、集音の指向性を有し
ていないから、いずれの方向で音声が発生しても集音す
ることができるものである。
The omnidirectional microphone 1 is, as shown in FIG.
It is provided on the base 10 and collects sounds around the conference imaging device A and outputs an audio signal S1 to the imaging direction determination unit 4. Since the omnidirectional microphone 1 does not have directivity for sound collection, it can collect sound regardless of the direction in which sound is generated.

【0013】指向性マイク2は、図2に示すように、ビ
デオカメラ9の筐体に取り付けられており、集音方向D
1をビデオカメラ9の撮像方向D2に一致させている。
As shown in FIG. 2, the directional microphone 2 is mounted on the housing of the video camera 9 and has a sound collecting direction D.
1 corresponds to the imaging direction D2 of the video camera 9.

【0014】データベース3は、メモリや外部記憶装置
で構成されており、会議撮像装置Aが使用される会議の
参加者の名前、参加者の声紋データ、及び会議撮像装置
Aと参加者の着席場所との相対位置を表す着席位置デー
タ、を関係付けて記憶するものである。
The database 3 is composed of a memory and an external storage device. The names of the participants of the conference in which the conference imaging device A is used, the voiceprint data of the participants, the conference imaging device A and the seating location of the participants. And the seating position data indicating the relative position with respect to.

【0015】撮像方向決定部4は、話者特定部4aと、
着席位置データ獲得部4bとを有して構成してある。
The imaging direction determination unit 4 includes a speaker identification unit 4a,
And a seating position data acquisition unit 4b.

【0016】話者特定部4aは、無指向性マイク1から
音声信号S1を受け取ると、該音声信号S1の声紋を抽
出して、データベース3から同じ特徴の声紋を例えばパ
ターンマッチングにより検索する。話者特定部4aはデ
ータベース3から同じ特徴のの声紋データを検索する
と、該声紋データに対応付けられている参加者の名前の
データS2を着席位置データ獲得部4bに出力する。
Upon receiving the audio signal S1 from the omnidirectional microphone 1, the speaker identification unit 4a extracts a voiceprint of the audio signal S1 and searches the database 3 for a voiceprint having the same characteristics by, for example, pattern matching. When the speaker identification unit 4a searches the database 3 for voiceprint data having the same characteristics, the speaker identification unit 4a outputs the participant name data S2 associated with the voiceprint data to the seating position data acquisition unit 4b.

【0017】着席位置データ獲得部4bは、名前のデー
タS2を受け取ると、該名前の参加者の着席位置データ
S3を読み出して、該着席位置データS3を駆動部8に
出力する。また、着席位置データ獲得部4bは、一旦着
席位置データS3を駆動部8に出力すると、例えば10
秒間など一定期間は新たな名前のデータS2を受け取っ
ても、着席位置データS3を出力せず、一定期間経過後
に受け取った名前のデータS2について着席位置データ
S3を出力する。したがって、例えば第一の話者と第二
の話者とが交互に発言する場合に、話者特定部4aから
は次々と名前のデータS2が入力されるが、着席位置デ
ータ獲得部4bは次々と着席位置データS3を出力する
ことはない。
Upon receiving the name data S2, the seating position data acquiring section 4b reads the seating position data S3 of the participant with the name and outputs the seating position data S3 to the drive section 8. Further, once the seating position data obtaining unit 4b outputs the seating position data S3 to the driving unit 8, for example,
Even if the new name data S2 is received for a certain period such as seconds, the seating position data S3 is not output, and the seating position data S3 is output for the name data S2 received after the certain period elapses. Therefore, for example, when the first speaker and the second speaker speak alternately, the name data S2 is input one after another from the speaker identification unit 4a, but the seating position data acquisition unit 4b successively inputs. And the seating position data S3 are not output.

【0018】なお、データベース3、話者特定部4a、
着席位置データ獲得部4bは、基台10に内設される不
図示の基板上に設けられている。
The database 3, the speaker identification unit 4a,
The seating position data acquisition unit 4b is provided on a substrate (not shown) provided in the base 10.

【0019】駆動部8は、着席位置データS3を受け取
ると、該着席位置データS3の示す位置を撮像するよう
に、ビデオカメラ9の撮像方向D2を図2に示すパン軸
P及びチルト軸T回りに回動させる。また、駆動部8は
後述の微調整信号S4を受け取ると、パン軸P及びチル
ト軸T回りに撮像方向の微調整を行う。
When receiving the seating position data S3, the driving unit 8 changes the image pickup direction D2 of the video camera 9 around the pan axis P and the tilt axis T shown in FIG. 2 so as to image the position indicated by the seating position data S3. To rotate. Further, upon receiving a fine adjustment signal S4 described later, the drive unit 8 finely adjusts the imaging direction around the pan axis P and the tilt axis T.

【0020】ビデオカメラ9は、参加者を撮像するもの
であって、撮像した映像の映像信号S7を信号線L1を
介して図外の他のビデオ会議システムに出力するもので
ある。ビデオカメラ9は図2に示すように、基台10に
立設された支持部11に取り付けられている。
The video camera 9 captures an image of the participant, and outputs a video signal S7 of the captured video to another video conference system (not shown) via the signal line L1. As shown in FIG. 2, the video camera 9 is attached to a support 11 erected on a base 10.

【0021】微調整部6は、例えば16×16画素の解
像度の赤外線センサを有して構成され、図2に示すよう
に赤外線センサの感知方向D3を、ビデオカメラ9の撮
像方向D2に一致させて設けてある。微調整部6は、1
6×16画素の赤外線画像の中央に話者の顔面が位置す
るように、ビデオカメラ9の撮像方向D2を微調整する
微調整信号S4を駆動部8に出力する。
The fine adjustment section 6 has an infrared sensor having a resolution of, for example, 16.times.16 pixels. As shown in FIG. 2, the sensing direction D3 of the infrared sensor coincides with the imaging direction D2 of the video camera 9. It is provided. The fine adjustment unit 6
A fine adjustment signal S4 for finely adjusting the imaging direction D2 of the video camera 9 is output to the driving unit 8 so that the face of the speaker is positioned at the center of the infrared image of 6 × 16 pixels.

【0022】ノイズ除去部5は、指向性マイク2の出力
する音声信号S5から無指向性マイクの出力する音声信
号S1を差し引いた音声信号S6を算出し、信号線L2
を介して図外の他のビデオ会議システムに出力するもの
である。
The noise removing unit 5 calculates an audio signal S6 by subtracting the audio signal S1 output from the omnidirectional microphone from the audio signal S5 output from the directional microphone 2, and calculates a signal line L2
Through the other video conference system (not shown).

【0023】以上のようにして構成した会議撮像装置A
は、次のように動作する。まず、会議の参加者P1,P
2,P3…の名前、声紋データ、着席位置データを予め
データベース3に登録した会議撮像装置Aを、図3に示
すように例えば円形のテーブルBの中心に設置する。こ
のときテーブルB上の配線は、会議撮像装置Aの電源線
L3のみであって、従来の技術で説明したように配線が
多数配されるということはない。
The conference imaging apparatus A configured as described above
Works as follows. First, conference participants P1, P
A conference imaging device A in which the names 2, 2,..., Voiceprint data, and seating position data are registered in the database 3 in advance is installed at the center of a circular table B as shown in FIG. At this time, the wiring on the table B is only the power supply line L3 of the conference imaging apparatus A, and a large number of wirings are not arranged as described in the related art.

【0024】次に、会議中にあっては、無指向性マイク
1が会議撮像装置Aの周囲の音声を集音して音声信号S
1として話者特定部4aに出力する。そして、例えば参
加者P1が発言をすると、無指向性マイク1の出力する
音声信号S1には発言した参加者P1の音声が含まれ
る。
Next, during the conference, the omnidirectional microphone 1 collects the sound around the conference imaging device A and outputs the audio signal S.
1 is output to the speaker identification unit 4a. Then, for example, when the participant P1 speaks, the audio signal S1 output from the omnidirectional microphone 1 includes the voice of the participant P1 who has spoken.

【0025】話者特定部4aは、無指向性マイク1から
音声信号S1を受け取ると、音声信号S1の参加者P1
の声紋を抽出して、データベース3から同等の声紋を検
索する。話者特定部4aはデータベース3から同じ特徴
の声紋を検索すると、該声紋に対応付けられている参加
者P1の名前のデータS2を着席位置データ獲得部4b
に出力する。
When receiving the audio signal S1 from the omnidirectional microphone 1, the speaker identification unit 4a receives the audio signal S1 from the participant P1 of the audio signal S1.
Is extracted, and an equivalent voiceprint is searched from the database 3. When the speaker identification unit 4a searches the database 3 for a voiceprint having the same characteristic, the speaker identification unit 4a retrieves the data S2 of the name of the participant P1 associated with the voiceprint and obtains the seating position data acquisition unit 4b.
Output to

【0026】着席位置データ獲得部4bは、名前のデー
タS2を受け取ると、該名前の参加者P1の着席位置デ
ータS3をデータベース3から読み出して、該着席位置
データS3を駆動部8に出力する。
When receiving the name data S2, the seating position data acquiring section 4b reads the seating position data S3 of the participant P1 with the name from the database 3, and outputs the seating position data S3 to the drive section 8.

【0027】駆動部8は、着席位置データS3を受け取
ると、該着席位置データS3の示す位置である参加者P
1の着席場所を撮像するように、ビデオカメラ9の撮像
方向を図2に示すパン軸P及びTチルト軸回りに回動さ
せる。そして、ビデオカメラ9の撮像方向D2は、該発
言した参加者P1の方向に向けられ、ビデオカメラ9は
該参加者P1を撮像して他のテレビ会議システムに映像
信号S7を送信する。
Upon receiving the seating position data S3, the drive unit 8 receives the participant P at the position indicated by the seating position data S3.
The imaging direction of the video camera 9 is rotated around the pan axis P and the T-tilt axis shown in FIG. Then, the imaging direction D2 of the video camera 9 is directed toward the participant P1 who has said the speech, and the video camera 9 images the participant P1 and transmits the video signal S7 to another video conference system.

【0028】なお、着席位置データ獲得部4bは、一旦
着席位置データS3を駆動部8に出力すると、例えば1
0秒間など一定期間は新たな名前のデータS2を受け取
っても、着席位置データS3を出力せず、一定期間経過
後に受け取った名前のデータS2について着席位置デー
タS3を出力するから、例えば参加者P1と参加者P3
とが交互に発言する場合にも、ビデオカメラ9が振動的
に回動することを防止できる。
Once the seating position data acquiring section 4b outputs the seating position data S3 to the driving section 8, the seating position data acquiring section 4b outputs, for example, 1
Even if the new name data S2 is received for a certain period such as 0 second, the seating position data S3 is not output, and the seating position data S3 is output for the name data S2 received after a certain period of time. And participant P3
Also, when the video camera 9 alternately speaks, the video camera 9 can be prevented from vibratingly rotating.

【0029】一方、指向性マイク2は撮像方向D2の参
加者P1の発言の音声を集音し音声信号S5をノイズ除
去部5に出力し、無指向性マイク1も音声信号S1をノ
イズ除去部5に出力する。ノイズ除去部5は音声信号S
5から音声信号S1を差し引いて音声信号S6となし、
信号線L2を介して他のテレビ会議システムに音声信号
S6を送信する。
On the other hand, the directional microphone 2 collects the voice of the utterance of the participant P1 in the imaging direction D2, and outputs the audio signal S5 to the noise removing unit 5. 5 is output. The noise removing unit 5 outputs the audio signal S
5, the audio signal S1 is subtracted from the audio signal S6.
The audio signal S6 is transmitted to another video conference system via the signal line L2.

【0030】また、ビデオカメラ9が撮像している参加
者P1が姿勢を変えたり、椅子を左右にやや移動させた
場合などにあっては、ビデオカメラ9の撮像映像内の周
辺部分に参加者P1の姿が存在する事になるが、この場
合には、微調整部6が撮像方向D2の微調整を行う。即
ち、微調整部6は、16×16画素の赤外線画像の中央
に話者の顔面が位置するように、ビデオカメラ9の撮像
方向を微調整する微調整信号S4を駆動部8に出力し、
駆動部8が該微調整信号S4にしたがって撮像方向D2
の微調整を行う。
In the case where the participant P1 whose image is taken by the video camera 9 changes his / her posture or moves the chair slightly to the left or right, the participant P1 Although the figure of P1 exists, in this case, the fine adjustment unit 6 finely adjusts the imaging direction D2. That is, the fine adjustment unit 6 outputs a fine adjustment signal S4 for finely adjusting the imaging direction of the video camera 9 to the driving unit 8 so that the speaker's face is located at the center of the infrared image of 16 × 16 pixels,
The driving unit 8 sets the imaging direction D2 according to the fine adjustment signal S4.
Fine adjustment of.

【0031】以上のように構成した会議撮像装置にあっ
ては、複雑な配線が不要であって、会議撮像装置を例え
ばテーブルの中央に設置するのみで設置作業が終了す
る。
In the conference imaging apparatus configured as described above, complicated wiring is not required, and the installation work is completed only by installing the conference imaging apparatus at the center of the table, for example.

【0032】また、ノイズ除去部5が指向性マイク2の
集音した音声信号S5から無指向性マイク1の音声信号
S1を差し引いて音声信号6を出力するので、音声信号
S6は発言者の音声以外のノイズが少ないものとなる。
The noise removing unit 5 outputs the audio signal 6 by subtracting the audio signal S1 of the omnidirectional microphone 1 from the audio signal S5 collected by the directional microphone 2, so that the audio signal S6 is the voice of the speaker. Other noises are small.

【0033】また、微調整部6は、ビデオカメラ9の撮
像する参加者P1の微妙な動きに応じて、参加者P1が
撮像映像内の所定位置に位置するように、ビデオカメラ
9の撮像方向D2を微調整するので、他のテレビ会議シ
ステムの参加者は図外のモニタを通じて、絶えず参加者
が撮像映像内の所定位置に位置する映像を見ることがで
きる。また、赤外線センサは、参加者が撮像映像内のど
の位置に存在するのかを概略検出できればよいものであ
るから、解像度の低いものを用いることが可能であり、
その場合にあっては、安価に構成することが可能であ
る。
Further, the fine adjustment unit 6 adjusts the imaging direction of the video camera 9 so that the participant P1 is located at a predetermined position in the captured image according to the subtle movement of the participant P1 imaged by the video camera 9. Since the D2 is finely adjusted, the participants of the other video conference systems can constantly view the video in which the participants are located at predetermined positions in the captured video through a monitor (not shown). In addition, since the infrared sensor only needs to be able to roughly detect where the participant is located in the captured video, a low-resolution infrared sensor can be used.
In such a case, it is possible to configure at low cost.

【0034】なお、本実施の形態においては、微調整部
6は赤外線センサを有して構成するものとして説明して
いるが、これに限られるものではなく、撮像する参加者
の微妙な動きを検出することができるものであればよ
い。従って、例えば、微調整部として撮像映像を画像処
理して該画像内の参加者の位置を検出して、撮像する参
加者が撮像映像内の所定位置に位置するようにしてもよ
い。この場合、微調整部はビデオカメラ9の撮像した映
像を利用できるので、ビデオカメラ9の筐体に新たなセ
ンサを付設する必要がなく、ビデオカメラ9の外観を見
栄え良くすることができるとともに、画像処理の解像度
を高めることにより、より正確に微調整することができ
る。
In the present embodiment, the fine adjustment unit 6 has been described as having an infrared sensor. However, the present invention is not limited to this. Anything that can be detected may be used. Therefore, for example, the fine adjustment unit may process the captured image to detect the position of the participant in the image, and the participant to be imaged may be located at a predetermined position in the captured image. In this case, since the fine adjustment unit can use the image captured by the video camera 9, there is no need to attach a new sensor to the housing of the video camera 9, and the appearance of the video camera 9 can be improved, and By increasing the resolution of the image processing, fine adjustment can be made more accurately.

【0035】[0035]

【発明の効果】本発明の会議撮像装置は上述のように構
成してあるから、請求項1記載の発明にあっては、無指
向性マイクが周囲音声を集音し、撮像方向決定部が無指
向性マイクの集音した音声に含まれる参加者の音声の声
紋を抽出し該声紋と一致する声紋データを前記データベ
ースから検索して対応する着席位置データを出力し、駆
動部が該着席位置データに示される位置を撮像するよう
に前記撮像部の撮像方向を変更し、撮像部が該変更され
た撮像方向に位置する参加者を撮像し、指向性マイクが
撮像部の撮像方向と略一致した集音方向からの音声を集
音するので、発言した参加者を撮像し該参加者の音声を
集音することができるとともに、参加者毎にマイクを設
ける必要がなく、よって設置作業が容易であって、参加
者の数に制限のない会議撮像装置を提供できるという効
果を奏する。
According to the first aspect of the present invention, the omnidirectional microphone collects surrounding sounds, and the imaging direction determining unit includes the conference imaging apparatus according to the present invention. The voiceprint of the participant's voice included in the voice collected by the omnidirectional microphone is extracted, voiceprint data that matches the voiceprint is searched from the database, and corresponding seating position data is output. The imaging direction of the imaging unit is changed so as to image the position indicated by the data, the imaging unit images the participant located in the changed imaging direction, and the directional microphone substantially matches the imaging direction of the imaging unit. Since the sound from the collected sound direction is collected, it is possible to image the participant who spoke and collect the sound of the participant, and it is not necessary to provide a microphone for each participant. And there is no limit to the number of participants An effect that can provide conference imaging device.

【0036】請求項2記載の発明にあっては、ノイズ除
去部が指向性マイクの集音する音声から参加者の音声以
外のノイズを除去するので、より良質の参加者の音声を
出力することのできる会議撮像装置を提供できるという
効果を奏する。
According to the second aspect of the present invention, since the noise removing unit removes noises other than the participant's voice from the voice collected by the directional microphone, a better quality participant's voice is output. It is possible to provide a conference imaging apparatus capable of performing the above.

【0037】請求項3記載の発明にあっては、前記ノイ
ズ除去部は、指向性マイクの集音した音声から無指向性
マイクの集音した音声を差し引くことによりノイズ除去
を行うので、新たな部材を必要とすることなくノイズ除
去を行うことができる会議撮像装置を提供できるという
効果を奏する。
According to the third aspect of the present invention, the noise removing unit removes noise by subtracting the voice collected by the omnidirectional microphone from the voice collected by the directional microphone. There is an effect that it is possible to provide a conference imaging device capable of performing noise removal without requiring a member.

【0038】請求項4記載の発明にあっては、微調整部
が、撮像部の撮像する参加者の微妙な動きに応じて、参
加者が撮像映像内の所定位置に位置するように、撮像部
の撮像方向を微調整するので、会議撮像装置の出力映像
を見る者は、モニタ等を通じて、絶えず参加者が撮像映
像内の所定位置に位置する映像を見ることができる会議
撮像装置を提供できるという効果を奏する。
According to the fourth aspect of the present invention, the fine adjustment unit controls the imaging so that the participant is positioned at a predetermined position in the captured image in accordance with the subtle movement of the participant to be imaged by the imaging unit. Since the imaging direction of the unit is finely adjusted, a person who views an output image of the conference imaging apparatus can provide a conference imaging apparatus in which a participant can constantly view an image located at a predetermined position in the imaging image through a monitor or the like. This has the effect.

【0039】請求項5記載の発明にあっては、前記微調
整部は、赤外線画像を出力する赤外線センサを有し、参
加者が赤外線画像内の所定位置に位置するように、撮像
部の撮像方向を微調整するので、安価に構成することが
できる会議撮像装置を提供できるという効果を奏する。
According to a fifth aspect of the present invention, the fine adjustment unit has an infrared sensor that outputs an infrared image, and the imaging unit uses the imaging unit so that the participant is located at a predetermined position in the infrared image. Since the direction is finely adjusted, it is possible to provide an inexpensive conference imaging apparatus.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の会議撮像装置の構成を示すブロック図
である。
FIG. 1 is a block diagram illustrating a configuration of a conference imaging apparatus according to the present invention.

【図2】会議撮像装置の外観を示す斜視図である。FIG. 2 is a perspective view illustrating an appearance of the conference imaging apparatus.

【図3】会議撮像装置を設置した様子を示す平面図であ
る。
FIG. 3 is a plan view showing a state where a conference imaging device is installed.

【符号の説明】[Explanation of symbols]

1 無指向性マイク 2 指向性マイク 3 データベース 4 撮像方向決定部 5 ノイズ除去部 6 微調整部 8 駆動部 9 撮像部 Reference Signs List 1 omnidirectional microphone 2 directional microphone 3 database 4 imaging direction determination unit 5 noise removal unit 6 fine adjustment unit 8 drive unit 9 imaging unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 榊原 仁 大阪府門真市大字門真1048番地松下電工株 式会社内 (72)発明者 ステファン・W・ハラー 大阪府門真市大字門真1048番地松下電工株 式会社内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Jin Sakakibara 1048 Kadoma Kadoma, Osaka Prefecture Matsushita Electric Works Co., Ltd. In company

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 参加者を撮像する撮像部と、周囲音声を
集音する無指向性マイクと、撮像部の撮像方向と略一致
した集音方向からの音声を集音する指向性マイクと、参
加者の声紋データと該参加者の着席位置データとを対応
させて記憶するデータベースと、無指向性マイクの集音
した音声に含まれる参加者の音声の声紋を抽出し該声紋
と一致する声紋データを前記データベースから検索して
対応する着席位置データを出力する撮像方向決定部と、
該着席位置データに示される位置を撮像するように前記
撮像部の撮像方向を変更する駆動部と、を有することを
特徴とする会議撮像装置。
1. An imaging unit that images a participant, a non-directional microphone that collects ambient sound, a directional microphone that collects sound from a sound collection direction substantially coincident with an imaging direction of the imaging unit, A database for storing the voiceprint data of the participant and the seating position data of the participant in association with each other; a voiceprint of the voice of the participant included in the voice collected by the omnidirectional microphone; An imaging direction determining unit that retrieves data from the database and outputs corresponding seating position data,
A conference imaging device, comprising: a driving unit that changes an imaging direction of the imaging unit so as to image a position indicated by the seating position data.
【請求項2】 指向性マイクの集音する音声から参加者
の音声以外のノイズを除去するノイズ除去部を有するこ
とを特徴とする請求項1記載の会議撮像装置。
2. The conference imaging apparatus according to claim 1, further comprising a noise removing unit that removes noise other than the voice of the participant from the voice collected by the directional microphone.
【請求項3】 前記ノイズ除去部は、指向性マイクの集
音した音声から無指向性マイクの集音した音声を差し引
くことによりノイズ除去を行うことを特徴とする請求項
2記載の会議撮像装置。
3. The conference imaging apparatus according to claim 2, wherein the noise removing unit removes noise by subtracting the voice collected by the omnidirectional microphone from the voice collected by the directional microphone. .
【請求項4】 撮像部の撮像する参加者の微妙な動きに
応じて、参加者が撮像映像内の所定位置に位置するよう
に、撮像部の撮像方向を微調整する微調整部を有するこ
とを特徴とする請求項1乃至請求項3記載の会議撮像装
置。
4. A fine adjustment unit that finely adjusts the imaging direction of the imaging unit so that the participant is located at a predetermined position in the captured video in accordance with a delicate movement of the participant to be imaged by the imaging unit. The conference imaging apparatus according to claim 1, wherein:
【請求項5】 前記微調整部は、赤外線画像を出力する
赤外線センサを有し、参加者が赤外線画像内の所定位置
に位置するように、撮像部の撮像方向を微調整すること
を特徴とする請求項4記載の会議撮像装置。
5. The fine adjustment unit includes an infrared sensor that outputs an infrared image, and finely adjusts an imaging direction of the imaging unit so that a participant is located at a predetermined position in the infrared image. The conference imaging device according to claim 4.
JP9112227A 1997-04-30 1997-04-30 Conference image pickup device Pending JPH10304329A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9112227A JPH10304329A (en) 1997-04-30 1997-04-30 Conference image pickup device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9112227A JPH10304329A (en) 1997-04-30 1997-04-30 Conference image pickup device

Publications (1)

Publication Number Publication Date
JPH10304329A true JPH10304329A (en) 1998-11-13

Family

ID=14581442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9112227A Pending JPH10304329A (en) 1997-04-30 1997-04-30 Conference image pickup device

Country Status (1)

Country Link
JP (1) JPH10304329A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004118314A (en) * 2002-09-24 2004-04-15 Advanced Telecommunication Research Institute International Utterer detection system and video conference system using same
JP2010532137A (en) * 2007-06-28 2010-09-30 マイクロソフト コーポレーション Microphone array for camera speakerphone
US7852369B2 (en) * 2002-06-27 2010-12-14 Microsoft Corp. Integrated design for omni-directional camera and microphone array
US8749650B2 (en) 2007-06-29 2014-06-10 Microsoft Corporation Capture device movement compensation for speaker indexing
WO2019130908A1 (en) * 2017-12-26 2019-07-04 キヤノン株式会社 Imaging device, control method therefor and recording medium
JP2020071794A (en) * 2018-11-02 2020-05-07 国際航業株式会社 Abnormal natural phenomenon detection system and abnormal natural phenomenon detection method
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
US11503213B2 (en) 2017-12-26 2022-11-15 Canon Kabushiki Kaisha Image capturing apparatus, control method, and recording medium

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7852369B2 (en) * 2002-06-27 2010-12-14 Microsoft Corp. Integrated design for omni-directional camera and microphone array
JP2004118314A (en) * 2002-09-24 2004-04-15 Advanced Telecommunication Research Institute International Utterer detection system and video conference system using same
JP2010532137A (en) * 2007-06-28 2010-09-30 マイクロソフト コーポレーション Microphone array for camera speakerphone
US8526632B2 (en) 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8749650B2 (en) 2007-06-29 2014-06-10 Microsoft Corporation Capture device movement compensation for speaker indexing
WO2019130908A1 (en) * 2017-12-26 2019-07-04 キヤノン株式会社 Imaging device, control method therefor and recording medium
US11503213B2 (en) 2017-12-26 2022-11-15 Canon Kabushiki Kaisha Image capturing apparatus, control method, and recording medium
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
JP2020071794A (en) * 2018-11-02 2020-05-07 国際航業株式会社 Abnormal natural phenomenon detection system and abnormal natural phenomenon detection method

Similar Documents

Publication Publication Date Title
JP5857674B2 (en) Image processing apparatus and image processing system
US7460150B1 (en) Using gaze detection to determine an area of interest within a scene
US6850265B1 (en) Method and apparatus for tracking moving objects using combined video and audio information in video conferencing and other applications
JP4770178B2 (en) Camera control apparatus, camera system, electronic conference system, and camera control method
JP7133789B2 (en) Sound collection device, sound collection system, sound collection method, program, and calibration method
US20130321625A1 (en) Electronic device and information transmission system
WO2002079792A3 (en) Method and apparatus for audio/image speaker detection and locator
KR101421046B1 (en) Glasses and control method thereof
JPH10304329A (en) Conference image pickup device
EP1705911A1 (en) Video conference system
US6959095B2 (en) Method and apparatus for providing multiple output channels in a microphone
CN111551921A (en) Sound source orientation system and method based on sound image linkage
WO2015198964A1 (en) Imaging device provided with audio input/output function and videoconferencing system
JP2004118314A (en) Utterer detection system and video conference system using same
TWI826768B (en) Video conferencing system and method thereof
Fiala et al. A panoramic video and acoustic beamforming sensor for videoconferencing
EP3113505A1 (en) A head mounted audio acquisition module
JP2011087218A (en) Loud speaker system
JP2001067098A (en) Person detecting method and device equipped with person detecting function
JP2007037088A (en) Intercom device
JPH11234640A (en) Communication control system
JPH0983856A (en) Intelligent camera equipment
KR100264035B1 (en) Method and device of perceiving a voice in a monitor
JP2021197658A (en) Sound collecting device, sound collecting system, and sound collecting method
JPS63197188A (en) Video conference system