JPH10227849A - Sound source position measuring device, camera image pick-up controller, sound source position recording device, and sound source position measurement method - Google Patents

Sound source position measuring device, camera image pick-up controller, sound source position recording device, and sound source position measurement method

Info

Publication number
JPH10227849A
JPH10227849A JP3029297A JP3029297A JPH10227849A JP H10227849 A JPH10227849 A JP H10227849A JP 3029297 A JP3029297 A JP 3029297A JP 3029297 A JP3029297 A JP 3029297A JP H10227849 A JPH10227849 A JP H10227849A
Authority
JP
Japan
Prior art keywords
sound source
sound
source position
microphone
time difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3029297A
Other languages
Japanese (ja)
Other versions
JP3572849B2 (en
Inventor
Masahide Son
昌秀 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3029297A priority Critical patent/JP3572849B2/en
Publication of JPH10227849A publication Critical patent/JPH10227849A/en
Application granted granted Critical
Publication of JP3572849B2 publication Critical patent/JP3572849B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Focusing (AREA)
  • Automatic Focus Adjustment (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a sound source position by utilizing a time difference at the time when a sound from the same sound source arrives at a plurality of microphones. SOLUTION: Microphones 1-3 are arranged at three vertices of a triangle in a specific shape. A sound signal detection means 4 detects the time when a sound generated by one sound source is captured by each of the microphones 1-3 as a sound detection time. A time difference measurement means 5 measures the arrival time difference of sound to each of three sets of microphone pairs obtained by combining each two of the microphones 1-3 based on the sound detection time for each microphone. A sound source position calculation means 6 calculates a sound source position from the positions of the microphones 1-3 and the arrival time difference of sound for each microphone pair. A camera control means 7 controls the direction and the amount of zoom of the camera so that the camera captures a sound source in a specific size based on the sound source position information that is calculated by the sound source position calculation means 6.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音源からの音情報に
よって音源位置を計算する音源位置計測装置、音源位置
の情報に基づいてカメラの撮影位置を制御するカメラ撮
影制御装置、話者の発話時刻を記録する音源位置記録装
置及び音情報によって音源位置を計算する音源位置計測
方法に関し、特に同一音源からの音が複数のマイクに到
達するときの時間差を利用して音源位置を計算する音源
位置計測装置、その計算結果に基づいてカメラの撮影位
置を制御するカメラ撮影制御装置、前記の音源位置計算
装置の計算結果に基づいて発話者情報を記録する音源位
置記録装置及び同一音源からの音が複数のマイクに到達
するときの時間差を利用して音源位置を計算する音源位
置計測方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sound source position measuring device for calculating a sound source position based on sound information from a sound source, a camera photographing control device for controlling a photographing position of a camera based on sound source position information, and an utterance time of a speaker. Sound source position recording device and sound source position measurement method for calculating sound source position based on sound information, in particular, sound source position measurement using sound time difference when sound from the same sound source reaches a plurality of microphones Device, a camera photographing control device that controls the photographing position of the camera based on the calculation result, a sound source position recording device that records speaker information based on the calculation result of the sound source position calculation device, and a plurality of sounds from the same sound source. And a sound source position measuring method for calculating a sound source position using a time difference when the sound reaches a microphone.

【0002】[0002]

【従来の技術】会議の映像記録や遠隔会議システムにお
いては、会議の場全体を撮影したり、個々の発言者をズ
ームアップして捉えることが重要である。これによっ
て、発言者の表情や会議の雰囲気をよりよく捉え、会議
の臨場感を高めることができるからである。しかも、こ
のような撮影は自動的に行われることが望まれている。
2. Description of the Related Art In a video recording of a conference or a remote conference system, it is important to take an image of the entire conference or to zoom in on individual speakers. Thereby, the expression of the speaker and the atmosphere of the meeting can be better grasped, and the presence of the meeting can be enhanced. Moreover, it is desired that such shooting be performed automatically.

【0003】そこで、発言者を撮影できる会議システム
として特開平4−122184号公報や特開平4−29
7196号公報のような発明がなされている。前者は、
個々の音源すなわち各発言者それぞれにマイクを割り当
て、そのマイクからの信号によって発言者の検出を行う
もので、発言者の撮影は1台のカメラによって行われ
る。一方後者の発明は、各話者ごとにカメラとマイクを
割り当て、それぞれの話者の発言を各話者の声紋によっ
て判別するという方法を採っている。また、特開平6−
217304号公報では、話者ごとに固有の無線信号を
発信する発信機を各マイクに取り付け、この無線信号を
受信する受信機によって計測された受信信号をもとに発
信機の座標位置を求める方法を採っている。
[0003] Therefore, as a conference system capable of photographing a speaker, Japanese Patent Application Laid-Open Nos. 4-122184 and 4-29.
An invention such as that described in Japanese Patent No. 7196 is made. The former is
A microphone is assigned to each sound source, that is, each speaker, and the speaker is detected by a signal from the microphone. The photographing of the speaker is performed by one camera. On the other hand, the latter invention employs a method in which a camera and a microphone are assigned to each speaker, and the utterance of each speaker is determined based on the voiceprint of each speaker. In addition, Japanese Unexamined Patent Publication No.
In Japanese Patent No. 217304, a transmitter for transmitting a radio signal unique to each speaker is attached to each microphone, and a coordinate position of the transmitter is obtained based on a reception signal measured by a receiver for receiving the radio signal. Has been adopted.

【0004】ところが、これらのシステムでは、参加者
全員に対してマイクを用意しなければならないため煩雑
な設置作業が必要になると共に、カメラで撮影する位置
はあらかじめ設定された場所のみであるため、柔軟性に
かけていた。
[0004] However, in these systems, microphones must be prepared for all the participants, so that complicated installation work is required. Further, since the camera shoots only at a preset location, It was about flexibility.

【0005】それに対し、特開平7−140527号公
報に見られるカメラ撮影制御装置では、同一音源からの
音を2本のマイクが捉えたときに、マイク間の音の位相
差を利用して音源の方向を知るという方法をとることに
よって、少ないマイクで多くの音源方向にカメラを向け
ることができるように工夫している。
On the other hand, in the camera photographing control apparatus disclosed in Japanese Patent Application Laid-Open No. 7-140527, when two microphones capture sound from the same sound source, the sound phase difference between the microphones is used. By taking the method of knowing the direction of the camera, the camera is aimed at many sound source directions with a small number of microphones.

【0006】また、同一音源からの音が複数のマイクに
到達するときの時間差を利用して、音源の方向を知るこ
と、すなわち音源定位が可能であることは広く知られて
いる。この場合、2本のマイクでは、それらを結ぶ線の
中点に垂直な面を対称面とした対称性が残るため、前後
の判定ができなくなる。このため、特開平7−1405
27号公報に開示された発明では、カメラの脇にマイク
を取り付け、カメラ前方の音のみを捉えるようにしてい
る。
It is widely known that it is possible to know the direction of a sound source, that is, to perform sound source localization, by utilizing the time difference when sounds from the same sound source reach a plurality of microphones. In this case, with the two microphones, the symmetry with the plane perpendicular to the midpoint of the line connecting them remaining as the symmetry plane remains, so that it is impossible to determine the front and rear. For this reason, Japanese Patent Application Laid-Open No.
In the invention disclosed in Japanese Patent Publication No. 27, a microphone is attached to the side of the camera so that only the sound in front of the camera is captured.

【0007】また、会議の映像記録を行う際に各話者の
発話時刻の情報を取得できると、後に映像の編集に場合
に便利である。そこで従来は、各話者に割り当てられた
マイクへの音声入力を検知することによって、発話時刻
の情報を取得することも行われていた。
In addition, if the information of the utterance time of each speaker can be obtained when recording a video of a conference, it is convenient for editing video later. Therefore, conventionally, the information of the utterance time has been obtained by detecting the voice input to the microphone assigned to each speaker.

【0008】[0008]

【発明が解決しようとする課題】しかし、話者をカメラ
で撮影する場合には、従来の方法によって求められるの
はあくまで音源の方向であって、音源位置を求めるには
至っていないという問題点があった。すなわち、求めら
れる音源の方向はマイクの位置が基準となっていること
から、マイクとカメラが一体でなくてはならない。その
結果、マイクとカメラとを分離することができず、各話
者からの発声を捉えやすい位置にマイクを配置すること
ができないという制約があった。しかも、カメラで撮影
する場合には、カメラから音源までの位置によってズー
ムの度合いが変わるため、音源からの距離が分からない
と、ズーム量を調節することはできない。
However, when a speaker is photographed by a camera, there is a problem that the direction obtained by the conventional method is only the direction of the sound source, and the position of the sound source has not yet been obtained. there were. That is, since the direction of the sound source to be obtained is based on the position of the microphone, the microphone and the camera must be integrated. As a result, the microphone and the camera cannot be separated, and there is a restriction that the microphone cannot be arranged at a position where it is easy to catch the utterance from each speaker. In addition, when photographing with a camera, the degree of zoom changes depending on the position from the camera to the sound source. Therefore, the zoom amount cannot be adjusted unless the distance from the sound source is known.

【0009】また、発話時刻の情報を取得する場合に、
話者ごとにマイクを割り当てるのでは、マイクの設置や
ケーブルの取り回し等のために煩雑な作業が必要とな
る。従って、もっと簡単な構成で、マイクの捉えた音声
と話者とを対応づけられることが望まれている。
[0009] Further, when acquiring information on the utterance time,
Assigning a microphone to each speaker requires complicated work for installation of the microphone, routing of cables, and the like. Therefore, it is desired that the voice captured by the microphone and the speaker can be associated with a simpler configuration.

【0010】本発明はこのような点に鑑みてなされたも
のであり、同一音源からの音が複数のマイクに到達する
ときの時間差を利用して、音源位置を求めることができ
る音源位置計測装置を提供することを目的とする。
The present invention has been made in view of such a point, and a sound source position measuring apparatus capable of obtaining a sound source position by utilizing a time difference when sounds from the same sound source reach a plurality of microphones. The purpose is to provide.

【0011】また、本発明の別の目的は、カメラとマイ
クとを異なる位置に配置しても、音源の方向へカメラを
向けることができるカメラ撮影制御置を提供することで
ある。
Another object of the present invention is to provide a camera photographing control device which can point a camera toward a sound source even when a camera and a microphone are arranged at different positions.

【0012】また、本発明の他の目的は、音源位置情報
をもとに話者の識別を行い、各話者の発話開始時刻を記
録できる音源位置記録装置を提供することである。ま
た、本発明の他の目的は、同一音源からの音が複数のマ
イクに到達するときの時間差を利用して、音源位置を求
めるための音源位置計測方法を提供することである。
Another object of the present invention is to provide a sound source position recording apparatus capable of identifying a speaker based on sound source position information and recording the utterance start time of each speaker. It is another object of the present invention to provide a sound source position measuring method for obtaining a sound source position by utilizing a time difference when sounds from the same sound source reach a plurality of microphones.

【0013】[0013]

【課題を解決するための手段】本発明では上記課題を解
決するために、音情報によって音源位置を計算する音源
位置計測装置において、所定の形状の三角形の3つの頂
点に設置されたマイクと、1つの音源の発した音が前記
マイクのそれぞれで捉えられた時刻を音検出時刻として
検出する音信号検出手段と、前記マイクごとの音検出時
刻に基づいて、前記マイクの2個ずつを組合わせること
により得られる3組のマイクペアごとの音の到達時間差
を測定する時間差測定手段と、それぞれの前記マイクの
位置とマイクペアごとの音の到達時間差とから、音源位
置を計算する音源位置計算手段と、を有することを特徴
とする音源位置計測装置が提供される。
According to the present invention, in order to solve the above-mentioned problems, in a sound source position measuring device for calculating a sound source position based on sound information, a microphone installed at three vertexes of a triangle having a predetermined shape; A sound signal detecting means for detecting a time at which a sound emitted from one sound source is captured by each of the microphones as a sound detection time, and two microphones each based on the sound detection time for each microphone. Time difference measuring means for measuring the arrival time difference of sound for each of the three microphone pairs, sound source position calculating means for calculating the sound source position from the position of each microphone and the sound arrival time difference for each microphone pair, A sound source position measuring device characterized by having:

【0014】このような音源位置計測装置によれば、あ
る音源から音が発せられると、各マイクにより、その音
源からの距離に応じた時刻にその音が捉えられる。次い
で、マイクが音を捉えた時刻が音信号検出手段で検出さ
れ、音検出時刻とされる。すると、その音検出時刻に基
づいて、時間差測定手段により、マイクペアごとの音の
到達時間差が測定される。そして、マイクペアごとの音
の到達時間差に基づいて、音源位置計算手段により、音
源位置が計算される。
According to such a sound source position measuring device, when a sound is emitted from a certain sound source, each microphone captures the sound at a time corresponding to a distance from the sound source. Next, the time when the microphone captures the sound is detected by the sound signal detecting means, and is set as the sound detection time. Then, based on the sound detection time, the time difference measuring means measures the arrival time difference of the sound for each microphone pair. Then, the sound source position is calculated by the sound source position calculation means based on the arrival time difference of the sound for each microphone pair.

【0015】また、回転台の上に設置されたカメラの向
きを制御しながら撮影を行うカメラ撮影装置において、
所定の形状の三角形の3つの頂点に設置されたマイク
と、1つの音源の発した音が前記マイクのそれぞれで捉
えられた時刻を音検出時刻として検出する音信号検出手
段と、前記マイクごとの音検出時刻に基づいて、前記マ
イクの2個ずつを組合わせることにより得られる3組の
マイクペアごとの音の到達時間差を測定する時間差測定
手段と、それぞれの前記マイクの位置、マイクペアごと
の音の到達時間差及び前記カメラの位置の情報に基づ
き、前記カメラに対する音源の相対的な位置を計算する
音源位置計算手段と、前記音源位置計算手段が算出した
音源の位置情報に基づき、音源の方向へカメラの向きを
制御するカメラ制御手段と、を有することを特徴とする
カメラ撮影制御装置が提供される。
In a camera photographing apparatus for photographing while controlling the direction of a camera installed on a turntable,
Microphones installed at three vertexes of a triangle having a predetermined shape, sound signal detecting means for detecting a time when a sound emitted from one sound source is captured by each of the microphones as sound detection time, Time difference measuring means for measuring the arrival time difference of the sound for each of the three microphone pairs obtained by combining two of the microphones based on the sound detection time; Sound source position calculating means for calculating a relative position of a sound source with respect to the camera based on the arrival time difference and information on the position of the camera; and a camera moving in the direction of the sound source based on the position information of the sound source calculated by the sound source position calculating means. And a camera control means for controlling the direction of the camera.

【0016】このようなカメラ撮影装置によれば、ある
音源から音が発せられると、各マイクが、その音源から
の距離に応じた時刻にその音を捉える。マイクが音を捉
えた時刻が音信号検出手段により音検出時刻とされ、そ
の音検出時刻に基づいて、時間差測定手段によりマイク
ペアごとの音の到達時間差が測定され、そのマイクペア
ごとの音の到達時間差に基づいて、音源位置計算手段に
より音源位置が計算される。そして、カメラ制御手段に
より、音源の方向へカメラの向きが制御される。これに
より、常に話者に対してカメラを向けておくことができ
る。
According to such a camera photographing apparatus, when a sound is emitted from a certain sound source, each microphone captures the sound at a time corresponding to a distance from the sound source. The time at which the microphone captures the sound is defined as the sound detection time by the sound signal detection means, and the time difference measurement means measures the arrival time difference of the sound for each microphone pair based on the sound detection time. The sound source position is calculated by the sound source position calculating means based on Then, the camera control means controls the direction of the camera toward the sound source. As a result, the camera can always be pointed at the speaker.

【0017】また、音情報によって音源位置の情報に基
づいて音源位置を記録する音源位置記録装置において、
所定の形状の三角形の3つの頂点に設置されたマイク
と、1つの音源の発した音が前記マイクのそれぞれで捉
えられた時刻を音検出時刻として検出する音信号検出手
段と、前記マイクごとの音検出時刻に基づいて、前記マ
イクの2個ずつを組合わせることにより得られる3組の
マイクペアごとの音の到達時間差を測定する時間差測定
手段と、それぞれの前記マイクの位置とマイクペアごと
の音の到達時間差とから、音源位置を計算する音源位置
計算手段と、前記音源位置計算手段が計算した音源位置
が所定の範囲内の場合には同一の音源から発せられた音
とし、所定の範囲外の場合には異なる音源から発せされ
た音とすることにより、音源ごとの発話時間を記録する
発話情報記録手段と、を有することを特徴とする音源位
置記録装置が提供される。
In a sound source position recording apparatus for recording a sound source position based on sound source position information based on sound information,
Microphones installed at three vertexes of a triangle having a predetermined shape, sound signal detecting means for detecting a time when a sound emitted from one sound source is captured by each of the microphones as sound detection time, Time difference measuring means for measuring the arrival time difference of sound for each of three microphone pairs obtained by combining two of the microphones based on the sound detection time, and the position of each microphone and the sound of each microphone pair From the arrival time difference, the sound source position calculating means for calculating the sound source position, and if the sound source position calculated by the sound source position calculating means is within a predetermined range, the sound is emitted from the same sound source, and the sound outside the predetermined range And a utterance information recording means for recording an utterance time for each sound source by using sounds uttered from different sound sources in some cases. That.

【0018】このような発話情報記録手段によれば、あ
る音源から音が発せられると、各マイクが、その音源か
らの距離に応じた時刻にその音を捉える。マイクが音を
捉えた時刻が音信号検出手段により音検出時刻とされ、
その音検出時刻に基づいて、時間差測定手段によりマイ
クペアごとの音の到達時間差が測定され、マイクペアご
との音の到達時間差に基づいて、音源位置計算手段によ
り音源位置が計算される。そして、音源位置計算手段の
計算結果に基づいて、発話情報記録手段により、音源位
置ごとの発話時間が記録される。これにより、どの場所
にいた者が何時発言したのかを、逐次記録することがで
きる。
According to such utterance information recording means, when a sound is emitted from a certain sound source, each microphone captures the sound at a time corresponding to the distance from the sound source. The time at which the microphone captures the sound is taken as the sound detection time by the sound signal detection means,
The time difference measuring means measures the arrival time difference of the sound for each microphone pair based on the sound detection time, and the sound source position calculating means calculates the sound source position based on the sound arrival time difference for each microphone pair. Then, based on the calculation result of the sound source position calculating means, the utterance information recording means records the utterance time for each sound source position. Thereby, it is possible to sequentially record at what place and at what time a person who was speaking.

【0019】また、音情報によって音源位置を計算する
音源位置計測方法において、所定の形状の三角形の3つ
の頂点に設置されたマイクのそれぞれで、1つの音源の
発した音が捉えられた時刻を音検出時刻として検出し、
前記マイクごとの音検出時刻に基づいて、前記マイクの
2個ずつを組合わせることにより得られる3組のマイク
ペアごとの音の到達時間差を測定し、それぞれの前記マ
イクの位置とマイクペアごとの音の到達時間差とから、
音源位置を計算する、ことを特徴とする音源位置計測方
法が提供される。
In the sound source position measuring method for calculating a sound source position based on sound information, a time at which a sound emitted from one sound source is captured by each of microphones installed at three vertexes of a triangle having a predetermined shape is determined. Detected as sound detection time,
Based on the sound detection time of each microphone, the arrival time difference of the sound of each of the three microphone pairs obtained by combining two of the microphones is measured, and the position of each microphone and the sound of each microphone pair are measured. From the arrival time difference,
A sound source position measurement method is provided, which calculates a sound source position.

【0020】このような音源位置計測方法によれば、1
つの音源から発せられた音が三角形の頂点に配置された
各マイクで捉えられた音検出時刻から、マイクペアごと
の音の到達時間差が測定され、その到達時間差により音
源位置が計算される。
According to such a sound source position measuring method, 1
From the sound detection time at which the sounds emitted from the two sound sources are captured by the microphones arranged at the vertices of the triangle, the arrival time difference of the sound for each microphone pair is measured, and the sound source position is calculated based on the arrival time difference.

【0021】[0021]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明のカメラ撮影制御
装置の原理構成図である。まず、所定の形状の三角形の
3つの頂点にマイク1〜3が配置されている。音信号検
出手段4は、1つの音源の発した音がマイク1〜3のそ
れぞれで捉えられた時刻を音検出時刻として検出すると
ともに、マイク1〜3の捉えた音声信号を映像・音声記
録再生手段12に送る。時間差測定手段5は、マイクご
との音検出時刻に基づいて、マイク1〜3の2個ずつを
組合わせることにより得られる3組のマイクペアごとの
音の到達時間差を測定する。音源位置計算手段6は、そ
れぞれのマイク1〜3の位置とマイクペアごとの音の到
達時間差とから、音源位置を計算する。計算された音源
位置の情報は、カメラ制御手段7と発話情報記録手段1
1とに渡される。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a principle configuration diagram of a camera photographing control device of the present invention. First, microphones 1 to 3 are arranged at three vertices of a triangle having a predetermined shape. The sound signal detecting means 4 detects the time at which the sound emitted from one sound source is captured by each of the microphones 1 to 3 as a sound detection time, and reproduces the audio signal captured by the microphones 1 to 3 for video / audio recording / reproduction. Send to means 12. The time difference measuring means 5 measures the arrival time difference of sound for each of the three microphone pairs obtained by combining two microphones 1 to 3 based on the sound detection time for each microphone. The sound source position calculation means 6 calculates a sound source position from the positions of the microphones 1 to 3 and the arrival time difference of sound for each microphone pair. Information on the calculated sound source position is stored in the camera control unit 7 and the utterance information recording unit 1.
Passed to one.

【0022】カメラ制御手段7は、カメラ本体9が載せ
られてた回転台を回転させるカメラ駆動手段8と、カメ
ラ本体9のズーム量を調整するための電動レンズ10と
を制御している。そして、カメラ制御手段7は、音源位
置情報に基づき、カメラが音源を所定の大きさで捉える
ようにカメラの向きとズーム量を制御する。カメラ本体
9で撮影された映像信号は、映像・音声記録再生手段1
2に送られる。
The camera control means 7 controls a camera driving means 8 for rotating a turntable on which the camera body 9 is mounted, and an electric lens 10 for adjusting the zoom amount of the camera body 9. Then, the camera control means 7 controls the direction and the zoom amount of the camera based on the sound source position information so that the camera captures the sound source at a predetermined size. The video signal captured by the camera body 9 is transmitted to the video / audio recording / reproducing means 1.
Sent to 2.

【0023】発話情報記録手段11は、マイクが音を捉
えた際の音源位置情報と、発話時刻とを記録する。映像
・音声記録再生手段12は、カメラ本体9から送られた
映像情報を記録再生する。再生指示手段13は、発話情
報記録手段11に格納された情報を用いて、映像・音声
記録再生手段12に対して再生指示を与える。
The utterance information recording means 11 records sound source position information when the microphone captures sound and utterance time. The video / audio recording / reproducing means 12 records and reproduces the video information sent from the camera body 9. The reproduction instructing means 13 gives a reproduction instruction to the video / audio recording / reproducing means 12 using the information stored in the speech information recording means 11.

【0024】このようなカメラ撮影制御装置によれば、
ある場所で発言をした者がいると、その声は3本のマイ
ク1〜3で捉えられる。すると、音信号検出手段4によ
り、各マイク1〜3が音を捉えた時刻が検出され、音検
出時刻とされる。この際、話者のいる位置から各マイク
1〜3までの距離の違いにより、各マイク1〜3が音を
捉える時刻には時間差が生じている。そこで、時間差測
定手段5によりマイク1〜3の2個ずつを組合わせるこ
とにより3組のマイクペアが作られ、そのマイクぺアご
との音の到達時間差が測定される。そして、各マイクペ
アの音の到達時間差を用いて、音源位置計算手段6によ
って音源位置が計算される。この際、カメラ本体9の位
置を基準とした座標系における音源位置が算出される。
According to such a camera photographing control device,
When a person speaks in a certain place, the voice is captured by the three microphones 1 to 3. Then, the time when each of the microphones 1 to 3 captures the sound is detected by the sound signal detecting means 4, and is set as the sound detection time. At this time, due to the difference in the distance from the position where the speaker is present to each of the microphones 1 to 3, there is a time difference in the time at which each of the microphones 1 to 3 captures sound. Therefore, three microphone pairs are created by combining two microphones 1 to 3 by the time difference measuring means 5, and the arrival time difference of the sound for each microphone pair is measured. Then, the sound source position is calculated by the sound source position calculating means 6 using the arrival time difference of the sound of each microphone pair. At this time, the sound source position in the coordinate system based on the position of the camera body 9 is calculated.

【0025】音源位置が求まると、カメラ制御手段7に
よりカメラ本体9から見た音源の方向と距離とが計算さ
れ、カメラ駆動手段8を制御することによりカメラ本体
9が音源の方向に向けられるるとともに、電動レンズ1
0を制御することによりズーム量が調節される。
When the sound source position is determined, the direction and the distance of the sound source viewed from the camera body 9 are calculated by the camera control means 7, and the camera body 9 is directed to the sound source by controlling the camera driving means 8. With the motorized lens 1
By controlling 0, the zoom amount is adjusted.

【0026】一方、音信号検出手段4が検出した音声情
報と、カメラ本体9が撮影した映像情報とが映像・音声
記録再生手段12に記録されるとともに、音源ごとの発
話時刻が発話情報記録手段11に格納される。そして、
この装置のオペレータは、発話情報記録手段11に格納
された情報により任意の話者の発話時刻を知ることがで
き、特定の話者の発言のみを映像・音声記録再生手段1
2から抽出して再生することもできる。
On the other hand, the audio information detected by the audio signal detecting means 4 and the video information photographed by the camera body 9 are recorded in the video / audio recording / reproducing means 12, and the utterance time for each sound source is recorded in the utterance information recording means. 11 is stored. And
The operator of this apparatus can know the utterance time of an arbitrary speaker based on the information stored in the utterance information recording means 11 and only the utterance of a specific speaker is recorded in the video / audio recording / reproducing means 1.
2 and can be reproduced.

【0027】このようにして、3本のマイクのみで音源
位置を測定できるため、マイクとカメラとを離しておい
てもカメラを音源に向けることができるとともに、カメ
ラから音源までの距離に応じてズーム量を調整すること
もできる。さらに、音源位置と発話時刻とを対応づけて
記録しておくことができるため、各話者の発話時刻と映
像・音声記録再生手段12に記録された情報とを対応づ
けることにより、映像のインデックスを作成することが
できる。
In this way, since the position of the sound source can be measured with only three microphones, the camera can be pointed at the sound source even when the microphone is separated from the camera, and the distance between the camera and the sound source can be adjusted according to the distance from the camera to the sound source. You can also adjust the amount of zoom. Furthermore, since the sound source position and the utterance time can be recorded in association with each other, the utterance time of each speaker is associated with the information recorded in the video / audio recording / reproducing means 12 so that the video index can be obtained. Can be created.

【0028】ところで、本発明のカメラ撮影制御装置
は、テレビ会議システムや重要な会議のビデオ撮影とし
て有効に利用できる。そこで、本発明のカメラ撮影制御
装置を用いて会議の内容を撮影する場合を例にとり実施
の形態を説明する。
By the way, the camera photographing control device of the present invention can be effectively used as a video conference system and video photographing of important conferences. Therefore, an embodiment will be described by taking as an example a case where the contents of a meeting are photographed using the camera photographing control device of the present invention.

【0029】図2は、第1の実施の形態に係るカメラ撮
影制御装置の配置図である。この例では、司会者21と
向き合って、複数の参加者22a〜22kがコの字形の
テーブル23に着いている。会議室の中央には、正三角
形の頂点に配置された3本のマイク1〜3が置かれてい
る。これらのマイク1〜3は、カメラ撮影制御装置の装
置本体100に接続されている。装置本体100には、
カメラ200が接続されている。
FIG. 2 is a layout diagram of the camera photographing control device according to the first embodiment. In this example, a plurality of participants 22a to 22k arrive at a U-shaped table 23 facing the moderator 21. In the center of the conference room, three microphones 1 to 3 arranged at the vertices of an equilateral triangle are placed. These microphones 1 to 3 are connected to the device main body 100 of the camera photographing control device. In the device body 100,
The camera 200 is connected.

【0030】発言者の声をマイク1〜3が捉えると、装
置本体100によって音源位置が計算され、カメラが発
言者の方向に向けられるとともに、カメラから発言者ま
での距離に応じてズーム・インやズーム・アウトが行わ
れる。
When the microphones 1 to 3 capture the voice of the speaker, the sound source position is calculated by the apparatus main body 100, the camera is turned in the direction of the speaker, and the camera is zoomed in according to the distance from the camera to the speaker. And zoom out.

【0031】なお、3本のマイク1〜3の作る正三角形
の辺の長さ、すなわちマイク間の距離は任意に設定可能
であるが、ここでは会議の場で設置しやすく、常温での
音速値340m/ sから計算しやすい値である68cm
としている。
The length of the sides of the equilateral triangle formed by the three microphones 1 to 3, ie, the distance between the microphones, can be arbitrarily set. Here, the microphones are easily installed in a meeting place, and the speed of sound at room temperature is easy. 68cm which is easy to calculate from the value 340m / s
And

【0032】図3は、第1の実施の形態に係るカメラ撮
影制御装置の内部構成図である。音声入力手段である正
三角形の頂点に配置された3本のマイク1〜3は音信号
検出器110に接続されている。音信号検出器110
は、マイク1〜3の捉えた音を音声信号として出力する
とともに、各マイク1〜3が音を捉えた時刻に応じた信
号を出力する。その信号は、時間差測定器120に入力
される。時間差測定器120は、各マイク1〜3が音を
捉えた時刻の時間差を計算して、時間差データを出力す
る。その時間差データは音源位置計算器130に入力さ
れる。音源位置計算器130は、時間差データから音源
位置を計算して出力する。
FIG. 3 is an internal configuration diagram of the camera photographing control device according to the first embodiment. Three microphones 1 to 3 arranged at the vertices of an equilateral triangle, which are voice input means, are connected to the sound signal detector 110. Sound signal detector 110
Outputs the sound captured by the microphones 1 to 3 as an audio signal and outputs a signal corresponding to the time at which each of the microphones 1 to 3 captures the sound. The signal is input to the time difference measuring device 120. The time difference measuring device 120 calculates a time difference between times when the microphones 1 to 3 capture the sound, and outputs time difference data. The time difference data is input to the sound source position calculator 130. The sound source position calculator 130 calculates and outputs a sound source position from the time difference data.

【0033】基準信号発生器101は、同一音源からの
音を各マイクが捉えた時刻の時間差を計測するため基準
クロックを発生し、その基準クロックを時間差測定器1
20と音源位置計算器130とに供給する。ここでは周
期0.5μsの方形波を生成している。この周期によっ
て音の時間差計測の分解能が決まる。この実施の形態で
はマイク間の距離が68cmであるため、マイク間の最
大の時間差は68cmを音速(340m/ s)で割った
値、すなわち2msとなる。0.5μsという値はこの
4000分の1の値であるため、会議における話者位置
計算には十分な分解能である。
The reference signal generator 101 generates a reference clock for measuring the time difference between the times when each microphone captures a sound from the same sound source, and uses the reference clock as the time difference measuring device 1
20 and a sound source position calculator 130. Here, a square wave having a period of 0.5 μs is generated. The resolution of the time difference measurement of the sound is determined by this cycle. In this embodiment, since the distance between the microphones is 68 cm, the maximum time difference between the microphones is a value obtained by dividing 68 cm by the speed of sound (340 m / s), that is, 2 ms. Since the value of 0.5 μs is 1/4000 of this value, the resolution is sufficient for speaker position calculation in a conference.

【0034】カメラ制御装置140は、音源位置計算器
130から音源位置データを受け取り、カメラ本体20
3の方向およびズーム量を制御する。カメラ本体203
は回転台201の上に固定されており、回転台201を
回転させることによりカメラ本体203の方向を変える
ことができる。また、カメラ本体203には、撮影範囲
を変える電動レンズ202を備えており、この電動レン
ズ202の調整によりズーム量が調整できる。カメラ本
体203の撮影した画像は、映像出力103として出力
される。
The camera controller 140 receives the sound source position data from the sound source position calculator 130 and
3 and the zoom amount are controlled. Camera body 203
Is fixed on a turntable 201, and the direction of the camera body 203 can be changed by rotating the turntable 201. Further, the camera body 203 includes an electric lens 202 for changing a shooting range, and the zoom amount can be adjusted by adjusting the electric lens 202. The image captured by the camera body 203 is output as a video output 103.

【0035】このような構成のカメラ撮影制御装置によ
れば、図2の司会者21若しくは参加者22a〜22k
が発言すると、その音声は3つのマイク1〜3で捉えら
れ音信号検出器110に入力される。以下に、音信号検
出器110の詳細を説明する。
According to the camera photographing control device having such a configuration, the moderator 21 or the participants 22a to 22k in FIG.
, The sound is captured by the three microphones 1 to 3 and input to the sound signal detector 110. Hereinafter, the sound signal detector 110 will be described in detail.

【0036】図4は、音信号検出器110の内部構成を
示す図である。音信号検出器110は、基本的に、アン
プ111a〜111c、信号・電力変換器112a〜1
12c、レベル判定器113a〜113c、及び微分器
114a〜114cの4つの要素を1組とした、3つの
組から構成されている。
FIG. 4 is a diagram showing the internal configuration of the sound signal detector 110. The sound signal detector 110 basically includes amplifiers 111a to 111c and signal / power converters 112a to 112a.
12c, the level determination units 113a to 113c, and the differentiators 114a to 114c are configured as three sets, each of which is one set.

【0037】各マイク1〜3からの信号103a〜10
3cは、信号を増幅するアンプ111a〜111cに入
力される。アンプ111a〜111cの出力は、それぞ
れに対応して設けられた信号・電力変換器112a〜1
12cに入力されるとともに、ミキサー115にも入力
される。ミキサー115は、アンプによって増幅された
音声信号をステレオ信号に変換し、音声出力102とし
て出力する。
Signals 103a to 103a from the microphones 1 to 3
3c is input to amplifiers 111a to 111c that amplify the signal. Outputs of the amplifiers 111a to 111c are output from signal / power converters 112a to 112
The signal is input to the mixer 115 as well as to the mixer 115. The mixer 115 converts the audio signal amplified by the amplifier into a stereo signal and outputs the stereo signal as the audio output 102.

【0038】各信号・電力変換器112a〜112c
は、アンプ111a〜111cの出力信号から音信号の
パワーを求め、パワー信号をそれぞれに対応して設けら
れたレベル判定器113a〜113cに入力する。各レ
ベル判定器113a〜113cは、パワー信号を特定の
しきい値によって2値化したのちTTL(Transistor-T
ransistor-Logic )レベルの信号を、それぞれに対応し
て設けられた微分器114a〜114cに入力する。各
微分器114a〜114cは、入力された信号の出力の
立上がりを検出し、立ち上がりを示すトリガ信号104
a〜104cを出力する。
Each signal / power converter 112a-112c
Calculates the power of the sound signal from the output signals of the amplifiers 111a to 111c, and inputs the power signal to the level determiners 113a to 113c provided correspondingly. Each of the level determiners 113a to 113c binarizes the power signal with a specific threshold value, and then converts the binarized signal into a TTL (Transistor-T).
ransistor-Logic) level signals are input to differentiators 114a to 114c provided corresponding to the respective signals. Each of the differentiators 114a to 114c detects a rising edge of the output of the input signal, and a trigger signal 104 indicating the rising edge.
a to 104c are output.

【0039】なお、微分器114a〜114cの出力の
前には、ダイオードの働きにより、正の微分結果のみを
出力するようにしてある。また、アンプ111a〜11
1cの増幅度とレベル判定器113a〜113cのしき
い値は、各組ごとにボリュームによって任意に設定する
ことができる。
Before the outputs of the differentiators 114a to 114c, only positive differential results are output by the action of diodes. In addition, the amplifiers 111a to 11a
The amplification degree of 1c and the threshold values of the level determiners 113a to 113c can be arbitrarily set for each set by the volume.

【0040】このような音信号検出器110における信
号の変化を、マイク1からの信号103aを例にとり以
下に説明する。図5は、音信号検出器110における信
号の変化を示す図である。なお、この図では全て横軸が
時間であり、縦軸が電圧である。
The change of the signal in the sound signal detector 110 will be described below by taking the signal 103a from the microphone 1 as an example. FIG. 5 is a diagram illustrating a change in a signal in the sound signal detector 110. In this figure, the horizontal axis represents time, and the vertical axis represents voltage.

【0041】(A)はマイク1から入力された信号の波
形を示す図である。マイク1からは比較的弱い波形の信
号103aが入力されている。この信号103aがアン
プ111aで増幅される。
FIG. 3A is a diagram showing a waveform of a signal input from the microphone 1. A signal 103a having a relatively weak waveform is input from the microphone 1. This signal 103a is amplified by the amplifier 111a.

【0042】(B)はアンプ111aで増幅後の信号の
波形を示す図である。アンプ111aにより増幅される
ことにより、(A)に示した波形に比べ振幅の大きい波
形となっている。この信号は、信号・電圧変換器112
aにより、パワー信号に変換される。
FIG. 7B is a diagram showing the waveform of the signal amplified by the amplifier 111a. By being amplified by the amplifier 111a, the waveform becomes larger in amplitude than the waveform shown in FIG. This signal is supplied to the signal / voltage converter 112.
The signal is converted into a power signal by a.

【0043】(C)は、パワー信号の波形を示す図であ
る。パワー信号は、正の値だけの信号である。この信号
は、レベル判別器113aでしきい値116によってレ
ベル判定がなされる。
(C) is a diagram showing a waveform of the power signal. The power signal is a signal having only a positive value. The level of this signal is determined by the threshold value 116 in the level discriminator 113a.

【0044】(D)は、レベル判定後の信号の波形を示
す図である。レベル判定により2値化された信号が得ら
れる。この信号が微分器114aを通過することによ
り、トリガ状の信号となる。
(D) is a diagram showing the waveform of the signal after the level determination. A binary signal is obtained by the level determination. When this signal passes through the differentiator 114a, it becomes a trigger-like signal.

【0045】(E)は、微分器114aから出力される
信号の波形を示す図である。微分器114aから出力さ
れるトリガ信号状の波形は、微分器114aに入力され
た信号の立ち上がり時を示している。
(E) is a diagram showing a waveform of a signal output from the differentiator 114a. The waveform of the trigger signal output from the differentiator 114a indicates the rising time of the signal input to the differentiator 114a.

【0046】このようにして、マイク1が捉えた音か
ら、その音を捉えた時点を示すトリガ信号状の波形が得
られる。この処理は、他の2つのマイク2,3の捉えた
音に対しても同様に行われ、それぞれのマイク2,3に
対応するトリガ信号104b〜104cが音信号検出器
110の出力信号となる。
In this way, from the sound captured by the microphone 1, a trigger signal-like waveform indicating the time when the sound is captured is obtained. This process is similarly performed on the sounds captured by the other two microphones 2 and 3, and the trigger signals 104 b to 104 c corresponding to the respective microphones 2 and 3 are output signals of the sound signal detector 110. .

【0047】各音信号検出器110から出力された3つ
のトリガ信号104a〜104cは、基準信号発生器1
01からのクロック信号とともに時間差測定器120に
入力される。
The three trigger signals 104a to 104c output from the respective sound signal detectors 110 correspond to the reference signal generator 1
The signal is input to the time difference measuring device 120 together with the clock signal from 01.

【0048】図6は、時間差測定器120の内部構成を
示す図である。時間差測定器120は、3つのトリガ信
号変換器121a〜121cと、3つの遅延器122a
〜122cとから構成される。トリガ信号変換器121
a〜121cは、入力されたトリガ信号104a〜10
4cを基準信号発生器101が生成する方形波のH(ハ
イ)レベルと同じ時間幅の方形波に変換する。また、各
遅延器122a〜122cは、2つの方形波の時間差を
測定する。
FIG. 6 is a diagram showing the internal configuration of the time difference measuring device 120. The time difference measuring device 120 includes three trigger signal converters 121a to 121c and three delay devices 122a.
To 122c. Trigger signal converter 121
a to 121c are input trigger signals 104a to 104c
4c is converted into a square wave having the same time width as the H (high) level of the square wave generated by the reference signal generator 101. Further, each of the delay units 122a to 122c measures a time difference between two square waves.

【0049】このような構成の時間差測定器120によ
れば、入力されたトリガ信号104a〜104cは、ト
リガ信号変換器121a〜121cにより、基準信号で
ある方形波のHレベルと同じ時間幅の方形波に変換され
る。
According to the time difference measuring device 120 having such a configuration, the input trigger signals 104a to 104c are converted by the trigger signal converters 121a to 121c into squares having the same time width as the H level of the square wave as the reference signal. Converted to waves.

【0050】図7は、トリガ信号から得られる方形波を
示す図である。(A)はトリガ信号を表しており、
(B)は方形波を表している。すなわち、ある時刻から
160.8μs後にトリガ信号104aがあったとする
と、そのトリガ信号104aはつぎの基準クロックがH
レベルとなっている161.0μsから161.25μ
sの間がHレベルであるような方形波120aに変換さ
れる。
FIG. 7 is a diagram showing a square wave obtained from the trigger signal. (A) represents a trigger signal,
(B) represents a square wave. That is, if there is a trigger signal 104a 160.8 μs after a certain time, the trigger signal 104a is set to the next reference clock H
161.0μs to 161.25μ
The signal is converted into a square wave 120a having an H level during s.

【0051】基準クロックの周期に量子化された信号
は、次に2つずつの信号をペアにして、遅延器122a
〜122cに入力される。すなわち、マイク1とマイク
2とによる信号のペア、マイク2とマイク3とによる信
号のペア、そしてマイク3とマイク1とによる信号のペ
アの3つの組が遅延器122a〜122cに入力され
る。
The signal quantized in the cycle of the reference clock is then paired with two signals, and the delay unit 122a
To 122c. That is, three pairs of a signal pair of the microphone 1 and the microphone 2, a signal pair of the microphone 2 and the microphone 3, and a signal pair of the microphone 3 and the microphone 1 are input to the delay units 122a to 122c.

【0052】図8は、遅延器122aの内部構成を示す
図である。遅延器122aは、実際にディレイ回路によ
って構成することも可能であるが、この例では信号がク
ロックの周期に合わせて量子化されていることを利用し
て、順序判定器122aa、カウンタ122abおよび
データ変換器122acによって構成している。
FIG. 8 is a diagram showing the internal configuration of the delay unit 122a. The delay unit 122a can be actually constituted by a delay circuit. In this example, the order determination unit 122aa, the counter 122ab, and the data It is constituted by a converter 122ac.

【0053】順序判定器122aaはどちらの入力が先
にあったかを判定するもので、マイク1による信号12
3a、マイク2による信号123b、およびクリア信号
122adの3つの入力を持つ。そして、順序判定器1
22aaは、順序を判定するための出力である順序判定
ビット122ae,122afをデータ変換器122a
cに対して出力するとともに、時間差計測のための信号
122agをカウンタ122abへ出力する。
The order determiner 122aa determines which input has come first.
3a, a signal 123b from the microphone 2, and a clear signal 122ad. And the order determiner 1
22aa outputs order determination bits 122ae and 122af, which are outputs for determining the order, to the data converter 122a.
c and outputs a signal 122ag for time difference measurement to the counter 122ab.

【0054】カウンタ122abには、順序判定器12
2aaの出力122ag以外に、基準信号発生器101
からのクロック信号122ahが入力されている。カウ
ンタ122abは、順序判定器122aaの出力した信
号122agがHレベルである間だけ、入力されている
クロック信号122ahのHレベルの回数を計数するも
のであり、計数結果である計数出力122aiをデータ
変換器122acに対して出力する。また、カウンタ1
22abは、順序判定器122aaに対するクリア信号
122adも出力する。
The counter 122ab includes the order judgment unit 12
In addition to the output 122ag of 2aa, the reference signal generator 101
From the clock signal 122ah. The counter 122ab counts the number of H-levels of the input clock signal 122ah only while the signal 122ag output from the sequence determiner 122aa is at H-level, and converts the count output 122ai, which is the counting result, into data conversion. Is output to the detector 122ac. Also, counter 1
22ab also outputs a clear signal 122ad to the order determiner 122aa.

【0055】データ変換器122acは、順序判定器1
22aaの2つの順序判定ビット122ae,122a
fと、2バイトの符号無し2進数のカウンタ122ab
の計数出力122aiを、2バイトの符号付き2進数に
変換するものである。そして、変換結果を出力データ1
05aとするとともにデータ変換終了信号106aを1
パルスのHレベルとして出力する。
The data converter 122ac includes the order determiner 1
22aa, two order determination bits 122ae and 122a
f and a 2-byte unsigned binary counter 122ab
Is converted into a 2-byte signed binary number. Then, the conversion result is output data 1
05a and the data conversion end signal 106a is set to 1
Output as the H level of the pulse.

【0056】このような構成の遅延器122aは、次の
ように動作する。2つの信号123a,123bが入力
されると、順序判定器122aaにより、どちらの信号
の入力が早かったかが判定される。信号123aの入力
のほうが早くHレベルになれば順序判定ビット122a
eがHレベルに保たれ、逆に信号123bの入力のほう
が早くHレベルになれば順序判定ビット122afがH
レベルに保たれる。そして、カウンタ122abへ出力
される信号122agは、2つの信号123a,123
b入力のどちらかがHレベルになった時点から他方の信
号がHレベルになるまでHレベルが保たれる。これらの
順序判定器122aaの状態は、クリア信号122ad
がHレベルになることによってクリアされる。したがっ
て、順序判定ビット122aeおよび順序判定ビット1
22afの出力がこの順序で(1,0)ならば信号12
3aの入力が早く、また(0,1)ならば信号123b
の入力が早いことが判定できる。
The delay unit 122a having such a configuration operates as follows. When the two signals 123a and 123b are input, the order determiner 122aa determines which signal is input earlier. If the input of the signal 123a becomes H level earlier, the order determination bit 122a
e is kept at the H level, and conversely, if the input of the signal 123b goes to the H level earlier, the order determination bit 122af becomes H level.
Kept at the level. The signal 122ag output to the counter 122ab is composed of two signals 123a and 123a.
The H level is maintained from the time when either of the b inputs becomes H level until the other signal becomes H level. The state of these order determiners 122aa is determined by the clear signal 122ad.
Is cleared to H level. Therefore, the order determination bit 122ae and the order determination bit 1
If the output of 22af is (1, 0) in this order, the signal 12
If the input of 3a is fast and (0, 1), the signal 123b
Can be determined to be quick.

【0057】カウンタ122abは、信号122agが
Hレベルになると、入力されているクロック信号122
ahのHレベルの回数の計数を開始する。信号122a
gがL(ロー)レベルになると、カウンタ122abは
計数を停止し、計数した情報を16ビットの符号なし2
進数として計数出力122aiとする。したがって、ク
ロックの周期0.5μsにこの計数結果を乗じた値が計
測された時間差となるが、ここではカウンタ122ab
の計数した値をそのまま用いる。カウンタ122ab
は、計数出力122aiが出力されると同時にクリア信
号122adにも1パルスのHレベルの信号を送り出
す。このクリア信号122adによって、順序判定器1
22aaの状態がクリアされ、次の入力に備える。
When the signal 122ag becomes H level, the counter 122ab
The counting of the number of H levels of ah is started. Signal 122a
When g becomes L (low) level, the counter 122ab stops counting, and counts the counted information as 16-bit unsigned 2 bits.
The count output 122ai is represented as a base number. Accordingly, a value obtained by multiplying the clock cycle of 0.5 μs by the result of the counting is a measured time difference.
Is used as it is. Counter 122ab
Sends out a one-pulse H-level signal to the clear signal 122ad at the same time that the count output 122ai is output. By this clear signal 122ad, the order determining unit 1
The state of 22aa is cleared to prepare for the next input.

【0058】2つの順序判定ビット122ae,122
afの出力と2バイトの符号無し2進数のカウンタ12
2abの計数出力122aiとは、データ変換器122
acにより2バイトの符号付き2進数に変換され、出力
データ105aとなる。データ変換が終了すると、デー
タ変換終了信号106aを1パルスのHレベルとして出
力する。出力データ105aとデータ変換終了信号10
6aとは、次の音源位置計算器130に送られる。な
お、3つの遅延器122a〜122cのそれぞれのデー
タ変換器は、マイクペアの順序を(1、2)、(2、
3)および(3、1)とし、それぞれ第1列のマイクの
音のほうが先であると、符号をプラスにし、逆の場合は
符号をマイナスにする。
Two order determination bits 122ae, 122
af output and 2-byte unsigned binary counter 12
The 2ab count output 122ai is a data converter 122
The data is converted into a 2-byte signed binary number by ac and becomes output data 105a. When the data conversion is completed, the data conversion end signal 106a is output as one pulse H level. Output data 105a and data conversion end signal 10
6a is sent to the next sound source position calculator 130. The data converters of the three delay units 122a to 122c change the order of the microphone pairs to (1, 2), (2,
3) and (3, 1). If the sound of the microphone in the first row is earlier than the sign, the sign is set to plus, and if the opposite, the sign is set to minus.

【0059】ここで、音源位置計算器130の機能の詳
細を説明する前に、音源位置の計算方法について述べ
る。音源位置計算の基本は、2つのマイクにおける音源
方向の計算にある。
Before describing the details of the function of the sound source position calculator 130, a method of calculating the sound source position will be described. The basis of the sound source position calculation is to calculate the sound source direction in the two microphones.

【0060】図9は、音源方向の計算のためのマイクの
座標系を示す図である。図に示すように、2つのマイク
1,2を通る直線をu軸とし、2つのマイク1,2の中
点を原点としたu−v座標系を考える。そして原点から
−aだけ離れた位置(−a,0)にマイク1が、またa
だけ離れた位置(a,0)にマイク2が置かれており、
音源Pの位置が原点から(r,Θ)の位置にあるとする
と、音源Pからの音がそれぞれのマイクに到達するとき
の時間差dtは、
FIG. 9 is a diagram showing a microphone coordinate system for calculating the sound source direction. As shown in the figure, a uv coordinate system in which a straight line passing through the two microphones 1 and 2 is a u-axis and a midpoint of the two microphones 1 and 2 is an origin is considered. The microphone 1 is located at a position (-a, 0) away from the origin by -a, and a
Microphone 2 is located at a position (a, 0)
Assuming that the position of the sound source P is at a position (r, Θ) from the origin, the time difference dt when the sound from the sound source P reaches each microphone is:

【0061】[0061]

【数1】 となる。ただし、V0 は音速の値(常温で340m/
s)である。これをrをパラメータとしてプロットして
みる。
(Equation 1) Becomes However, V 0 is the value of sound speed (340 m /
s). This is plotted using r as a parameter.

【0062】図10は、マイク間の時間差と音源方向と
の関係式を示すグラフである。ただし、ここではa=1
mで計算している。このように、dtに対するrの効果
はΘに比べて十分小さく、rの値を変化させたとしても
角度誤差は5度程度であることと、いずれのrをとって
もΘが約25度より小さくなる領域ではそれまでの領域
に比べてdtに対する角度感度が高くなっていることが
分かる。このことから、マイクペアへの音の到達時間差
を知ることによって、その音の音源の方向、すなわちu
−v座標の原点と音源とを結ぶ直線を求めることができ
る。別のマイクペアによってもうひとつの直線を求めれ
ば、それらの直線の交点から音源位置が求められる。
FIG. 10 is a graph showing a relational expression between a time difference between microphones and a sound source direction. Here, a = 1
m. As described above, the effect of r on dt is sufficiently smaller than 、, and the angle error is about 5 degrees even if the value of r is changed, and Θ becomes smaller than about 25 degrees at any r. It can be seen that the angle sensitivity to dt is higher in the region than in the previous regions. From this, knowing the arrival time difference of the sound to the microphone pair, the direction of the sound source of the sound, ie, u
A straight line connecting the origin of the -v coordinate and the sound source can be obtained. If another straight line is obtained by another microphone pair, the sound source position is obtained from the intersection of those straight lines.

【0063】本実施の形態では、マイクペアの組み合わ
せによって音源位置の計算を行うため、X軸から±60
度の範囲を各マイクペアの計測範囲として音源位置計算
を行う。
In the present embodiment, since the position of the sound source is calculated by the combination of the microphone pairs, ± 60 degrees from the X axis are calculated.
The sound source position calculation is performed using the range of degrees as the measurement range of each microphone pair.

【0064】図11は、1組のマイクペアの計測範囲を
示す図である。2本のマイク1,2がu軸上に原点を挟
んで配置されているとすれば、このマイクペアの計測範
囲は、原点から見て、u軸を中心に正の方向に±60
°、負の方向に±60°である。このように計測範囲を
定め、3組のマイクペアのうち、音源位置が計測範囲内
にある2つのマイクペアを使って音源位置の計算を行
う。3本のマイクは正三角形の頂点に配置されているた
め、任意の音源位置に対して必ず2つのマイクペアがこ
の範囲に収まる。したがって、音源位置計算に利用する
データは、3つの時間差計数データから最も時間差の小
さいデータを除外したものとなる。
FIG. 11 is a diagram showing a measurement range of one microphone pair. Assuming that the two microphones 1 and 2 are arranged on the u axis with the origin therebetween, the measurement range of this microphone pair is ± 60 in the positive direction about the u axis as viewed from the origin.
°, ± 60 ° in the negative direction. The measurement range is thus determined, and the sound source position is calculated using two microphone pairs whose sound source positions are within the measurement range among the three microphone pairs. Since the three microphones are arranged at the vertices of an equilateral triangle, two microphone pairs always fall within this range for an arbitrary sound source position. Therefore, the data used for the sound source position calculation is obtained by excluding the data with the smallest time difference from the three time difference count data.

【0065】そこで、音源位置の計算には、まず、それ
ぞれのマイクペアにおいて個別に図11に示したような
座標系をとって音源方向を求める。音源方向は、計測さ
れた時間差データを角度−時間差情報テーブルと比較す
ることによって求める。
Therefore, in calculating the sound source position, first, the sound source direction is obtained by individually using the coordinate system shown in FIG. 11 for each microphone pair. The sound source direction is obtained by comparing the measured time difference data with the angle-time difference information table.

【0066】図12は角度−時間差情報テーブルを示す
図である。この例ではマイク間の距離が68cmである
ので、図のテーブルではrの値を3mに設定して、上の
式でΘが0度から60度まで5度ごと2つのマイクの時
間差情報を入力してある。テーブルの第1列目は、上か
ら順に60度から5度ごとに0度までの角度が与えられ
ており、第2列目にはその角度での2つのマイクの時間
差データが格納されている。時間差データは、上の式で
計算した時間差を基準クロックの周期である0.5μs
で割った値の2バイトの符号付き整数表現にしてある。
これによって、時間差測定器120で求めた時間差デー
タとの比較が直接行える。時間差データから方向を知る
には、このテーブルの第2列目を参照し、時間差データ
の絶対値がテーブル内の値を超えない最大のセルを見出
せば、そのテーブルの第1列から角度データを得ること
ができる。このとき、図11のv軸の両側で線対称にな
っているが、時間差データの値がマイナスならばマイク
1側に発話位置があり、またプラスならばマイク2側に
発話位置があることになる。
FIG. 12 shows an angle-time difference information table. In this example, since the distance between the microphones is 68 cm, the value of r is set to 3 m in the table in the figure, and in the above equation, the time difference information of the two microphones is input every 5 degrees from 0 to 60 degrees. I have. In the first column of the table, angles from 0 degree to 60 degrees are given in order from the top from 5 degrees, and the second column stores time difference data of the two microphones at that angle. . The time difference data is calculated by using the time difference calculated by the above equation as a reference clock cycle of 0.5 μs.
Is a 2-byte signed integer representation of the value divided by.
Thus, comparison with the time difference data obtained by the time difference measuring device 120 can be directly performed. To find the direction from the time difference data, refer to the second column of this table. If the maximum cell whose absolute value of the time difference data does not exceed the value in the table is found, the angle data is obtained from the first column of the table. Obtainable. At this time, it is symmetrical on both sides of the v-axis in FIG. 11, but if the value of the time difference data is minus, the utterance position is on the microphone 1 side, and if it is plus, the utterance position is on the microphone 2 side. Become.

【0067】また、ここで求められた角度データは、2
つのマイクを結ぶ軸(図11のu軸)を対称軸としてそ
の軸から両側の2つの直線が解として成り立つが、この
対称性の問題は、時間差データとマイクペアの組み合わ
せ情報とによって解決することができる。
The angle data obtained here is 2
The axis connecting two microphones (the u-axis in FIG. 11) is a symmetric axis, and two straight lines on both sides from the axis are established as solutions. This symmetry problem can be solved by time difference data and microphone pair combination information. it can.

【0068】図13は、2つの時間差情報から音源位置
を求めるための方法を説明する図である。この例では、
マイク3,1のマイクペアとマイク2,3のマイクペア
により音源位置を求める。なお、各マイク1〜3を頂点
とする正三角形の重心(各頂点と対辺の中点とを結ぶ線
分の交点)が原点となるようにx−y座標が定義されて
いる。マイク3,1のマイクペアからは2本の直線31
a,31bが求められ、マイク2,3のマイクペアから
も2本の直線32a,32bが求められる。また、音源
Pからの音はマイク3に達するよりも速くマイク1およ
びマイク2に達するため、マイク2とマイク3とのペア
からはプラスの角度情報(マイク2側に音源があること
を示す)が得られ、またマイク3とマイク1のペアから
はマイナスの角度情報(マイク1側に音源があることを
示す)が得られる。しかも、図11に示したように、各
マイクペアの計測範囲は制限されている。したがって、
時間差情報の組み合わせにより、音源の範囲が限定でき
る。図13の例における音源位置は、第1象限のx軸か
らの角度が0〜60度の範囲に限定される。すなわち、
直線31bおよび直線32bの可能性はないことにな
り、結局直線31aおよび直線32aの2つが残ること
になる。
FIG. 13 is a diagram for explaining a method for obtaining a sound source position from two pieces of time difference information. In this example,
The sound source position is obtained from the microphone pair of the microphones 3 and 1 and the microphone pair of the microphones 2 and 3. The xy coordinates are defined such that the center of gravity of the equilateral triangle having the microphones 1 to 3 as vertices (the intersection of the line segment connecting each vertex and the midpoint of the opposite side) becomes the origin. Two straight lines 31 from the microphone pair of microphones 3 and 1
a and 31b are obtained, and two straight lines 32a and 32b are also obtained from the microphone pairs of the microphones 2 and 3. Also, since the sound from the sound source P reaches the microphones 1 and 2 faster than the sound reaching the microphone 3, positive angle information from the pair of the microphone 2 and the microphone 3 (indicating that the sound source is on the microphone 2 side). , And negative angle information (indicating that there is a sound source on the microphone 1 side) is obtained from the pair of the microphone 3 and the microphone 1. Moreover, as shown in FIG. 11, the measurement range of each microphone pair is limited. Therefore,
The range of the sound source can be limited by the combination of the time difference information. The sound source position in the example of FIG. 13 is limited to a range in which the angle from the x-axis of the first quadrant is 0 to 60 degrees. That is,
There is no possibility of the straight line 31b and the straight line 32b, and eventually two straight lines 31a and 32a remain.

【0069】このように、マイクペアの組み合わせと各
マイクペアにおける時間差データの符号によって音源位
置の範囲が特定される。その全部の組み合わせを以下に
示す。
As described above, the range of the sound source position is specified by the combination of the microphone pairs and the sign of the time difference data in each microphone pair. All combinations are shown below.

【0070】図14は、マイクペアの組み合わせと時間
差データの符号によって決まる音源の範囲を示す図であ
る。図中での1、2、3はそれぞれマイク1,2,3の
位置を示している。また、マイク1,2のマイクペアの
時間差データを(1,2)、マイク2,3のマイクペア
の時間差データを(2,3)、マイク3,1のマイクペ
アの時間差データを(3,1)としている。したがっ
て、マイクペアの時間差データの符号と音源の範囲との
関係は以下のようになる。なお、以下の説明における角
度は、正のx軸からの角度(反時計回り)で表す。
FIG. 14 is a diagram showing the range of the sound source determined by the combination of the microphone pair and the sign of the time difference data. In the figure, 1, 2, and 3 indicate the positions of the microphones 1, 2, and 3, respectively. Further, the time difference data of the microphone pair of the microphones 1 and 2 is (1, 2), the time difference data of the microphone pair of the microphones 2 and 3 is (2, 3), and the time difference data of the microphone pair of the microphones 3 and 1 is (3, 1). I have. Therefore, the relationship between the code of the time difference data of the microphone pair and the range of the sound source is as follows. The angle in the following description is represented by an angle (counterclockwise) from the positive x-axis.

【0071】(2,3)>0、(3,1)<0であれ
ば、音源は正のx軸からの角度が0〜60度の範囲内に
限定される。(1,2)>0、(3,1)<0であれ
ば、音源は正のx軸からの角度が60〜120度の範囲
内に限定される。
If (2,3)> 0 and (3,1) <0, the sound source is limited to an angle from the positive x-axis within the range of 0 to 60 degrees. If (1,2)> 0 and (3,1) <0, the sound source is limited to an angle from the positive x-axis within the range of 60 to 120 degrees.

【0072】(1,2)>0、(2,3)<0であれ
ば、音源は正のx軸からの角度が120〜180度の範
囲内に限定される。(2,3)<0、(3,1)>0で
あれば、音源は正のx軸からの角度が180〜240度
の範囲内に限定される。
When (1,2)> 0 and (2,3) <0, the angle of the sound source from the positive x-axis is limited to the range of 120 to 180 degrees. If (2,3) <0, (3,1)> 0, the angle of the sound source from the positive x-axis is limited to a range of 180 to 240 degrees.

【0073】(1,2)<0、(3,1)>0であれ
ば、音源は正のx軸からの角度が240〜300度の範
囲内に限定される。(1,2)<0、(2,3)>0で
あれば、音源は正のx軸からの角度が300〜360度
の範囲内に限定される。
If (1,2) <0, (3,1)> 0, the angle of the sound source from the positive x-axis is limited to the range of 240 to 300 degrees. If (1,2) <0, (2,3)> 0, the sound source is limited to an angle from the positive x-axis within a range of 300 to 360 degrees.

【0074】なお、この図に示したマイクペアの時間差
データの符号と音源の範囲との関係は、音源位置領域テ
ーブルとして音源位置計算器130内に予め保持してお
く。以上のようにして特定された2つの直線を図11の
u−v座標系から図13のようなx−y座標系に座標変
換すれば、それらの交点から音源位置P(x,y)が求
められる。図13の例では、マイク3,1のペアの場合
は点(−a/ 2,a/ 2√3)を通り、x軸と「60度
+上記の方法で求めたu−v座標系での角度」の角度を
なす直線31aを、またマイク2,3のペアの場合は点
(0,−a/2√3)を通りx軸と「上記の方法で求め
たu−v座標系での角度」の角度をなす直線32aを得
て、それら直線の交点を求めればよい。
The relationship between the code of the time difference data of the microphone pair and the range of the sound source shown in this figure is stored in the sound source position calculator 130 in advance as a sound source position area table. If the two straight lines specified as described above are coordinate-transformed from the uv coordinate system in FIG. 11 to the xy coordinate system as shown in FIG. 13, the sound source position P (x, y) can be obtained from the intersection thereof. Desired. In the example of FIG. 13, in the case of the pair of microphones 3, 1, the point passes through the point (−a / 2, a / 2√3), the x axis and “60 degrees + the uv coordinate system obtained by the above method”. , And in the case of a pair of microphones 2 and 3, through the point (0, −a / 2√3) and the x axis and the uv coordinate system obtained by the above method. It is sufficient to obtain the straight line 32a forming the angle of “the angle of” and obtain the intersection of these straight lines.

【0075】位置の計算は、時間差測定器120で得ら
れた3つの符号付き2進数情報を用いて、音源位置計算
器130で行われる。音源位置計算器130はコンピュ
ータ上に構築されている。
The calculation of the position is performed by the sound source position calculator 130 using three pieces of signed binary information obtained by the time difference measuring device 120. The sound source position calculator 130 is constructed on a computer.

【0076】図15は、音源位置測定器の内部構成を示
す図である。図に示すように、音源位置測定器130
は、CPU(Central Processing Unit )133を中心
に構成されている。
FIG. 15 is a diagram showing the internal configuration of the sound source position measuring device. As shown in FIG.
Are configured around a CPU (Central Processing Unit) 133.

【0077】3つのポート131a〜131cは、時間
差測定器120で計測されたデータを取り込みCPU1
33に供給する。ANDゲート132は、データをCP
U133に取り込むタイミングを与える。CPU133
は、各ポート131a〜131cからのデータを蓄える
ためのレジスタ133a〜133cを有している。ま
た、CPU133は、バス134を介して各種周辺機器
との間のデータ転送を行う。
The three ports 131a to 131c receive the data measured by the time difference measuring
33. The AND gate 132 outputs the data to the CP
The timing to take in is given to U133. CPU 133
Has registers 133a to 133c for storing data from the ports 131a to 131c. The CPU 133 performs data transfer with various peripheral devices via the bus 134.

【0078】バス134には、入力装置135、出力ポ
ート136、メモリ137、およびハードディスク13
8が接続されている。入力装置135は、カメラとマイ
クとの位置関係を入力するためのものである。出力ポー
ト136は、計算結果をカメラ制御装置140へ出力す
るための通信ポートである。メモリ137は、CPU1
33が実行するプログラムを一時的に保持するためのも
のである。ハードディスク138は、プログラム、角度
−時間差情報テーブル、音源位置領域テーブルおよび座
標変換テーブルを保持している。なお、音源位置計算器
130で行われる音源位置の計算処理は、ハードディス
ク138に格納されたプログラムをメモリ137にロー
ドし、そのプログラムをCPU133が実行することに
より実施される処理である。
The bus 134 includes an input device 135, an output port 136, a memory 137, and a hard disk 13
8 are connected. The input device 135 is for inputting the positional relationship between the camera and the microphone. The output port 136 is a communication port for outputting a calculation result to the camera control device 140. The memory 137 is a CPU 1
33 is for temporarily holding a program to be executed. The hard disk 138 holds a program, an angle-time difference information table, a sound source position area table, and a coordinate conversion table. The sound source position calculation process performed by the sound source position calculator 130 is a process executed by loading a program stored in the hard disk 138 into the memory 137 and executing the program by the CPU 133.

【0079】このような音源位置計算器130に入力さ
れる時間差測定器120からの3つのデータ出力105
a〜105cは、まず3つのポート131a〜131c
に伝えられ、時間差測定器120からの出力106a〜
106cがすべてHレベルになってANDゲート132
の出力がHレベルになった時点で、CPU133の中の
3つのレジスタ133a〜133cに取り込まれる。3
つのレジスタ133a〜133cに取り込まれた3つの
時間差データの内、最も時間差の少ないデータを除いた
2つの時間差データが、あらかじめメモリ上に確保され
ている変数領域t1およびt2に書き込まれる。そし
て、この2つの時間差データに基づいて、前述の音源位
置の計算が行われる。これにより、図13のx−y座標
系での音源位置が求められる。その後、カメラ位置を原
点にとったX−Y座標系へ座標変換し、X−Y座標系で
の音源位置P(X,Y)を求める。図16は、マイクの
座標系とカメラの座標系の関係を示す図である。マイク
1〜3の中心(三角形の重心)がx−y座標の原点であ
り、カメラ200(図2に示す)の回転中心が、X−Y
座標の原点である。
The three data outputs 105 from the time difference measuring device 120 input to the sound source position calculator 130
a to 105c are three ports 131a to 131c
Output from the time difference measuring device 120
106c are all at H level and AND gate 132
At the time when the output of the CPU 133 becomes H level, the data is taken into three registers 133a to 133c in the CPU 133. 3
Of the three time difference data taken into the three registers 133a to 133c, two time difference data excluding the data with the smallest time difference are written to variable areas t1 and t2 previously secured on the memory. Then, the above-described calculation of the sound source position is performed based on the two time difference data. Thereby, the sound source position in the xy coordinate system of FIG. 13 is obtained. Thereafter, coordinate conversion is performed to an XY coordinate system with the camera position as the origin, and a sound source position P (X, Y) in the XY coordinate system is obtained. FIG. 16 is a diagram illustrating the relationship between the coordinate system of the microphone and the coordinate system of the camera. The center of the microphones 1 to 3 (the center of gravity of the triangle) is the origin of the xy coordinates, and the rotation center of the camera 200 (shown in FIG. 2) is XY.
This is the origin of the coordinates.

【0080】実際には、マイク2およびマイク3を結ぶ
線と平行なx軸と回転台201の0度の方向が平行とな
るようにマイク1〜3とカメラ200とが設置される。
したがってこの際の座標変換は平行移動のみである。平
行移動量のデータは、装置を設置した時点で測定し、入
力装置135によって音源位置計算器130に入力す
る。音源位置計算器130は、このデータを用いて座標
変換を行う。座標変換は平行移動だけでなく、両方の座
標系がある角度をなしていた場合でも、この回転による
座標変換を行うだけでよい。ただし、その際にはx−y
座標系とX−Y座標系のなす角度を測定しておく必要が
ある。このようにして求められた音源位置P(X,Y)
は、2バイトの浮動小数点データとして出力ポート13
6から送り出され、カメラ制御装置140に入力され
る。
Actually, the microphones 1 to 3 and the camera 200 are installed such that the x-axis parallel to the line connecting the microphones 2 and 3 and the direction of 0 degrees of the turntable 201 are parallel.
Therefore, the coordinate conversion at this time is only translation. The data of the amount of parallel movement is measured at the time of installation of the device, and is input to the sound source position calculator 130 by the input device 135. The sound source position calculator 130 performs coordinate conversion using this data. The coordinate conversion is not limited to translation, and even when both coordinate systems form a certain angle, it is only necessary to perform coordinate conversion by this rotation. However, in that case, xy
It is necessary to measure the angle between the coordinate system and the XY coordinate system. The sound source position P (X, Y) obtained in this way
Is output port 13 as 2-byte floating point data.
6 and input to the camera control device 140.

【0081】図17は、カメラ制御装置140の内部構
成を示す図である。この図に示すように、カメラ制御装
置140は、角度計算部141、ズーム量計算部14
2、データ出力部143、キャリブレーション部14
4、ボリューム145、及びキャリブレーション設定ボ
タン146から構成される。
FIG. 17 is a diagram showing the internal configuration of the camera control device 140. As shown in this figure, the camera control device 140 includes an angle calculator 141, a zoom amount calculator 14
2, data output unit 143, calibration unit 14
4, a volume 145, and a calibration setting button 146.

【0082】角度計算部141には、音源位置データP
(X,Y)と回転台201の動作を知らせる信号204
とが入力されている。角度計算部141は、信号204
がLレベルのときに、音源位置データP(X,Y)を極
座標系のデータ(R,Θ)に変換する。Rはカメラから
音源位置までの距離、Θは音源位置PとX−Y座標系の
原点とを結んだ線がX軸となす角度である。さらに、Θ
の値はロータリーエンコーダのデータフォーマットに変
換され、データ出力部143に送られる。ここでは、角
度Θを1.4で割った値の整数値を8ビットの符号無し
2進数に変換する。この1.4という値は、360度を
8ビットのデータの最大値256で割ったものである。
角度計算部141で計算された音源までの距離Rは、ズ
ーム量計算部142とキャリブレーション部144に送
られる。キャリブレーション部144は、カメラと人物
との距離が変化すると、それに合わせてカメラのズーム
量も変化するため、基準距離と基準ズーム量の値という
2つの基準情報をズーム量計算部142に設定するため
に設けている。キャリブレーション部144にはズーム
量を手動で設定できるボリューム145およびキャリブ
レーション設定ボタン146が接続されている。キャリ
ブレーション部144は、角度計算部141が出力する
距離データを用い、その時点でのズーム量をボリューム
145によって設定する。ボリューム145を回すとカ
メラ200の電動レンズが駆動され、ズーム量が変化す
るようになっている。ボリューム145を操作してちょ
うどよいズーム量となった時点でキャリブレーション設
定ボタン146を押すと、その時点での距離データRo
とズーム量データZoが基準情報としてズーム量計算部
142に出力される。これらのデータを受け取ったズー
ム量計算部142は、それらの値をメモリに保持し、そ
れ以後のズーム量の計算に用いる。ただし、本装置のよ
うに撮影対象が人物であるような場合には撮影対象の大
きさが決まっているとみて差し支えないため、あらかじ
め上の2つの基準情報のデフォルト値を設定してあって
もよい。
The angle calculator 141 stores the sound source position data P
(X, Y) and signal 204 indicating operation of turntable 201
Is entered. The angle calculator 141 calculates the signal 204
Is at the L level, the sound source position data P (X, Y) is converted into polar coordinate system data (R, Θ). R is the distance from the camera to the sound source position, and Θ is the angle formed by the line connecting the sound source position P and the origin of the XY coordinate system with the X axis. In addition, Θ
Is converted into the data format of the rotary encoder and sent to the data output unit 143. Here, an integer value obtained by dividing the angle で by 1.4 is converted into an 8-bit unsigned binary number. The value of 1.4 is obtained by dividing 360 degrees by the maximum value 256 of 8-bit data.
The distance R to the sound source calculated by the angle calculation unit 141 is sent to the zoom amount calculation unit 142 and the calibration unit 144. The calibration unit 144 sets two pieces of reference information, that is, a reference distance and a value of the reference zoom amount, in the zoom amount calculation unit 142 because the zoom amount of the camera also changes when the distance between the camera and the person changes. It is provided for. The calibration section 144 is connected with a volume 145 for manually setting the zoom amount and a calibration setting button 146. The calibration unit 144 uses the distance data output by the angle calculation unit 141 and sets the zoom amount at that time using the volume 145. When the volume 145 is turned, the motorized lens of the camera 200 is driven, and the zoom amount is changed. By operating the volume 145 and pressing the calibration setting button 146 at a time when a proper zoom amount is obtained, the distance data Ro at that time is pressed.
And the zoom amount data Zo are output to the zoom amount calculating unit 142 as reference information. Upon receiving these data, the zoom amount calculation unit 142 stores the values in a memory and uses them in subsequent calculations of the zoom amount. However, in the case where the photographing target is a person as in the present apparatus, the size of the photographing target can be considered to be fixed, so even if the default values of the above two reference information are set in advance. Good.

【0083】さて、角度計算部141で計算された音源
までの距離Rはズーム量計算部142に送られ、ズーム
量が計算される。ズーム量の計算は、距離Rを基準距離
Roで割り、その値に基準ズーム量Zoを乗じることに
よって行う。計算された角度データとズーム量は、デー
タ出力部143を経てそれぞれ回転台201および電動
レンズ202に送られ、カメラ撮影装置が駆動される。
このとき、回転台201の動作が終了しない間に次の撮
影位置情報が出力されないよう、回転台201の動作を
知らせる信号204が回転台201からカメラ制御装置
140に送り出される。この信号はHレベルならば回転
台201が動作中であることを示し、その間はカメラ制
御装置140における計算は行われない。具体的には、
この信号は角度計算部141に送られ、この信号がHレ
ベルの間は音源位置計算器130から送られてくるデー
タを内部に取り込まない。
The distance R to the sound source calculated by the angle calculator 141 is sent to the zoom calculator 142, and the zoom is calculated. The calculation of the zoom amount is performed by dividing the distance R by the reference distance Ro and multiplying the value by the reference zoom amount Zo. The calculated angle data and zoom amount are sent to the turntable 201 and the motorized lens 202 via the data output unit 143, respectively, and the camera photographing device is driven.
At this time, a signal 204 indicating the operation of the turntable 201 is sent from the turntable 201 to the camera control device 140 so that the next imaging position information is not output before the operation of the turntable 201 ends. If this signal is at the H level, it indicates that the turntable 201 is in operation, and during that time, the calculation by the camera control device 140 is not performed. In particular,
This signal is sent to the angle calculator 141, and while this signal is at the H level, the data sent from the sound source position calculator 130 is not taken in.

【0084】このようにしてカメラ撮影が行われた会議
は、映像出力103および音声出力102を通して記録
したり遠隔地に電送することができる。この際、各会議
場においては参加者全員のためにマイクを用意する必要
がないとともに、3本のマイクとカメラとが同じ場所に
ある必要もない。したがって、マイクは全員の会話を捉
えやすい位置に配置し、カメラは全員の表情を捉えやす
い位置に配置できる。
The conference in which the camera shooting is performed can be recorded through the video output 103 and the audio output 102 or transmitted to a remote place. At this time, it is not necessary to prepare microphones for all the participants in each conference hall, and it is not necessary that the three microphones and the camera are in the same place. Therefore, the microphone can be placed at a position where it is easy to catch the conversation of all, and the camera can be placed at a position where it is easy to catch the expression of all.

【0085】なお、上記の説明では、2本のマイクが捉
えた音の到達時間差と音源方向との関係が、音源までの
距離に依存しないことを利用して音源位置の計算を行っ
ているが、3つのマイクが捉えた音の時間差から幾何学
的に音源位置を計算することもできる。以下にその計算
方法について説明する。
In the above description, the sound source position is calculated by utilizing the fact that the relationship between the arrival time difference between the sounds captured by the two microphones and the sound source direction does not depend on the distance to the sound source. Third, the sound source position can be calculated geometrically from the time difference between the sounds captured by the three microphones. Hereinafter, the calculation method will be described.

【0086】まず、簡単のために、x−y座標系の
(0,a)、(0,0)、(a,0)の3個所に3本の
マイク1〜3が設置されているものとする。音源P
(x,y)から発せられた音がそれぞれのマイク1〜3
に達した時間を、それぞれt1、t2、t3とする。音源Pと
各マイクとの距離をそれぞれl1,l2,l3とすると、
First, for simplicity, three microphones 1 to 3 are installed at three locations (0, a), (0, 0), and (a, 0) in an xy coordinate system. And Sound source P
The sounds emitted from (x, y) are the respective microphones 1 to 3
Are reached as t1, t2, and t3, respectively. Assuming that the distance between the sound source P and each microphone is l1, l2, l3,

【0087】[0087]

【数2】 である。各マイク間の時間差すなわちt1−t2をdt1 、t2
−t3をdt2 、t3−t1をdt3 とし、音速の値をvsとする
と、各マイク間の音の到達時間差は音源から各マイクま
での距離によって次のように与えられる。
(Equation 2) It is. The time difference between each microphone, i.e., t1-t2 is dt1, t2
Assuming that −t3 is dt2, t3−t1 is dt3, and the value of the sound speed is vs, the arrival time difference of the sound between the microphones is given as follows according to the distance from the sound source to each microphone.

【0088】[0088]

【数3】 これらの、式(2)、式(3)から(Equation 3) From these equations (2) and (3),

【0089】[0089]

【数4】 dt1 ・vs = x2 +( a−y)2 1/2 −( x2 +y2)1/2 dt2 ・vs =( x2 +y2)1/2 − (a−x)2+y2 1/2 dt3 ・vs = (a−x)2+y2 1/2 − x2 +( a−y)2 1/2 ・・・(4) となり、この連立方程式を解けば音源位置P(x,y)
を求めることができる。このような音源位置の求め方
は、三角測量の原理と同様のものであって、広く知られ
ている。この計算方法を用いるか、あるいは前述の第1
の実施の形態で用いた方法で計算するのかは、音源位置
計算器の性能や、要求される音の時間差計測の分解能に
よって判断する。例えば、高い分解能が要求される場合
には、簡単な計算で高速に演算できる第1の実施の形態
で説明した方法を用い、分解能が低くてよい場合には、
角度−時間差情報テーブルなどの事前の準備が省ける幾
何学的な音源位置計算方法を用いることができる。
[Number 4] dt1 · vs = x 2 + ( a-y) 2 1/2 - (x 2 + y 2) 1/2 dt2 · vs = (x 2 + y 2) 1/2 - (a-x) 2 + Y 2 1/2 dt3 · vs = (a−x) 2 + y 2 1/2 −x 2 + (a−y) 2 1/2 ... (4) (X, y)
Can be requested. Such a method of obtaining the sound source position is similar to the principle of triangulation and is widely known. This calculation method is used, or the first
Whether the calculation is performed by the method used in the embodiment is determined based on the performance of the sound source position calculator and the required resolution of the time difference measurement of the sound. For example, when a high resolution is required, the method described in the first embodiment, which can be operated at high speed with a simple calculation, is used.
It is possible to use a geometrical sound source position calculation method such as an angle-time difference information table, which does not require advance preparation.

【0090】また、上記の第1の実施の形態では、マイ
クの床からの高さとカメラの床からの高さが同じ高さで
あるようなシステムであったが、カメラの位置を高くす
ることも可能である。この場合、マイクの床からの高さ
からカメラの床からの高さを引いた値をZ軸方向へのオ
フセット量dとして、カメラ制御装置内の計算において
鉛直方向のカメラの向きを計算すればよい。ただし、上
の座標系においては、鉛直下向きをZ軸の正の方向とし
ている。すなわち、音源位置計算器130で求めてカメ
ラ位置のオフセットを加えた音源位置P(X,Y)をP
(X,Y,d)とし、床と垂直な方向の角度Φを
Further, in the first embodiment, the system is such that the height of the microphone from the floor is the same as the height of the camera from the floor. Is also possible. In this case, a value obtained by subtracting the height of the camera from the floor from the height of the microphone from the floor is set as an offset amount d in the Z-axis direction, and the vertical camera direction is calculated in the calculation in the camera control device. Good. However, in the upper coordinate system, the vertically downward direction is the positive direction of the Z axis. That is, the sound source position P (X, Y) obtained by adding the camera position offset obtained by the sound source position calculator 130 is represented by P
(X, Y, d), and the angle Φ in the direction perpendicular to the floor is

【0091】[0091]

【数5】 によって求めればよい。Z軸方向にも回転可能な回転機
構を実施例1の回転台に付加すれば、Z軸方向にオフセ
ットがあった場合でも正しく話者を捉えることが可能と
なる。この回転機構は、第1の実施の形態と全く同様の
構成で実現することができる。
(Equation 5) Can be obtained by If a rotation mechanism that can rotate in the Z-axis direction is added to the turntable of the first embodiment, it is possible to correctly catch a speaker even when there is an offset in the Z-axis direction. This rotation mechanism can be realized with the same configuration as that of the first embodiment.

【0092】さらに、第1の実施の形態においては2次
元平面内での音源位置計算を行っていたが、マイクを正
三角錐の4つの頂点に配置することによって、3次元空
間内の音源位置を知ることが可能である。正三角錐では
4つの正三角形があり、それぞれの三角形で実施例1の
ような計算を行って各三角形の平面上での音源方向を示
す三角形面に垂直な面を割り出すことができる。各正三
角形ごとに音源方向を示す平面を見出せば、あとは各平
面の交点を求めることで3次元空間内の音源位置を知る
ことができる。
Further, in the first embodiment, the position of the sound source in the three-dimensional space is calculated by arranging the microphones at the four vertices of the regular triangular pyramid. It is possible to know. There are four equilateral triangles in the equilateral triangular pyramid, and a calculation perpendicular to the triangular surface indicating the sound source direction on the plane of each triangle can be calculated by performing the calculation as in the first embodiment for each triangle. If a plane indicating the sound source direction is found for each equilateral triangle, the position of the sound source in the three-dimensional space can be known by finding the intersection of each plane.

【0093】ところで、上記の第1の実施の形態では算
出された音源位置情報をカメラの制御に利用する場合の
みを説明したが、音源位置情報を映像信号のインデック
ス情報として利用することもできる。そのようなインデ
ックス機能を有する音源位置記録装置を第2の実施の形
態として以下に説明する。
In the first embodiment, only the case where the calculated sound source position information is used for controlling the camera has been described. However, the sound source position information can be used as index information of a video signal. A sound source position recording device having such an index function will be described below as a second embodiment.

【0094】図18は、音源位置記録装置の内部構成図
である。この音源位置記録装置は、3本のマイク1〜
3、音信号検出器110、時間差測定器120、音源位
置計算器130及び基準信号発生器101の構成は、図
3に示した第1の実施の形態の構成と同じであるため、
同一の番号を付して説明を省略する。また、この図には
示していないが、音源位置計算器130には図3に示し
たものと同様のカメラ制御装置140が接続されてお
り、そのカメラ制御装置140はカメラ本体203が設
置された回転台201と電動レンズ202とを制御して
いる。
FIG. 18 is an internal configuration diagram of the sound source position recording device. This sound source position recording device has three microphones 1 to
3. The configurations of the sound signal detector 110, the time difference measuring device 120, the sound source position calculator 130, and the reference signal generator 101 are the same as those of the first embodiment shown in FIG.
The same numbers are assigned and the description is omitted. Although not shown in this figure, a camera control device 140 similar to that shown in FIG. 3 is connected to the sound source position calculator 130, and the camera control device 140 is provided with a camera body 203. The turntable 201 and the electric lens 202 are controlled.

【0095】この実施の形態では、音源位置計算器13
0の出力は、カメラ制御装置140とともにコンピュー
タ151にも入力されている。コンピュータ151に
は、入力装置152、表示装置153、記憶装置154
及び制御装置155が接続されていている。制御装置1
55には、さらに記録再生装置156が接続されてい
る。
In this embodiment, the sound source position calculator 13
The output of 0 is also input to the computer 151 together with the camera control device 140. The computer 151 includes an input device 152, a display device 153, and a storage device 154.
And the control device 155 are connected. Control device 1
A recording / reproducing device 156 is further connected to 55.

【0096】コンピュータ151は、音源位置テーブル
と時刻テーブルとを有しており、音源位置計算器130
が出力した音源位置情報を音源位置テーブルに、またそ
の情報を受け取った時刻を時刻テーブルに登録する。な
お、コンピュータ151が実行する処理内容、及び音源
位置テーブルと時刻テーブルとの詳細は後述する。
The computer 151 has a sound source position table and a time table.
Is registered in the sound source position table, and the time at which the information was received is registered in the time table. The details of the processing executed by the computer 151 and the details of the sound source position table and the time table will be described later.

【0097】入力装置152は、音源位置計算終了の合
図やコメントデータなどの入力を行うためのものであ
る。表示装置153は、音源位置データ、時刻データお
よびコメントデータを表示するためのものである。記憶
装置154は、音源位置データと時刻データおよびコメ
ントデータを記憶するためのものであり、ハードディス
ク装置等を使用する。
The input device 152 is used to input a signal indicating completion of sound source position calculation, comment data, and the like. The display device 153 is for displaying sound source position data, time data, and comment data. The storage device 154 stores sound source position data, time data, and comment data, and uses a hard disk device or the like.

【0098】制御装置155は、記録再生装置156を
制御するためものもである。記録再生装置156には音
源位置記録と同時に、第1の実施の形態によって記録さ
れた映像記録が収められる。この第2の実施の形態で
は、ハードディスク上にディジタル記録された映像記録
を用いている。ハードディスクは通常のテープ記録と異
なり、ランダムアクセスが素早く行えるため、映像の検
索作業を短時間に済ませることができる。利用者は、す
でに記憶装置154に保存されている音源位置データと
時刻データおよびコメントデータを表示装置153上に
表示し、ここで再生の指示を作成する。例えば、司会者
の発言部分だけを通して再生すれば、会議の議題リスト
を作成するといった作業が効率よく行える。制御装置1
55は、コンピュータが作成した再生時刻リストを元に
再生装置の早送りや再生の指示を行う。再生が開始され
ると、入力装置から早送りの指示があるまで再生を続け
る。
The control device 155 is also for controlling the recording / reproducing device 156. The recording / reproducing device 156 stores the video recording recorded according to the first embodiment simultaneously with the recording of the sound source position. In the second embodiment, video recording digitally recorded on a hard disk is used. Unlike a normal tape recording, a hard disk can perform random access quickly, so that a video search operation can be completed in a short time. The user displays the sound source position data, the time data, and the comment data already stored in the storage device 154 on the display device 153, and creates a reproduction instruction here. For example, by playing back only through the moderator's remarks, a task such as creating a meeting agenda list can be efficiently performed. Control device 1
Reference numeral 55 designates fast-forward or playback of the playback device based on the playback time list created by the computer. When the reproduction is started, the reproduction is continued until a fast-forward instruction is given from the input device.

【0099】図19は、音源位置テーブルの例を示す図
である。音源位置テーブル41は2列36行のマトリッ
クスであり、第1列目および第2列目にはそれぞれx座
標値及びy座標値が格納される。このマトリックスには
初期値として「nul」が入力されている。なお、36
行という行数は、角度分解能が5度程度であることと、
会場における参加者の数として高々この程度を想定して
いることによる。
FIG. 19 is a diagram showing an example of the sound source position table. The sound source position table 41 is a matrix of 2 columns and 36 rows, and an x coordinate value and ay coordinate value are stored in a first column and a second column, respectively. "Null" is input to this matrix as an initial value. Note that 36
The number of rows is that the angular resolution is about 5 degrees,
This is because the number of participants at the venue is assumed to be at most this level.

【0100】そして、マトリックスに格納されていない
新しい音源位置データが音源位置計算器130から送ら
れてくると、その座標値を次の行に追加して格納してい
く。このとき、すでに登録済みのデータと比較して角度
誤差が5度以内で、かつ距離の誤差がx方向、y方向と
もに±25cm以内であれば同じ位置とみなし、追加処
理は行わない。その理由は、話者は着座姿勢を保ってい
るとしても常に固定しているわけではなく、椅子を動か
したり頭をゆすったりすることが考えられるためであ
る。
When new sound source position data not stored in the matrix is sent from the sound source position calculator 130, the coordinate values are added to the next row and stored. At this time, if the angle error is within 5 degrees compared with the already registered data and the distance error is within ± 25 cm in both the x and y directions, it is regarded as the same position and no additional processing is performed. The reason for this is that the speaker does not always keep a fixed posture even if he or she keeps the sitting posture, and may move the chair or shake his head.

【0101】図20は、時刻テーブルの例を示す図であ
る。時刻テーブル42は初期状態で36列1024行の
マトリックスであり、各行のインデックスが音源位置テ
ーブル41の各行のインデックスに対応している。この
マトリックスは、第1列以外には初期値として「nu
l」が入力されているが、第1列目には初期値として1
が格納されている。この第1列目はポインタ情報を格納
するために利用する。すなわち、この例では音源P1の
時刻データがすでに3つ記録されているので、P1のポ
インタを与える第1行目には4が設定される。この情報
により、音源P1からの次の時刻データがあった場合、
このポインタを参照することによってどのアドレスにそ
の時刻データを記入すればよいかをたやすく知ることが
できる。時刻データの記入が終わると、ポインタの値は
インクリメントされる。
FIG. 20 is a diagram showing an example of the time table. The time table 42 is a matrix of 36 columns and 1024 rows in an initial state, and the index of each row corresponds to the index of each row of the sound source position table 41. This matrix has "nu" as an initial value except for the first column.
l ”has been entered, but the first column has an initial value of 1
Is stored. This first column is used to store pointer information. That is, in this example, since three pieces of time data of the sound source P1 have already been recorded, 4 is set in the first line giving the pointer of P1. With this information, if there is next time data from the sound source P1,
By referring to this pointer, it is easy to know at which address the time data should be written. When the entry of the time data is completed, the value of the pointer is incremented.

【0102】時刻の表現形式は、ここでは計測開始時か
らの経過時間を0.1秒単位で計り、その値を2バイト
の符号無し2進数によって表現している。したがって、
1.3秒後の場合の時刻表現は「13」となる。もちろ
ん、計測開始時からの経過時間が分かればよいので、別
の表現をとっても構わない。この時、受け取った音源位
置がすでに音源位置テーブル41に登録されているもの
であれば、その音源位置を示す行インデックスを求め、
時刻テーブル42の対応する列インデックスのすでに記
録されている時刻情報の後に新しい時刻情報が追加され
る。受け取った音源位置が音源位置テーブル41に未登
録であれば、この音源位置を新たに音源位置テーブル4
1に時刻とともに登録する。
In the expression format of time, the elapsed time from the start of measurement is measured in units of 0.1 second, and the value is expressed by a 2-byte unsigned binary number. Therefore,
The time expression after 1.3 seconds is “13”. Of course, another expression may be used as long as the elapsed time from the start of the measurement is known. At this time, if the received sound source position is already registered in the sound source position table 41, a row index indicating the sound source position is obtained,
New time information is added after the already recorded time information of the corresponding column index of the time table 42. If the received sound source position is not registered in the sound source position table 41, this sound source position is newly added to the sound source position table 4.
1 is registered with the time.

【0103】音源位置テーブル41は2×36の大きさ
の2次元マトリックスであり、コンピュータのメモリ上
に確保される。また時刻テーブル42は記録開始時は3
6×1024の大きさの2次元マトリックスがコンピュ
ータのメモリ上に確保され、同一位置の時刻情報が満杯
になると自動的にメモリアロケーション機能によって新
たに1024行が追加される。
The sound source position table 41 is a two-dimensional matrix having a size of 2 × 36, and is secured on the memory of the computer. Also, the time table 42 is 3 at the start of recording.
A two-dimensional matrix of 6.times.1024 is secured in the memory of the computer, and when the time information at the same position becomes full, 1024 new rows are automatically added by the memory allocation function.

【0104】図21は、音源位置記録の処理手順を示す
フローチャートである。これはコンピュータ151によ
って行われる処理である。以下、処理手順をステップ番
号に沿って説明する。 〔S1〕音源位置テーブルT1 と時刻テーブルT2 との
領域をメモリ上に確保する。 〔S2〕位置格納変数Pと時刻格納変数xを確保する。 〔S3〕音源位置テーブルT1 と時刻テーブルT2 とを
初期化する。 〔S4〕時刻tのカウントを開始する 〔S5〕音源位置計算器からの出力があるか否かを判断
する。出力があればステップS6に進み、出力がなけれ
ばこの処理を繰り返す。 〔S6〕現在の時刻tを時刻格納変数xに入力する。 〔S7〕音源位置(x、y)を位置格納変数Pに入力す
る。 〔S8〕位置格納変数Pが既に音源位置テーブルT1
登録されているが否かを判断する。登録済みであればス
テップS10に進み、未登録であればステップS9に進
む。 〔S9〕音源位置テーブルT1 に位置格納変数Pの値を
新たに格納し、ステップS10に進む。 〔S10〕音源位置テーブルT1 での位置格納変数Pの
行インデックスkを求める。 〔S11〕時刻テーブルT2 の列kの第1行目に格納さ
れているポインタ値aを求め、時刻テーブルT2 のa行
k列にxの値を格納する。 〔S12〕時刻テーブルT2 の列kの第1行目に格納さ
れているポインタ値aをインクリメントする。 〔S13〕音源位置の計算が終了かいなかを判断する。
終了であればステップS14に進み、終了でなければス
テップ5に進む。 〔S14〕記憶装置上に音源位置テーブルT1 および時
刻テーブルT2 のデータを保存する。 〔S15〕必要に応じてコメントを付加し、処理を終了
する。
FIG. 21 is a flowchart showing the procedure for recording the sound source position. This is a process performed by the computer 151. Hereinafter, the processing procedure will be described along the step numbers. [S1] the region of the sound source position table T 1 and the time table T 2 to secure the memory. [S2] A position storage variable P and a time storage variable x are secured. [S3] the sound source position table T 1 and the time table T 2 is initialized. [S4] Start counting at time t [S5] It is determined whether there is an output from the sound source position calculator. If there is an output, the process proceeds to step S6, and if there is no output, this process is repeated. [S6] The current time t is input to the time storage variable x. [S7] The sound source position (x, y) is input to the position storage variable P. [S8] the position storage variable P is already registered in the sound source position table T 1 to determine. If registered, the process proceeds to step S10, and if not registered, the process proceeds to step S9. [S9] storing new values of the position storage variable P to the sound source position table T 1, the process proceeds to step S10. [S10] Request row index k position storage variable P at the sound source position table T 1. [S11] time seek pointer value a stored in the first row of column k of the table T 2, stores the value of the time table T 2 of the a row k columns x. [S12] increments the pointer value a which is the time stored in the first row of column k of the table T 2. [S13] It is determined whether the calculation of the sound source position is completed.
If it is completed, the process proceeds to step S14. If not, the process proceeds to step 5. [S14] to store the data of the sound source position table T 1 and the time table T 2 on the storage device. [S15] A comment is added if necessary, and the process ends.

【0105】このようにして、音源位置と発話時刻の情
報を映像のインデックスとして利用することができる。
In this way, the information on the sound source position and the utterance time can be used as the index of the video.

【0106】[0106]

【発明の効果】以上説明したように本発明の音源位置計
測装置では、3本のマイクを所定の三角形の頂点に配置
し、同一音源からの音が3本のマイクに到達する時間差
を測定するようにしたため、各マイクの位置とマイクペ
アごとの音の到達時間差とから、音源の方向のみならず
音源位置を算出することができる。
As described above, in the sound source position measuring apparatus of the present invention, three microphones are arranged at the vertices of a predetermined triangle, and the time difference between the sounds from the same sound source reaching the three microphones is measured. Thus, not only the direction of the sound source but also the sound source position can be calculated from the position of each microphone and the arrival time difference of the sound for each microphone pair.

【0107】また、本発明のカメラ撮影制御装置では、
各マイクの位置、マイクペアごとの音の到達時間差及び
カメラの位置から、カメラに対する音源の相対的な位置
を計算するようにしたため、カメラとマイクとが離れた
位置にあっても、カメラが音源の方向を向くように制御
することができる。
In the camera photographing control device of the present invention,
Since the relative position of the sound source with respect to the camera is calculated from the position of each microphone, the arrival time difference of sound for each microphone pair, and the position of the camera, even if the camera and microphone are far apart, the camera can It can be controlled to face the direction.

【0108】また、本発明の音源位置記録装置では、同
一音源からの音が3本のマイクに到達する時間差を測定
することにより得られた音源の位置情報を、その音を捉
えた時刻とともに格納するようにしたため、話者の発話
時刻の情報の取得が容易となる。
In the sound source position recording device of the present invention, the position information of the sound source obtained by measuring the time difference between the sound from the same sound source reaching the three microphones is stored together with the time at which the sound was captured. Therefore, it is easy to obtain information on the utterance time of the speaker.

【0109】また、本発明の音源位置計測方法では、3
本のマイクを所定の三角形の頂点に配置し、同一音源か
らの音が3本のマイクに到達する時間差を測定するよう
にしたため、各マイクの位置とマイクペアごとの音の到
達時間差とから、音源の方向のみならず音源位置を算出
することができる。
Further, according to the sound source position measuring method of the present invention, 3
The microphones were placed at the vertices of a predetermined triangle, and the time difference between the sound from the same sound source reaching the three microphones was measured. In addition to the direction, the sound source position can be calculated.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のカメラ撮影制御装置の原理構成図であ
る。
FIG. 1 is a principle configuration diagram of a camera photographing control device of the present invention.

【図2】第1の実施の形態に係るカメラ撮影制御装置の
配置図である。
FIG. 2 is a layout diagram of the camera photographing control device according to the first embodiment.

【図3】第1の実施の形態に係るカメラ撮影制御装置の
内部構成図である。
FIG. 3 is an internal configuration diagram of the camera photographing control device according to the first embodiment.

【図4】音信号検出装置の内部構成を示す図である。FIG. 4 is a diagram showing an internal configuration of a sound signal detection device.

【図5】音信号検出器における信号の変化を示す図であ
る。(A)はマイクから入力された信号の波形を示す図
であり、(B)はアンプで増幅後の信号の波形を示す図
であり、(C)は、パワー信号の波形を示す図であり、
(D)は、レベル判定後の信号の波形を示す図であり、
(E)は、微分器から出力される信号の波形を示す図で
ある。
FIG. 5 is a diagram illustrating a change in a signal in a sound signal detector. (A) is a diagram showing a waveform of a signal input from a microphone, (B) is a diagram showing a waveform of a signal amplified by an amplifier, and (C) is a diagram showing a waveform of a power signal. ,
(D) is a diagram showing the waveform of the signal after the level determination,
(E) is a diagram showing a waveform of a signal output from the differentiator.

【図6】時間差測定器の内部構成を示す図である。FIG. 6 is a diagram showing an internal configuration of a time difference measuring device.

【図7】トリガ信号から得られる方形波を示す図であ
る。(A)はトリガ信号を表しており、(B)は方形波
を表している。
FIG. 7 is a diagram illustrating a square wave obtained from a trigger signal. (A) represents a trigger signal, and (B) represents a square wave.

【図8】遅延器の内部構成を示す図である。FIG. 8 is a diagram showing an internal configuration of a delay unit.

【図9】音源方向の計算のためのマイクの座標系を示す
図である。
FIG. 9 is a diagram showing a coordinate system of a microphone for calculating a sound source direction.

【図10】マイク間の時間差と音源方向との関係式を示
すグラフである。
FIG. 10 is a graph showing a relational expression between a time difference between microphones and a sound source direction.

【図11】1組のマイクペアの計測範囲を示す図であ
る。
FIG. 11 is a diagram showing a measurement range of one microphone pair.

【図12】角度−時間差情報テーブルを示す図である。FIG. 12 is a diagram showing an angle-time difference information table.

【図13】2つの時間差情報から音源位置を求めるため
の方法を説明する図である。
FIG. 13 is a diagram illustrating a method for obtaining a sound source position from two pieces of time difference information.

【図14】マイクペアの組み合わせと時間差データの符
号によって決まる音源の範囲を示す図である。
FIG. 14 is a diagram illustrating a range of a sound source determined by a combination of a microphone pair and a sign of time difference data.

【図15】音源位置測定器の内部構成を示す図である。FIG. 15 is a diagram showing an internal configuration of a sound source position measuring device.

【図16】マイクの座標系とカメラの座標系の関係を示
す図である。
FIG. 16 is a diagram showing a relationship between a coordinate system of a microphone and a coordinate system of a camera.

【図17】カメラ制御装置の内部構成を示す図である。FIG. 17 is a diagram showing an internal configuration of a camera control device.

【図18】音源位置記録装置の内部構成図である。FIG. 18 is an internal configuration diagram of a sound source position recording device.

【図19】音源位置テーブルの例を示す図である。FIG. 19 is a diagram illustrating an example of a sound source position table.

【図20】時刻テーブルの例を示す図である。FIG. 20 is a diagram illustrating an example of a time table.

【図21】音源位置記録の処理手順を示すフローチャー
トである。
FIG. 21 is a flowchart showing a processing procedure of sound source position recording.

【符号の説明】[Explanation of symbols]

1〜3 マイク 4 音信号検出手段 5 時間差測定手段 6 音源位置計算手段 7 カメラ制御手段 8 カメラ駆動手段 9 カメラ本体 10 電動レンズ 11 発話情報記録手段 12 映像・音声記録再生手段 13 再生指示手段 1-3 microphone 4 sound signal detecting means 5 time difference measuring means 6 sound source position calculating means 7 camera controlling means 8 camera driving means 9 camera body 10 motorized lens 11 utterance information recording means 12 video / audio recording / reproducing means 13 reproduction instructing means

フロントページの続き (51)Int.Cl.6 識別記号 FI G03B 15/00 G02B 7/11 F H04N 7/15 G03B 3/00 A Continued on the front page (51) Int.Cl. 6 Identification symbol FI G03B 15/00 G02B 7/11 F H04N 7/15 G03B 3/00 A

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 音情報によって音源位置を計算する音源
位置計測装置において、 所定の形状の三角形の3つの頂点に設置されたマイク
と、 1つの音源の発した音が前記マイクのそれぞれで捉えら
れた時刻を音検出時刻として検出する音信号検出手段
と、 前記マイクごとの音検出時刻に基づいて、前記マイクの
2個ずつを組合わせることにより得られる3組のマイク
ペアごとの音の到達時間差を測定する時間差測定手段
と、 それぞれの前記マイクの位置とマイクペアごとの音の到
達時間差とから、音源位置を計算する音源位置計算手段
と、 を有することを特徴とする音源位置計測装置。
1. A sound source position measuring apparatus for calculating a sound source position based on sound information, wherein microphones installed at three vertices of a triangle having a predetermined shape, and sound emitted from one sound source is captured by each of the microphones. Signal detection means for detecting the detected time as a sound detection time; and, based on the sound detection time for each microphone, the arrival time difference between sounds for each of three microphone pairs obtained by combining two microphones each. A sound source position measuring device comprising: a time difference measuring means for measuring; and a sound source position calculating means for calculating a sound source position from a position of each of the microphones and a difference in arrival time of sound for each microphone pair.
【請求項2】 前記音源位置計算手段は、音の到達時間
差と音源の方向との対応関係が予め定義されており、定
義された対応関係とマイクペアごとに測定された到達時
間差とから各マイクペアの中間点と音源とを結ぶ直線を
求め、マイクペアごとに求められた直線の交点を求める
ことにより音源位置を算出することを特徴とする請求項
1記載の音源位置計測装置。
2. The sound source position calculating means, wherein the correspondence between the sound arrival time difference and the direction of the sound source is defined in advance, and each microphone pair is determined from the defined correspondence and the arrival time difference measured for each microphone pair. 2. The sound source position measuring device according to claim 1, wherein a sound source position is calculated by obtaining a straight line connecting the intermediate point and the sound source, and obtaining an intersection of the straight line obtained for each microphone pair.
【請求項3】 前記音源位置計算手段は、音の到達時間
差と音源の方向との対応関係をテーブル形式で保持して
いることを特徴とする請求項2記載の音源位置計測装
置。
3. The sound source position measuring device according to claim 2, wherein said sound source position calculating means holds a correspondence relationship between a sound arrival time difference and a sound source direction in a table format.
【請求項4】 前記マイクは、正三角形の頂点に配置さ
れており、 前記音源位置計算手段は、各マイクペアを結ぶ線から±
60度の範囲を各マイクペアの音源計測範囲とし、各マ
イクペアが捉えた音の時間差の符号によって音源の存在
可能範囲を限定することを特徴とする請求項1記載の音
源位置計測装置。
4. The microphone is disposed at a vertex of an equilateral triangle, and the sound source position calculation means includes a microphone connected to a line connecting each microphone pair.
2. The sound source position measuring device according to claim 1, wherein a range of 60 degrees is defined as a sound source measurement range of each microphone pair, and a possible range of a sound source is limited by a sign of a time difference between sounds captured by each microphone pair.
【請求項5】 前記音源位置計算手段は、三角測量の原
理に基づいて音源位置を計算することを特徴とする請求
項1記載の音源位置計測装置。
5. The sound source position measuring device according to claim 1, wherein said sound source position calculating means calculates a sound source position based on a principle of triangulation.
【請求項6】 前記マイクは、三角錐の4つの頂点に配
置されることにより、複数の三角形を形成しており、 前記時間差測定手段は、前記マイクごとの音検出時刻に
基づいて、形成された三角形毎に得られる3組ずつのマ
イクペアごとの音の到達時間差を測定し、 前記音源位置計算手段は、それぞれの前記マイクの位置
とマイクペアごとの音の到達時間差とから、3次元空間
内の音源位置を計算する、 ことを特徴とする請求項1記載の音源位置計測装置。
6. The microphone is arranged at four vertices of a triangular pyramid to form a plurality of triangles, and the time difference measuring means is formed based on a sound detection time for each of the microphones. The sound source position calculating means measures the arrival time difference of sound for each of three microphone pairs obtained for each triangle, and calculates the sound arrival position difference in the three-dimensional space from the position of each microphone and the arrival time difference of sound for each microphone pair. The sound source position measuring device according to claim 1, wherein the sound source position is calculated.
【請求項7】 回転台の上に設置されたカメラの向きを
制御しながら撮影を行うカメラ撮影装置において、 所定の形状の三角形の3つの頂点に設置されたマイク
と、 1つの音源の発した音が前記マイクのそれぞれで捉えら
れた時刻を音検出時刻として検出する音信号検出手段
と、 前記マイクごとの音検出時刻に基づいて、前記マイクの
2個ずつを組合わせることにより得られる3組のマイク
ペアごとの音の到達時間差を測定する時間差測定手段
と、 それぞれの前記マイクの位置、マイクペアごとの音の到
達時間差及び前記カメラの位置の情報に基づき、前記カ
メラに対する音源の相対的な位置情報を計算する音源位
置計算手段と、 前記音源位置計算手段が算出した音源の位置情報に基づ
き、音源の方向へカメラの向きを制御するカメラ制御手
段と、 を有することを特徴とするカメラ撮影制御装置。
7. A camera photographing apparatus for photographing while controlling the direction of a camera installed on a turntable, comprising: microphones installed at three vertices of a triangle having a predetermined shape; Sound signal detection means for detecting a time at which sound is captured by each of the microphones as a sound detection time; three sets obtained by combining two of the microphones based on the sound detection time for each of the microphones Time difference measuring means for measuring a sound arrival time difference for each microphone pair, based on information on the position of each microphone, sound arrival time difference for each microphone pair, and the position of the camera, relative position information of the sound source with respect to the camera Sound source position calculating means for calculating the position of the sound source based on the position information of the sound source calculated by the sound source position calculating means. The camera imaging control apparatus characterized by comprising: a stage, a.
【請求項8】 前記カメラ制御手段は、前記音源位置計
算手段が算出した音源の位置情報に基づき、ズーム量の
制御をも行うことを特徴とする請求項7記載のカメラ撮
影制御装置。
8. The camera photographing control device according to claim 7, wherein said camera control means also controls a zoom amount based on the sound source position information calculated by said sound source position calculation means.
【請求項9】 前記音源位置計算手段は、音の到達時間
差と音源の方向との対応関係が予め定義されており、定
義された対応関係とマイクペアごとに測定された到達時
間差とから各マイクペアの中間点と音源とを結ぶ直線を
求め、マイクペア毎に求められた直線の交点を求めるこ
とにより音源位置を算出することを特徴とする請求項7
記載のカメラ撮影制御装置。
9. The sound source position calculating means, wherein the correspondence between the sound arrival time difference and the direction of the sound source is defined in advance, and based on the defined correspondence and the arrival time difference measured for each microphone pair, 8. The sound source position is calculated by obtaining a straight line connecting the intermediate point and the sound source, and obtaining an intersection of the straight line obtained for each microphone pair.
A camera photographing control device as described in the above.
【請求項10】 前記音源位置計算手段は、音の到達時
間差と音源の方向との対応関係をテーブル形式で保持し
ていることを特徴とする請求項7記載のカメラ撮影制御
装置。
10. The camera photographing control apparatus according to claim 7, wherein said sound source position calculating means holds a correspondence between a sound arrival time difference and a sound source direction in a table format.
【請求項11】 前記マイクは、正三角形の頂点に配置
されており、 前記音源位置計算手段は、各マイクペアを結ぶ線から±
60度の範囲を各マイクペアの音源計測範囲とし、各マ
イクペアが捉えた音の時間差の符号によって音源の存在
可能範囲を限定することを特徴とする請求項7記載のカ
メラ撮影制御装置。
11. The microphone is disposed at an apex of an equilateral triangle, and the sound source position calculating means includes a microphone connected to a line connecting each microphone pair.
8. The camera photographing control device according to claim 7, wherein a range of 60 degrees is defined as a sound source measurement range of each microphone pair, and a possible range of a sound source is limited by a sign of a time difference between sounds captured by each microphone pair.
【請求項12】 前記音源位置計算手段は、前記カメラ
から前記3本のマイクが置かれた平面までの高さの情報
に基づき、前記カメラに対する音源の相対的な位置情報
を3次元的に計算することを特徴とする請求項7記載の
カメラ撮影制御装置。
12. The sound source position calculating means three-dimensionally calculates relative position information of a sound source with respect to the camera based on information on a height from the camera to a plane on which the three microphones are placed. The camera photographing control device according to claim 7, wherein:
【請求項13】 前記音源位置計算手段の計算結果に基
づいて、音源位置ごとの発話時刻を記録する発話情報記
録手段と、 をさらに有することを特徴とする請求項7記載のカメラ
撮影制御装置。
13. The camera photographing control apparatus according to claim 7, further comprising: utterance information recording means for recording an utterance time for each sound source position based on a calculation result of said sound source position calculation means.
【請求項14】 前記マイクの捉えた音及び前記カメラ
の撮影した映像を、記録及び再生する映像・音声記録再
生手段をさらに有し、 前記発話情報記録手段は、前記映像・音声記録再生手段
が記録した映像のインデックスとして、音源位置ごとの
発話時刻を記録することを特徴とする請求項13記載の
カメラ撮影制御装置。
14. A video / audio recording / reproducing unit for recording and reproducing a sound captured by the microphone and a video taken by the camera, wherein the utterance information recording unit includes a video / audio recording / reproducing unit. 14. The camera photographing control device according to claim 13, wherein an utterance time for each sound source position is recorded as an index of the recorded video.
【請求項15】 音情報に基づいて音源位置を記録する
音源位置記録装置において、 所定の形状の三角形の3つの頂点に設置されたマイク
と、 1つの音源の発した音が前記マイクのそれぞれで捉えら
れた時刻を音検出時刻として検出する音信号検出手段
と、 前記マイクごとの音検出時刻に基づいて、前記マイクの
2個ずつを組合わせることにより得られる3組のマイク
ペアごとの音の到達時間差を測定する時間差測定手段
と、 それぞれの前記マイクの位置とマイクペアごとの音の到
達時間差とから、音源位置を計算する音源位置計算手段
と、 前記音源位置計算手段が計算した音源位置が所定の範囲
内の場合には同一の音源から発せられた音とし、所定の
範囲外の場合には異なる音源から発せされた音とするこ
とにより、音源ごとの発話時間を記録する発話情報記録
手段と、 を有することを特徴とする音源位置記録装置。
15. A sound source position recording apparatus for recording a sound source position based on sound information, wherein: microphones installed at three vertices of a triangle having a predetermined shape; Sound signal detecting means for detecting a captured time as a sound detection time; and arrival of sound for each of three microphone pairs obtained by combining two microphones based on the sound detection time for each microphone. A time difference measuring means for measuring a time difference; a sound source position calculating means for calculating a sound source position from a position of each of the microphones and a sound arrival time difference for each microphone pair; and a sound source position calculated by the sound source position calculating means. When the sound is within the range, the sound is emitted from the same sound source, and when the sound is out of the predetermined range, the sound is emitted from a different sound source. Sound source position recording apparatus characterized by having a speech information recording means for recording.
【請求項16】 音情報によって音源位置を計算する音
源位置計測方法において、 所定の形状の三角形の3つの頂点に設置されたマイクの
それぞれで、1つの音源の発した音が捉えられた時刻を
音検出時刻として検出し、 前記マイクごとの音検出時刻に基づいて、前記マイクの
2個ずつを組合わせることにより得られる3組のマイク
ペアごとの音の到達時間差を測定し、 それぞれの前記マイクの位置とマイクペアごとの音の到
達時間差とから、音源位置を計算する、ことを特徴とす
る音源位置計測方法。
16. A sound source position measuring method for calculating a sound source position based on sound information, wherein a time at which a sound emitted from one sound source is captured by each of microphones installed at three vertexes of a triangle having a predetermined shape is obtained. Detected as a sound detection time, based on the sound detection time for each microphone, measure the arrival time difference of sound for each of the three microphone pairs obtained by combining two of the microphones, A sound source position measurement method, comprising calculating a sound source position from a position and a difference in arrival time of sound for each microphone pair.
JP3029297A 1997-02-14 1997-02-14 Sound source position measuring device and camera photographing control device Expired - Lifetime JP3572849B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3029297A JP3572849B2 (en) 1997-02-14 1997-02-14 Sound source position measuring device and camera photographing control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3029297A JP3572849B2 (en) 1997-02-14 1997-02-14 Sound source position measuring device and camera photographing control device

Publications (2)

Publication Number Publication Date
JPH10227849A true JPH10227849A (en) 1998-08-25
JP3572849B2 JP3572849B2 (en) 2004-10-06

Family

ID=12299664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3029297A Expired - Lifetime JP3572849B2 (en) 1997-02-14 1997-02-14 Sound source position measuring device and camera photographing control device

Country Status (1)

Country Link
JP (1) JP3572849B2 (en)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341658A (en) * 1999-05-27 2000-12-08 Nec Eng Ltd Speaker direction detecting system
WO2002008782A1 (en) * 2000-07-20 2002-01-31 Robert Bosch Gmbh Method for the acoustic localization of persons in an area of detection
WO2002029432A1 (en) * 2000-10-02 2002-04-11 Chubu Electric Power Co., Inc., Sound source probing system
JP2002181913A (en) * 2000-10-02 2002-06-26 Chubu Electric Power Co Inc Sound source probing system
JP2003111183A (en) * 2001-09-27 2003-04-11 Chubu Electric Power Co Inc Sound source search system
JP2004257877A (en) * 2003-02-26 2004-09-16 Seiko Epson Corp Sound source detection method, sound source detection device and robot
JP2006194700A (en) * 2005-01-12 2006-07-27 Hiroshima Industrial Promotion Organization Sound source direction estimation system, sound source direction estimation method and sound source direction estimation program
JP2007235969A (en) * 2007-03-19 2007-09-13 Ricoh Co Ltd Video recording system, program and recording medium
JP2007263614A (en) * 2006-03-27 2007-10-11 Oki Electric Ind Co Ltd Device and method for calibrating echo sounder receiver position
WO2007122729A1 (en) * 2006-04-18 2007-11-01 Hitachi, Ltd. Communication system, communication apparatus and sound source direction determining apparatus
JP2008067854A (en) * 2006-09-13 2008-03-27 National Institute Of Advanced Industrial & Technology Voice input device to be mounted on electric wheelchair
US7586513B2 (en) 2003-05-08 2009-09-08 Tandberg Telecom As Arrangement and method for audio source tracking
JP2009294866A (en) * 2008-06-04 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> Utterance relevant information presentation device and method
KR100958932B1 (en) 2008-08-19 2010-05-19 주식회사 에스원 Apparatus for Detecting Intrusion and Intrusion Detection Method using Measuring the Position of 3D Sound Source Thereof
JP2011033369A (en) * 2009-07-30 2011-02-17 Ricoh Co Ltd Conference device
CN102033223A (en) * 2010-12-29 2011-04-27 北京信息科技大学 Method for positioning sound source by using microphone array
JP2012243221A (en) * 2011-05-23 2012-12-10 Kddi Corp Pointing system
WO2013015461A1 (en) * 2011-07-22 2013-01-31 엘지전자 주식회사 Device for detecting the direction of a sound source, and surveillance camera including same
CN104502893A (en) * 2014-12-10 2015-04-08 北京智谷睿拓技术服务有限公司 Positioning method, positioning device and user equipment
JP2015161659A (en) * 2014-02-28 2015-09-07 株式会社熊谷組 Sound source direction estimation device and display device of image for sound source estimation
CN105005027A (en) * 2015-08-05 2015-10-28 张亚光 System for positioning target object in regional scope
KR101630614B1 (en) * 2015-03-25 2016-06-24 (주)에어사운드 System and method for producing lecture contents
JP2017156122A (en) * 2016-02-29 2017-09-07 沖電気工業株式会社 Control device, control method, and detection system
JP2018034221A (en) * 2016-08-29 2018-03-08 Kddi株式会社 Robot system
JP2018526622A (en) * 2015-06-30 2018-09-13 ユウトウ・テクノロジー(ハンジョウ)・カンパニー・リミテッド Robot voice search rotation system and method
WO2019077856A1 (en) * 2017-10-16 2019-04-25 三菱重工サーマルシステムズ株式会社 Position estimation device, air conditioning system, position estimation method, and program
JP2019123055A (en) * 2018-01-18 2019-07-25 株式会社ユピテル apparatus
CN110389597A (en) * 2018-04-17 2019-10-29 北京京东尚科信息技术有限公司 Camera method of adjustment, device and system based on auditory localization
JP2019211393A (en) * 2018-06-07 2019-12-12 旭化成エレクトロニクス株式会社 Determining device, determination method, and determination program
US10565977B1 (en) 2018-08-20 2020-02-18 Verb Surgical Inc. Surgical tool having integrated microphones
CN112104928A (en) * 2020-05-13 2020-12-18 苏州触达信息技术有限公司 Intelligent sound box and method and system for controlling intelligent sound box
JP2021072575A (en) * 2019-10-31 2021-05-06 パナソニックIpマネジメント株式会社 Sound source display system and sound source display device
CN113453138A (en) * 2021-06-29 2021-09-28 四川长虹电器股份有限公司 Method for detecting microphone sequence in microphone array

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341658A (en) * 1999-05-27 2000-12-08 Nec Eng Ltd Speaker direction detecting system
WO2002008782A1 (en) * 2000-07-20 2002-01-31 Robert Bosch Gmbh Method for the acoustic localization of persons in an area of detection
US7224809B2 (en) 2000-07-20 2007-05-29 Robert Bosch Gmbh Method for the acoustic localization of persons in an area of detection
WO2002029432A1 (en) * 2000-10-02 2002-04-11 Chubu Electric Power Co., Inc., Sound source probing system
JP2002181913A (en) * 2000-10-02 2002-06-26 Chubu Electric Power Co Inc Sound source probing system
JP4722347B2 (en) * 2000-10-02 2011-07-13 中部電力株式会社 Sound source exploration system
JP2003111183A (en) * 2001-09-27 2003-04-11 Chubu Electric Power Co Inc Sound source search system
JP2004257877A (en) * 2003-02-26 2004-09-16 Seiko Epson Corp Sound source detection method, sound source detection device and robot
US7586513B2 (en) 2003-05-08 2009-09-08 Tandberg Telecom As Arrangement and method for audio source tracking
JP2006194700A (en) * 2005-01-12 2006-07-27 Hiroshima Industrial Promotion Organization Sound source direction estimation system, sound source direction estimation method and sound source direction estimation program
JP2007263614A (en) * 2006-03-27 2007-10-11 Oki Electric Ind Co Ltd Device and method for calibrating echo sounder receiver position
WO2007122729A1 (en) * 2006-04-18 2007-11-01 Hitachi, Ltd. Communication system, communication apparatus and sound source direction determining apparatus
JPWO2007122729A1 (en) * 2006-04-18 2009-08-27 株式会社日立製作所 Communication system, communication device, and sound source direction identification device
JP2008067854A (en) * 2006-09-13 2008-03-27 National Institute Of Advanced Industrial & Technology Voice input device to be mounted on electric wheelchair
JP4660740B2 (en) * 2006-09-13 2011-03-30 独立行政法人産業技術総合研究所 Voice input device for electric wheelchair
JP2007235969A (en) * 2007-03-19 2007-09-13 Ricoh Co Ltd Video recording system, program and recording medium
JP2009294866A (en) * 2008-06-04 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> Utterance relevant information presentation device and method
KR100958932B1 (en) 2008-08-19 2010-05-19 주식회사 에스원 Apparatus for Detecting Intrusion and Intrusion Detection Method using Measuring the Position of 3D Sound Source Thereof
JP2011033369A (en) * 2009-07-30 2011-02-17 Ricoh Co Ltd Conference device
CN102033223A (en) * 2010-12-29 2011-04-27 北京信息科技大学 Method for positioning sound source by using microphone array
JP2012243221A (en) * 2011-05-23 2012-12-10 Kddi Corp Pointing system
WO2013015461A1 (en) * 2011-07-22 2013-01-31 엘지전자 주식회사 Device for detecting the direction of a sound source, and surveillance camera including same
JP2015161659A (en) * 2014-02-28 2015-09-07 株式会社熊谷組 Sound source direction estimation device and display device of image for sound source estimation
CN104502893A (en) * 2014-12-10 2015-04-08 北京智谷睿拓技术服务有限公司 Positioning method, positioning device and user equipment
KR101630614B1 (en) * 2015-03-25 2016-06-24 (주)에어사운드 System and method for producing lecture contents
JP2018526622A (en) * 2015-06-30 2018-09-13 ユウトウ・テクノロジー(ハンジョウ)・カンパニー・リミテッド Robot voice search rotation system and method
CN105005027A (en) * 2015-08-05 2015-10-28 张亚光 System for positioning target object in regional scope
JP2017156122A (en) * 2016-02-29 2017-09-07 沖電気工業株式会社 Control device, control method, and detection system
JP2018034221A (en) * 2016-08-29 2018-03-08 Kddi株式会社 Robot system
JP2019074400A (en) * 2017-10-16 2019-05-16 三菱重工サーマルシステムズ株式会社 Position estimating device, air conditioning system, position estimation method, and program
CN111226125B (en) * 2017-10-16 2023-08-22 三菱重工制冷空调系统株式会社 Air conditioning system and air conditioning control method
WO2019077856A1 (en) * 2017-10-16 2019-04-25 三菱重工サーマルシステムズ株式会社 Position estimation device, air conditioning system, position estimation method, and program
CN111226125A (en) * 2017-10-16 2020-06-02 三菱重工制冷空调系统株式会社 Position estimation device, air conditioning system, position estimation method, and program
JP2019123055A (en) * 2018-01-18 2019-07-25 株式会社ユピテル apparatus
CN110389597A (en) * 2018-04-17 2019-10-29 北京京东尚科信息技术有限公司 Camera method of adjustment, device and system based on auditory localization
CN110389597B (en) * 2018-04-17 2024-05-17 北京京东尚科信息技术有限公司 Camera adjusting method, device and system based on sound source positioning
JP2019211393A (en) * 2018-06-07 2019-12-12 旭化成エレクトロニクス株式会社 Determining device, determination method, and determination program
US10565977B1 (en) 2018-08-20 2020-02-18 Verb Surgical Inc. Surgical tool having integrated microphones
US11723515B2 (en) 2018-08-20 2023-08-15 Verb Surgical Inc. Surgical tool having integrated microphones
WO2020040795A1 (en) * 2018-08-20 2020-02-27 Verb Surgical Inc. Surgical tool having integrated microphones
JP2021072575A (en) * 2019-10-31 2021-05-06 パナソニックIpマネジメント株式会社 Sound source display system and sound source display device
CN112104928A (en) * 2020-05-13 2020-12-18 苏州触达信息技术有限公司 Intelligent sound box and method and system for controlling intelligent sound box
CN113453138A (en) * 2021-06-29 2021-09-28 四川长虹电器股份有限公司 Method for detecting microphone sequence in microphone array
CN113453138B (en) * 2021-06-29 2022-06-21 四川长虹电器股份有限公司 Method for detecting microphone sequence in microphone array

Also Published As

Publication number Publication date
JP3572849B2 (en) 2004-10-06

Similar Documents

Publication Publication Date Title
JP3572849B2 (en) Sound source position measuring device and camera photographing control device
CN104240606B (en) The adjusting method of display device and display device viewing angle
US6005610A (en) Audio-visual object localization and tracking system and method therefor
US6980485B2 (en) Automatic camera tracking using beamforming
CN109565629B (en) Method and apparatus for controlling processing of audio signals
US10931919B2 (en) Video conference system, video conference apparatus, and video conference method
TW201120469A (en) Method, computer readable storage medium and system for localizing acoustic source
EP3549030A1 (en) Distributed audio capturing techniques for virtual reality (vr), augmented reality (ar), and mixed reality (mr) systems
JP2004514359A (en) Automatic tuning sound system
JP2007019907A (en) Speech transmission system, and communication conference apparatus
JP2012529213A (en) Estimation of loudspeaker position
CN107820037B (en) Audio signal, image processing method, device and system
JP2005274707A (en) Information processing apparatus and method, program, and recording medium
JP2007235334A (en) Audio apparatus and directive sound generating method
JP2023508002A (en) Audio device automatic location selection
JP2006304124A (en) Apparatus and method for confirming direction of sound source
JP2009177480A (en) Imaging device
JP2006270522A (en) Sound image localization controller
JPS59105575A (en) System for detecting sound direction
JP2006166007A (en) Method and device for sound source direction detection and imaging device
US11425502B2 (en) Detection of microphone orientation and location for directional audio pickup
TWI622289B (en) Hand-held electronic apparatus, audio video broadcasting apparatus and broadcasting method thereof
Chen et al. Speaker tracking and identifying based on indoor localization system and microphone array
US9883142B1 (en) Automated collaboration system
JP2020115609A (en) Voice recording device, control method of the same, and program

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20040608

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040621

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 6

Free format text: PAYMENT UNTIL: 20100709