JP2012186551A - Control device, control system, and control method - Google Patents

Control device, control system, and control method Download PDF

Info

Publication number
JP2012186551A
JP2012186551A JP2011046686A JP2011046686A JP2012186551A JP 2012186551 A JP2012186551 A JP 2012186551A JP 2011046686 A JP2011046686 A JP 2011046686A JP 2011046686 A JP2011046686 A JP 2011046686A JP 2012186551 A JP2012186551 A JP 2012186551A
Authority
JP
Japan
Prior art keywords
sound collection
control device
sound
image acquisition
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011046686A
Other languages
Japanese (ja)
Inventor
Satoshi Yamashita
聡 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011046686A priority Critical patent/JP2012186551A/en
Publication of JP2012186551A publication Critical patent/JP2012186551A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the quality of sound collection.SOLUTION: A control device for controlling image acquisition means capable of a horizontal panning operation and sound collection means with a changeable sound collection range comprises sound collection range change means for changing the sound collection range of the sound collection means using a distance between the position of the image acquisition means and the position of a subject captured in an image acquired by the image acquisition means, a panning direction of the image acquisition means, a distance between the position of the image acquisition means and the position of the sound collection means, and a direction of the position of the sound collection means with reference to the position of the image acquisition means.

Description

本発明は、集音装置を制御する技術に関するものである。   The present invention relates to a technique for controlling a sound collecting device.

従来より、マイク内蔵型ビデオカメラ等によりマイクの指向特性とカメラの振れ角、ズーム角を連動させるテレビ会議装置の技術が存在する(特許文献1)。   2. Description of the Related Art Conventionally, there is a technology of a video conference apparatus in which a microphone directivity characteristic, a camera shake angle, and a zoom angle are linked by a built-in video camera or the like (Patent Document 1).

特開平10−155107号公報JP-A-10-155107

しかし、上記技術では、カメラとマイクが一体化されているものであるため、テレビ会議等において集音品質を高めるためにマイクを会議卓の中央等に設置すると、撮影できる被写体(参加者)が限られてしまう。   However, in the above technology, since the camera and the microphone are integrated, a subject (participant) that can be photographed when the microphone is installed at the center of the conference table or the like to improve the sound collection quality in a video conference or the like. It will be limited.

本発明の目的は、集音の品質を向上させる技術を提供することにある。   An object of the present invention is to provide a technique for improving the quality of sound collection.

上記課題を解決すべく、本発明に係る制御装置は、左右へのパン動作可能なイメージ取得手段と、集音範囲を変更可能な集音手段と、を制御する制御装置であって、前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更手段を備える、ことを特徴とする。   In order to solve the above problems, a control device according to the present invention is a control device that controls image acquisition means capable of panning left and right and sound collection means capable of changing a sound collection range, wherein the image The distance between the position of the acquisition means and the position of the subject reflected in the image acquired by the image acquisition means, the pan direction of the image acquisition means, the position of the image acquisition means, and the position of the sound collection means A sound collection range changing means for changing a sound collection range of the sound collection means using a distance between the sound acquisition means and a direction of the position of the sound collection means with respect to the position of the image acquisition means. It is characterized by.

また、本発明に係る制御システムは、左右へのパン動作手段を備える撮像装置と、集音範囲の変更手段を備える集音装置と、前記撮像装置および前記集音装置を制御する制御装置と、を備え、前記制御装置は、前記撮像装置の位置と前記撮像装置により取得される映像に映りこむ被写体の位置との間の距離と、前記撮像装置のパンの方向と、前記撮像装置の位置と前記集音装置の位置との間の距離と、前記撮像装置の位置を基準とした前記集音装置の位置の方向と、を用いて前記集音装置の集音範囲を変更するよう指示する集音範囲変更指示手段を備える、ことを特徴とする。   In addition, the control system according to the present invention includes an imaging device including a left and right pan operation unit, a sound collection device including a sound collection range changing unit, a control device that controls the imaging device and the sound collection device, The control device includes a distance between a position of the imaging device and a position of a subject reflected in an image acquired by the imaging device, a pan direction of the imaging device, and a position of the imaging device. A collection that instructs to change the sound collection range of the sound collection device using a distance between the sound collection device position and a direction of the sound collection device position with respect to the position of the imaging device. A sound range change instruction means is provided.

また、本発明に係る撮像装置は、左右へのパン動作を行うパン動作手段と、撮影している画角を変更する動作を行う画角変更動作手段と、パン方向を特定するパン方向情報を取得するパン方向情報取得手段と、被写体までの距離を特定する距離情報を取得する距離情報取得手段と、撮影している画角を特定する画角情報を取得する画角情報取得手段と、前記パン方向情報と、前記距離情報と、前記画角情報と、を出力する出力手段と、を備え、前記出力手段は、前記パン動作手段および前記画角変更動作手段のいずれの動作も終了して所定の時間経過した場合に、前記出力を行う、ことを特徴とする。   Further, an imaging apparatus according to the present invention includes pan operation means for performing a pan operation to the left and right, an angle of view change operation means for performing an operation of changing an angle of view being photographed, and pan direction information for specifying a pan direction. Pan direction information acquisition means for acquiring, distance information acquisition means for acquiring distance information for specifying the distance to the subject, angle of view information acquisition means for acquiring angle of view information for specifying the angle of view being shot, Output means for outputting pan direction information, the distance information, and the angle of view information, and the output means finishes any of the operations of the pan operation means and the angle of view change operation means. The output is performed when a predetermined time has elapsed.

また、本発明に係る制御方法は、左右へのパン動作可能なイメージ取得手段と、集音範囲を変更可能な集音手段と、を制御する制御装置の制御方法であって、前記制御装置は、前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更ステップを実施する、ことを特徴とする。   The control method according to the present invention is a control method for a control device that controls image acquisition means capable of panning left and right and sound collection means capable of changing a sound collection range, wherein the control device includes: The distance between the position of the image acquisition means and the position of the subject reflected in the image acquired by the image acquisition means, the pan direction of the image acquisition means, the position of the image acquisition means, and the sound collection A sound collection range changing step of changing the sound collection range of the sound collecting means using a distance between the sound collecting means and a direction of the sound collecting means relative to the position of the image acquiring means. It is characterized by carrying out.

本発明によると、カメラとマイクを独立して配置可能としつつ集音の品質を向上させることができる。   According to the present invention, the quality of sound collection can be improved while the camera and the microphone can be arranged independently.

本発明の実施形態に係るテレビ会議システムの構成例を示す図である。It is a figure which shows the structural example of the video conference system which concerns on embodiment of this invention. テレビ会議システムの機能構成例を示す図である。It is a figure which shows the function structural example of a video conference system. テレビ会議システムのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of a video conference system. マイクアレイ装置の構成を示す図である。It is a figure which shows the structure of a microphone array apparatus. テレビ会議システムの配置例を示す図である。It is a figure which shows the example of arrangement | positioning of a video conference system. マイクアレイ位置テーブルの構成例を示す図である。It is a figure which shows the structural example of a microphone array position table. マイクアレイ出力レベルテーブルの構成例を示す図である。It is a figure which shows the structural example of a microphone array output level table. マイクアレイ設定処理のシーケンス図である。It is a sequence diagram of a microphone array setting process. マイクアレイ位置設定の初期化処理の画面例を説明する説明図である。It is explanatory drawing explaining the example of a screen of the initialization process of microphone array position setting. マイクアレイ設定算出の仕組みを説明する説明図である。It is explanatory drawing explaining the mechanism of microphone array setting calculation. 出力レベル調整テーブルの構成例を示す図である。It is a figure which shows the structural example of an output level adjustment table. マイクアレイ出力レベル調整の仕組みを説明する説明図である。It is explanatory drawing explaining the mechanism of microphone array output level adjustment.

以下に、本発明に係る第一の実施形態を適用したマイクロホン制御装置を含むテレビ会議システム1について、図面を参照して説明する。   Hereinafter, a video conference system 1 including a microphone control device to which a first embodiment of the present invention is applied will be described with reference to the drawings.

図1は、本発明の実施形態におけるテレビ会議システム1を示す図である。本発明におけるテレビ会議システム1は、サーバー80と、ネットワーク70を介してサーバー80に接続可能な会議端末A20、会議端末B21、会議端末C22と、を含む。基本的には、会議端末A20は会議室A10に配置され、会議端末B21は会議室B11に配置され、会議端末C22は会議室C12に配置されることを想定している。   FIG. 1 is a diagram showing a video conference system 1 according to an embodiment of the present invention. The video conference system 1 according to the present invention includes a server 80 and a conference terminal A20, a conference terminal B21, and a conference terminal C22 that can be connected to the server 80 via the network 70. Basically, it is assumed that the conference terminal A20 is arranged in the conference room A10, the conference terminal B21 is arranged in the conference room B11, and the conference terminal C22 is arranged in the conference room C12.

会議端末A20には、会議端末A20と通信可能なカメラA30、マイクアレイA40、ディスプレイA50、スピーカーA60が接続される。会議端末A20は、マイクロホン制御装置として動作しうる。   A camera A30, a microphone array A40, a display A50, and a speaker A60 that can communicate with the conference terminal A20 are connected to the conference terminal A20. The conference terminal A20 can operate as a microphone control device.

カメラA30は、映像情報をデジタルデータとして取得して会議端末A20に送信し、会議端末A20から撮影範囲の指示を受け付けて、撮影を行ういわゆるイメージ取得装置、例えばビデオカメラ等である。   The camera A30 is a so-called image acquisition device, such as a video camera, that acquires video information as digital data and transmits it to the conference terminal A20, receives an instruction of a shooting range from the conference terminal A20, and performs shooting.

マイクアレイA40は、周囲の音を集音してデジタルデータとして取得して会議端末A20に送信し、会議端末A20から集音方向および集音感度等の指示を受け付けて、集音を行ういわゆるマイクロホンである。マイクアレイA40は、後述するが、マイクアレイA40の設置位置から放射状に全周にわたる集音範囲を持つように、所定の範囲を集音するマイクを複数配列した装置であり、マイク毎にゲイン調節が可能である。   The microphone array A40 collects ambient sounds, acquires them as digital data, transmits them to the conference terminal A20, receives a command from the conference terminal A20, such as the sound collection direction and the sound collection sensitivity, and collects the sound. It is. As will be described later, the microphone array A40 is a device in which a plurality of microphones that collect a predetermined range are arranged so as to have a sound collection range that extends radially from the installation position of the microphone array A40, and gain adjustment is performed for each microphone. Is possible.

ディスプレイA50は、接続される会議端末A20から送信される表示情報を表示出力する。当該表示情報には、会議端末A20がカメラA30を介して取得した映像情報または他の会議端末B21または会議端末C22からネットワーク70を介して受信した映像情報等が含まれる。また、その他、ディスプレイA50は、会議端末A20から送信される設定値等の設定画面を表示することも可能である。   The display A50 displays and outputs display information transmitted from the connected conference terminal A20. The display information includes video information acquired by the conference terminal A20 via the camera A30, video information received via the network 70 from another conference terminal B21 or conference terminal C22, and the like. In addition, the display A50 can also display a setting screen such as a setting value transmitted from the conference terminal A20.

スピーカーA60は、接続される会議端末A20から送信される音声情報を出力する。当該音声情報には、会議端末A20がマイクアレイA40を介して取得した音声情報または他の会議端末B21または会議端末C22からネットワーク70を介して受信した音声情報等が含まれる。また、その他、スピーカーA60は、会議端末A20から送信されるガイダンス等の音声を出力することも可能である。   The speaker A60 outputs audio information transmitted from the connected conference terminal A20. The audio information includes audio information acquired by the conference terminal A20 via the microphone array A40, audio information received via the network 70 from another conference terminal B21 or conference terminal C22, and the like. In addition, the speaker A60 can output voice such as guidance transmitted from the conference terminal A20.

会議端末B21には、会議端末B21と通信可能なカメラB31、マイクアレイB41、ディスプレイB51、スピーカーB61が接続される。会議端末B21は、マイクロホン制御装置として動作しうる。   A camera B31, a microphone array B41, a display B51, and a speaker B61 that can communicate with the conference terminal B21 are connected to the conference terminal B21. The conference terminal B21 can operate as a microphone control device.

カメラB31は、映像情報をデジタルデータとして取得して会議端末B21に送信し、会議端末B21から撮影範囲の指示を受け付けて、撮影を行ういわゆるイメージ取得装置、例えばビデオカメラ等である。   The camera B31 is a so-called image acquisition device, such as a video camera, that acquires video information as digital data and transmits it to the conference terminal B21, receives an instruction of a shooting range from the conference terminal B21, and performs shooting.

マイクアレイB41は、周囲の音を集音してデジタルデータとして取得して会議端末B21に送信し、会議端末B21から集音方向および集音感度等の指示を受け付けて、集音を行ういわゆるマイクロホンである。マイクアレイB41は、後述するが、マイクアレイB41の設置位置から放射状に全周にわたる集音範囲を持つように、所定の範囲を集音するマイクを複数配列した装置であり、マイク毎にゲイン調節が可能である。   The microphone array B41 collects ambient sounds, acquires them as digital data, transmits them to the conference terminal B21, and receives a command from the conference terminal B21 such as the sound collection direction and the sound collection sensitivity to collect sound. It is. As will be described later, the microphone array B41 is a device in which a plurality of microphones that collect sound within a predetermined range are arranged so as to have a sound collection range radially extending from the installation position of the microphone array B41, and gain adjustment is performed for each microphone. Is possible.

ディスプレイB51は、接続される会議端末B21から送信される表示情報を表示出力する。当該表示情報には、会議端末B21がカメラB31を介して取得した映像情報または他の会議端末A20または会議端末C22からネットワーク70を介して受信した映像情報等が含まれる。また、その他、ディスプレイB51は、会議端末B21から送信される設定値等の設定画面を表示することも可能である。   The display B51 displays and outputs display information transmitted from the connected conference terminal B21. The display information includes video information acquired by the conference terminal B21 via the camera B31 or video information received via the network 70 from another conference terminal A20 or conference terminal C22. In addition, the display B51 can also display a setting screen such as a setting value transmitted from the conference terminal B21.

スピーカーB61は、接続される会議端末B21から送信される音声情報を出力する。当該音声情報には、会議端末B21がマイクアレイB41を介して取得した音声情報または他の会議端末A20または会議端末C22からネットワーク70を介して受信した音声情報等が含まれる。また、その他、スピーカーB61は、会議端末B21から送信されるガイダンス等の音声を出力することも可能である。   The speaker B61 outputs audio information transmitted from the connected conference terminal B21. The audio information includes audio information acquired by the conference terminal B21 via the microphone array B41, audio information received via the network 70 from another conference terminal A20 or the conference terminal C22, and the like. In addition, the speaker B61 can output voice such as guidance transmitted from the conference terminal B21.

会議端末C22には、会議端末C22と通信可能なカメラC32、マイクアレイC42、ディスプレイC52、スピーカーC62が接続される。会議端末C22は、マイクロホン制御装置として動作しうる。   A camera C32, a microphone array C42, a display C52, and a speaker C62 that can communicate with the conference terminal C22 are connected to the conference terminal C22. The conference terminal C22 can operate as a microphone control device.

カメラC32は、映像情報をデジタルデータとして取得して会議端末C22に送信し、会議端末C22から撮影範囲の指示を受け付けて、撮影を行ういわゆるイメージ取得装置、例えばビデオカメラ等である。   The camera C32 is a so-called image acquisition device, such as a video camera, that acquires video information as digital data and transmits it to the conference terminal C22, receives an instruction of a shooting range from the conference terminal C22, and performs shooting.

マイクアレイC42は、周囲の音を集音してデジタルデータとして取得して会議端末C22に送信し、会議端末C22から集音方向および集音感度等の指示を受け付けて、集音を行ういわゆるマイクロホンである。マイクアレイC42は、後述するが、マイクアレイC42の設置位置から放射状に全周にわたる集音範囲を持つように、所定の範囲を集音するマイクを複数配列した装置であり、マイク毎にゲイン調節が可能である。   The microphone array C42 collects ambient sound, acquires it as digital data, transmits it to the conference terminal C22, receives a command from the conference terminal C22, such as the sound collection direction and the sound collection sensitivity, and collects the so-called microphone. It is. As will be described later, the microphone array C42 is a device in which a plurality of microphones that collect a predetermined range are arranged so as to have a sound collection range radially extending from the installation position of the microphone array C42, and gain adjustment is performed for each microphone. Is possible.

ディスプレイC52は、接続される会議端末C22から送信される表示情報を表示出力する。当該表示情報には、会議端末C22がカメラC32を介して取得した映像情報または他の会議端末A20または会議端末B21からネットワーク70を介して受信した映像情報等が含まれる。また、その他、ディスプレイC52は、会議端末C22から送信される設定値等の設定画面を表示することも可能である。   The display C52 displays and outputs display information transmitted from the connected conference terminal C22. The display information includes video information acquired by the conference terminal C22 via the camera C32 or video information received via the network 70 from another conference terminal A20 or conference terminal B21. In addition, the display C52 can also display a setting screen such as a setting value transmitted from the conference terminal C22.

スピーカーC62は、接続される会議端末C22から送信される音声情報を出力する。当該音声情報には、会議端末C22がマイクアレイC42を介して取得した音声情報または他の会議端末A20または会議端末B21からネットワーク70を介して受信した音声情報等が含まれる。また、その他、スピーカーC62は、会議端末C22から送信されるガイダンス等の音声を出力することも可能である。   The speaker C62 outputs audio information transmitted from the connected conference terminal C22. The audio information includes audio information acquired by the conference terminal C22 via the microphone array C42, audio information received via the network 70 from another conference terminal A20 or conference terminal B21, and the like. In addition, the speaker C62 can output voice such as guidance transmitted from the conference terminal C22.

ネットワーク70は、本実施形態においては、いわゆるインターネット等のTCP/IP等に準拠した広域ネットワークを想定しているが、これに限られず、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークであってもよい。   In the present embodiment, the network 70 is assumed to be a wide area network based on TCP / IP or the like such as the Internet, but is not limited thereto, and is not limited to a LAN (Local Area Network) or a WAN (Wide Area Network). It may be a network.

サーバー80は、ネットワーク70を介して、会議端末A20、会議端末B21、会議端末C22間のテレビ会議サービスを実現する。具体的には、例えば、サーバー80は、会議に参加する対象の会議端末間で仮想会議室を構成・管理し、参加する対象の会議端末間の通信を仲介する。なお、本実施形態においては、サーバー80は、会議端末の映像データおよび音声データを取得して他の会議端末に配信するものではなく、会議端末間の映像データと音声データの通信経路を構築するに留まる。しかし、これに限らず、会議端末間の映像データおよび音声データを集中的に取得して会議に参加する他の会議端末に配信するものであってもよい。   The server 80 implements a video conference service between the conference terminal A20, the conference terminal B21, and the conference terminal C22 via the network 70. Specifically, for example, the server 80 configures and manages a virtual conference room between conference terminals targeted for participation in the conference, and mediates communication between the conference terminals targeted for participation. In the present embodiment, the server 80 does not acquire the video data and audio data of the conference terminal and distribute them to other conference terminals, but constructs a communication path for the video data and audio data between the conference terminals. Stay on. However, the present invention is not limited to this, and video data and audio data between conference terminals may be intensively acquired and distributed to other conference terminals participating in the conference.

図2は、テレビ会議システム1の会議室A10に配置されるカメラA30、会議端末A20、マイクアレイA40についての機能構成例を示す図である。なお、会議室B11、会議室C12についてのカメラB31、会議端末B21、マイクアレイB41、カメラC32、会議端末C22およびマイクアレイC42についても、基本的に同様の機能構成を備えるものとする。また、ディスプレイA50、スピーカーA60、ディスプレイB51、スピーカーB61、ディスプレイC52、スピーカーC62については、図示していないが、通常の機能構成を備えるものとする。   FIG. 2 is a diagram illustrating a functional configuration example of the camera A30, the conference terminal A20, and the microphone array A40 arranged in the conference room A10 of the video conference system 1. The camera B31, the conference terminal B21, the microphone array B41, the camera C32, the conference terminal C22, and the microphone array C42 for the conference room B11 and the conference room C12 basically have the same functional configuration. In addition, the display A50, the speaker A60, the display B51, the speaker B61, the display C52, and the speaker C62 are not illustrated, but have normal functional configurations.

図2に示すように、カメラA30は、パン/ズーム制御部310と、カメラ情報通知部320と、カメラ操作有効/無効制御部330と、を備える。パン/ズーム制御部310は、カメラA30が撮影する画角および撮影する方向、すなわち映像に映りこむ範囲を制御する。パン/ズーム制御部310は、具体的には、左右への振れ角の変更指示を受け付けると、指示に従って後述する光学装置35の振れ角の変更を行う。また、画角の変更指示を受け付けると、指示に従って後述する光学装置35の画角の変更を行う。   As shown in FIG. 2, the camera A30 includes a pan / zoom control unit 310, a camera information notification unit 320, and a camera operation enable / disable control unit 330. The pan / zoom control unit 310 controls the angle of view and direction in which the camera A30 shoots, that is, the range that appears in the video. Specifically, when the pan / zoom control unit 310 receives an instruction to change the deflection angle to the left and right, the pan / zoom control unit 310 changes the deflection angle of the optical device 35 to be described later according to the instruction. When an instruction to change the angle of view is received, the angle of view of the optical device 35 to be described later is changed according to the instruction.

なお、パン/ズーム制御部310は、パンまたはズームの変更指示に従うことができない場合、例えば、振れ角の変更指示によると、光学装置35の物理的な可動範囲を超えるような場合、あるいは例えば、画角の変更指示によると、光学装置35の光学的あるいは画像処理上のズーム(光学ズームあるいはデジタルズーム等)の範囲を超えるような場合には、変更可能な範囲で指示に従うよう制御する。   Note that the pan / zoom control unit 310 cannot follow the pan or zoom change instruction, for example, if the shake angle change instruction exceeds the physical movable range of the optical device 35, or, for example, According to the change instruction of the angle of view, when the optical or image processing zoom (optical zoom, digital zoom, or the like) of the optical device 35 is exceeded, control is performed so as to follow the instruction within a changeable range.

カメラ情報通知部320は、所定のタイミングで振れ角(パン方向)、被写体までの距離、画角についての情報を取得して、接続されている会議端末A20に対して出力する。なお、本実施形態においては、カメラ情報通知部320は、パン/ズーム操作がなされた後、所定の時間(例えば3秒)パン/ズーム操作がなされない場合に、振れ角(パン方向)、被写体までの距離、画角についての情報を取得して、接続されている会議端末A20に対して出力するものとする。なお、本実施形態においては、振れ角(パン方向)は、台座の向き(正面)とカメラの光軸の向きの差から求められ、被写体までの距離は、所定の測距点において被写体にピントが合った状態の焦点距離から求まる距離であり、画角は、レンズ群の繰り出し量に応じて求められる画角である。   The camera information notification unit 320 acquires information about the swing angle (pan direction), the distance to the subject, and the angle of view at a predetermined timing, and outputs the information to the connected conference terminal A20. In the present embodiment, the camera information notification unit 320 determines the shake angle (pan direction), subject when the pan / zoom operation is not performed for a predetermined time (for example, 3 seconds) after the pan / zoom operation is performed. It is assumed that information about the distance and angle of view is acquired and output to the connected conference terminal A20. In this embodiment, the deflection angle (pan direction) is obtained from the difference between the direction of the pedestal (front) and the direction of the optical axis of the camera, and the distance to the subject is focused on the subject at a predetermined distance measuring point. Is a distance obtained from the focal length in a state where the two are matched, and the angle of view is an angle of view obtained according to the amount of extension of the lens group.

カメラ操作有効/無効制御部330は、カメラA30に対する会議端末A20からの操作の受付の有効/無効を制御する。具体的には、カメラ操作有効/無効制御部330は、会議端末A20からカメラ操作ロック指示を受け付けると、パン/ズーム制御部310に対するパン/ズームの変更指示を受け付けないよう操作ロックを行う。また、カメラ操作有効/無効制御部330は、会議端末A20からカメラ操作ロック解除指示を受け付けると、パン/ズーム制御部310に対するパン/ズームの変更指示を受け付けるよう操作ロックの解除を行う。   The camera operation valid / invalid control unit 330 controls validity / invalidity of accepting an operation from the conference terminal A20 for the camera A30. Specifically, when the camera operation enable / disable control unit 330 receives a camera operation lock instruction from the conference terminal A20, the camera operation enable / disable control unit 330 performs operation lock so that a pan / zoom change instruction to the pan / zoom control unit 310 is not received. When the camera operation enable / disable control unit 330 receives a camera operation lock release instruction from the conference terminal A20, the camera operation enable / disable control unit 330 releases the operation lock so as to receive a pan / zoom change instruction to the pan / zoom control unit 310.

なお、カメラA30は、図示しないが、通常のカメラと同様に、画像取得を開始する指示を受け付けて画像を取得する画像取得制御部、画像取得を終了する指示を受け付けて画像取得を終了する画像取得終了制御部、取得した画像を会議端末A20等の外部装置またはカメラA30に取り付けられたメモリーカード等の記憶媒体に出力する画像出力制御部、被写体までの距離を特定する測距部、光学装置35の焦点位置(ピント)を調整するフォーカス制御部等の制御部を備える。また、カメラA30は、会議室A10のオペレーター(あるいは会議参加者)または会議相手のオペレーター(あるいは会議参加者)からパン、ズーム操作を受け付けて、パンおよびズームを行うことが可能である。   Although not shown, the camera A30 is an image acquisition control unit that receives an instruction to start image acquisition and acquires an image, and receives an instruction to end image acquisition and ends image acquisition in the same manner as a normal camera. An acquisition end control unit, an image output control unit that outputs the acquired image to an external device such as the conference terminal A20 or a storage medium such as a memory card attached to the camera A30, a distance measurement unit that specifies the distance to the subject, and an optical device A control unit such as a focus control unit for adjusting the focal position (focus) of 35 is provided. The camera A30 can perform panning and zooming by receiving panning and zooming operations from an operator (or conference participant) of the conference room A10 or an operator of the conference partner (or conference participant).

会議端末A20は、カメラ状態検知部210と、マイクアレイ制御部220と、マイクアレイ位置データメモリ230と、カメラ操作有効/無効指示部240と、カメラ操作指示部250と、を備える。カメラ状態検知部210は、接続されたカメラA30の状態を検知する。具体的には、カメラ状態検知部210は、接続されたカメラA30から、振れ角(パン方向)、被写体までの距離、画角についての情報を取得する。さらに、カメラ状態検知部210は、カメラA30が撮影した画像内のマイクアレイA40が所定の画面内の位置に有る場合には、カメラA30の振れ角と被写体までの距離に応じて、マイクアレイA40の位置を特定する。   The conference terminal A20 includes a camera state detection unit 210, a microphone array control unit 220, a microphone array position data memory 230, a camera operation enable / disable instruction unit 240, and a camera operation instruction unit 250. The camera state detection unit 210 detects the state of the connected camera A30. Specifically, the camera state detection unit 210 acquires information about the shake angle (pan direction), the distance to the subject, and the angle of view from the connected camera A30. Furthermore, when the microphone array A40 in the image photographed by the camera A30 is at a position within a predetermined screen, the camera state detection unit 210 determines the microphone array A40 according to the swing angle of the camera A30 and the distance to the subject. Specify the position of.

マイクアレイ制御部220は、マイクアレイA40の位置と、カメラA30の被写体の位置と、画角と、に応じて、マイクアレイA40のマイクごとのゲイン調整を行う。具体的には、マイクアレイ制御部220は、マイクアレイA40の相対的な位置(カメラA30の正面方向からのパン角度と、カメラA30からマイクアレイA40までの直線距離)を記憶したマイクアレイ位置データメモリ230からマイク位置を取得する。   The microphone array control unit 220 performs gain adjustment for each microphone of the microphone array A40 according to the position of the microphone array A40, the position of the subject of the camera A30, and the angle of view. Specifically, the microphone array control unit 220 stores microphone array position data in which the relative position of the microphone array A40 (the pan angle from the front direction of the camera A30 and the linear distance from the camera A30 to the microphone array A40) is stored. The microphone position is acquired from the memory 230.

そして、マイクアレイ制御部220は、カメラA30が映す被写体のカメラ位置から見た方向(振れ角に基づき特定)と、被写体までの距離と、画角と、マイク位置と、を用いて、マイク位置からみた被写体の方向を特定する。マイクアレイ制御部220は、マイク位置からみた被写体の方向に応じて、マイクアレイA40のマイクロホンごとに、予め定められたマイクゲイン調整値を含むマイクゲイン調整指示をマイクアレイA40に対して出力する。なお、本実施形態においては、カメラ画角が60°以上の場合はマイクアンプの出力レベルは調整されないようになっている。しかし、カメラ画角が60°未満になると、マイクロホンの出力レベルを増減させ、集音範囲の制御が行われる。   Then, the microphone array control unit 220 uses the direction (identified based on the shake angle) of the subject imaged by the camera A30, the distance to the subject, the angle of view, and the microphone position to determine the microphone position. Identify the direction of the subject as seen from the perspective. The microphone array control unit 220 outputs a microphone gain adjustment instruction including a predetermined microphone gain adjustment value to the microphone array A40 for each microphone of the microphone array A40 according to the direction of the subject viewed from the microphone position. In the present embodiment, the output level of the microphone amplifier is not adjusted when the camera angle of view is 60 ° or more. However, when the camera angle of view is less than 60 °, the microphone output level is increased or decreased to control the sound collection range.

マイクアレイ位置データメモリ230は、マイクアレイA40の位置を特定する情報を格納する。具体的には、マイクアレイ位置データメモリ230は、図6に示すマイクアレイ位置テーブル600と、図7に示すマイクアレイ出力レベルテーブル650とを備える。   The microphone array position data memory 230 stores information for specifying the position of the microphone array A40. Specifically, the microphone array position data memory 230 includes a microphone array position table 600 shown in FIG. 6 and a microphone array output level table 650 shown in FIG.

マイクアレイ位置テーブル600は、マイクアレイの位置を格納する。マイクアレイ位置テーブル600には、カメラAとマイクアレイA間の距離を特定する情報が格納されるカメラAとマイクアレイA間の距離601と、カメラの正面からみたマイクアレイのパン方向を特定する基準パン方向角度602と、が含まれる。例えば、基準パン方向角度602が「−5°」である場合は、カメラA30の正面からマイナス5°方向、つまり左方向に5°パンした方向にマイクアレイが存在する、ということを示す。   The microphone array position table 600 stores the position of the microphone array. In the microphone array position table 600, information for specifying the distance between the camera A and the microphone array A is stored. The distance 601 between the camera A and the microphone array A and the panning direction of the microphone array as viewed from the front of the camera are specified. A reference pan direction angle 602. For example, when the reference pan direction angle 602 is “−5 °”, it indicates that the microphone array exists in the minus 5 ° direction from the front of the camera A30, that is, in the direction panned 5 ° to the left.

マイクアレイ出力レベルテーブル650は、マイクアレイを構成するマイクごとの出力レベルを調整する情報を格納する。マイクアレイ出力レベルテーブル650は、カメラA30が撮影している画角であるカメラ画角651と、集音方向として選択されたマイクロホンの出力レベルとして設定する集音方向として選択されたマイクロホンの出力レベル652と、選択されたマイクロホンに隣接するマイクロホンの出力レベルとして設定する選択されたマイクロホンに隣接するマイクロホンの出力レベル653と、選択されたマイクロホンおよび隣接するマイクロホンを除くその他のマイクロホンの出力レベルとして設定するその他のマイクロホンの出力レベル654と、が含まれる。なお、マイクアレイ出力レベルテーブル650に格納された出力レベルは、マイクアレイA40が集音範囲の制御を実施していない状態(360°集音状態)の出力レベルを0dBとして、カメラ画角に対応する各マイクアンプの出力レベルを特定するものである。   The microphone array output level table 650 stores information for adjusting the output level for each microphone constituting the microphone array. The microphone array output level table 650 includes a camera angle of view 651 that is an angle of view captured by the camera A30 and an output level of the microphone selected as the sound collection direction set as the output level of the microphone selected as the sound collection direction. 652, the output level of the microphone adjacent to the selected microphone set as the output level of the microphone adjacent to the selected microphone, and the output level of the other microphones excluding the selected microphone and the adjacent microphone Other microphone output levels 654 are included. The output level stored in the microphone array output level table 650 corresponds to the camera angle of view when the output level when the microphone array A40 is not controlling the sound collection range (360 ° sound collection state) is 0 dB. This specifies the output level of each microphone amplifier.

カメラ操作有効/無効指示部240は、カメラA30に対する会議端末A20からの操作を指示する。具体的には、カメラ操作有効/無効指示部240は、カメラA30に対してのカメラ操作ロック指示/カメラ操作ロック解除を指示する。   The camera operation enable / disable instruction unit 240 instructs an operation from the conference terminal A20 to the camera A30. Specifically, the camera operation enable / disable instruction unit 240 instructs the camera A30 to perform a camera operation lock instruction / camera operation lock release.

カメラ操作指示部250は、カメラA30、またはネットワーク70を介して会議中の他のカメラB31またはカメラC32に対する会議端末A20からの操作を指示する。具体的には、カメラ操作指示部250は、同一の会議に参加している会議端末に接続されたカメラのうち指定されたカメラのパン/ズーム操作を受け付けると、当該操作対象のカメラに対してパン/ズームの変更指示を出力する。その際、他の会議端末に接続されたカメラが操作対象であれば、当該会議端末をあて先としてネットワーク70上に変更指示の情報が含まれる情報を送出する。   The camera operation instruction unit 250 instructs an operation from the conference terminal A20 to the camera A30 or the other camera B31 or camera C32 in the conference via the network 70. Specifically, when the camera operation instruction unit 250 receives a pan / zoom operation of a designated camera among the cameras connected to the conference terminals participating in the same conference, the camera operation instruction unit 250 Outputs pan / zoom change instructions. At this time, if a camera connected to another conference terminal is an operation target, information including change instruction information is transmitted to the network 70 with the conference terminal as a destination.

また、カメラ操作指示部250は、ネットワーク70を介してカメラのパン/ズームの変更指示を受信すると、接続されているカメラA30に対して、当該変更指示に応じたパン/ズームの変更指示を出力する。このようにすることで、会議に参加中の各会議端末を介して、相手先会議室あるいは自会議室のカメラのパン/ズームを実施することができる。   When the camera operation instruction unit 250 receives a camera pan / zoom change instruction via the network 70, the camera operation instruction unit 250 outputs a pan / zoom change instruction corresponding to the change instruction to the connected camera A30. To do. By doing in this way, it is possible to perform pan / zoom of the camera in the destination conference room or the own conference room via each conference terminal participating in the conference.

マイクアレイA40は、マイクゲイン制御部410と、マイクロホン420a〜マイクロホン420lと、マイクロホン420a〜420lのそれぞれに対応してマイクのゲインを調整するマイクアンプ430a〜430lと、マイクアンプ430a〜430lから得られたゲインを合成するミキサ440と、ミキサ440で得られた合成出力を音声情報に変換する音声符号化部450と、を備える。   The microphone array A40 is obtained from the microphone gain control unit 410, the microphones 420a to 420l, the microphone amplifiers 430a to 430l that adjust the gains of the microphones corresponding to the microphones 420a to 420l, and the microphone amplifiers 430a to 430l. A mixer 440 that combines the gains, and a speech encoding unit 450 that converts the combined output obtained by the mixer 440 into speech information.

マイクゲイン制御部410は、マイクロホン420a〜420lの各マイクロホンについて、マイクアンプ430a〜430lのゲイン調整を行う。本実施形態においては、マイクゲイン制御部410は、会議端末A20からマイクロホン420a〜420lのゲイン調整指示を受けて、対応するマイクアンプ430a〜430lのゲインを調整する。   The microphone gain control unit 410 adjusts the gain of the microphone amplifiers 430a to 430l for each of the microphones 420a to 420l. In the present embodiment, the microphone gain control unit 410 receives the gain adjustment instruction of the microphones 420a to 420l from the conference terminal A20, and adjusts the gain of the corresponding microphone amplifiers 430a to 430l.

音声符号化部450は、ミキサ440から出力された音声情報を所定のフレームレートでサンプリングし、音声データを出力する。当該処理は、通常の符号化処理である。   The audio encoding unit 450 samples the audio information output from the mixer 440 at a predetermined frame rate, and outputs audio data. This process is a normal encoding process.

図3は、カメラA30と、会議端末A20と、マイクアレイA40と、についてのハードウェア構成例を示す図である。なお、カメラB31、会議端末B21、マイクアレイB41、カメラC32、会議端末C22、マイクアレイC42についても、同様のハードウェア構成を備えるものとする。   FIG. 3 is a diagram illustrating a hardware configuration example of the camera A30, the conference terminal A20, and the microphone array A40. The camera B31, the conference terminal B21, the microphone array B41, the camera C32, the conference terminal C22, and the microphone array C42 are assumed to have the same hardware configuration.

カメラA30は、本実施形態においては、いわゆる独立して動作を行うビデオカメラ装置である。しかし、これに限らず、PC(パーソナルコンピュータ)や、ワークステーション、各種携帯電話端末、PDA(Personal Digital Assistant)、スマートフォンなどに分類される計算機であってもよい。   In this embodiment, the camera A30 is a video camera device that operates independently. However, the computer is not limited to this, and may be a computer classified into a PC (personal computer), a workstation, various mobile phone terminals, a PDA (Personal Digital Assistant), a smartphone, and the like.

カメラA30は、バス131と、演算装置132と、主記憶装置133と、通信装置134と、光学装置135と、を備える。演算装置132は、例えばCPU(Central Processing Unit)などの演算装置である。   The camera A30 includes a bus 131, a calculation device 132, a main storage device 133, a communication device 134, and an optical device 135. The arithmetic device 132 is an arithmetic device such as a CPU (Central Processing Unit).

主記憶装置133は、例えばRAM(Random Access Memory)などのメモリ装置である。   The main storage device 133 is a memory device such as a RAM (Random Access Memory).

通信装置134は、インターネットあるいはLAN等のネットワーク70に接続される装置および専用ケーブル等で接続される会議端末A20との通信を行う通信装置である。   The communication device 134 is a communication device that communicates with a device connected to the network 70 such as the Internet or a LAN and a conference terminal A20 connected with a dedicated cable or the like.

光学装置135は、例えばビデオカメラレンズ群およびそのフォーカス駆動部、CCDあるいはCMOS等によるイメージャおよび画像生成処理を行う画像処理部等を備えるいわゆる撮像装置である。   The optical device 135 is a so-called imaging device including, for example, a video camera lens group and a focus driving unit thereof, an imager using a CCD or a CMOS, an image processing unit that performs image generation processing, and the like.

演算装置132と、主記憶装置133と、通信装置134と、光学装置135とは、バス131により互いに接続される。   The arithmetic device 132, the main storage device 133, the communication device 134, and the optical device 135 are connected to each other via a bus 131.

上記したカメラA30のパン/ズーム制御部310は、光学装置135により実現される。また、カメラ情報通知部320およびカメラ操作有効/無効制御部330は、演算装置132に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置133または図示しないROM装置内に記憶され、実行にあたって主記憶装置133上にロードされ、演算装置132により実行される。   The pan / zoom control section 310 of the camera A30 described above is realized by the optical device 135. The camera information notification unit 320 and the camera operation enable / disable control unit 330 are realized by a program that causes the arithmetic device 132 to perform processing. This program is stored in the main storage device 133 or a ROM device (not shown), loaded onto the main storage device 133 for execution, and executed by the arithmetic device 132.

会議端末A20は、本実施形態においては、独立して動作を行ういわゆる端末装置である。しかし、これに限らず、PC(パーソナルコンピュータ)や、ワークステーション、サーバー装置、各種携帯電話端末、PDA(Personal Digital Assistant)、スマートフォンなどに分類される計算機であってもよい。   In the present embodiment, the conference terminal A20 is a so-called terminal device that operates independently. However, the computer is not limited to this, and may be a computer classified into a PC (personal computer), a workstation, a server device, various mobile phone terminals, a PDA (Personal Digital Assistant), a smartphone, and the like.

会議端末A20は、バス121と、演算装置122と、主記憶装置123と、通信装置124と、を備える。演算装置122は、例えばCPU(Central Processing Unit)などの演算装置である。   The conference terminal A20 includes a bus 121, a calculation device 122, a main storage device 123, and a communication device 124. The arithmetic device 122 is an arithmetic device such as a CPU (Central Processing Unit).

主記憶装置123は、例えばRAM(Random Access Memory)などのメモリ装置である。   The main storage device 123 is a memory device such as a RAM (Random Access Memory).

通信装置124は、インターネットあるいはLAN等のネットワーク70に接続される装置および専用ケーブル等で接続される他の会議端末およびカメラA30、マイクアレイA40、ディスプレイA50、スピーカーA60等の接続される装置との通信を行う通信装置である。   The communication device 124 is a device connected to a network 70 such as the Internet or a LAN, another conference terminal connected by a dedicated cable or the like, and a device connected to the camera A30, microphone array A40, display A50, speaker A60, and the like. A communication device that performs communication.

演算装置122と、主記憶装置123と、通信装置124とは、バス121により互いに接続される。   The arithmetic device 122, the main storage device 123, and the communication device 124 are connected to each other via a bus 121.

上記した会議端末A20のカメラ状態検知部210、マイクアレイ制御部220およびカメラ操作有効/無効指示部240は、演算装置122に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置123または図示しないROM装置内に記憶され、実行にあたって主記憶装置123上にロードされ、演算装置122により実行される。   The camera state detection unit 210, the microphone array control unit 220, and the camera operation enable / disable instruction unit 240 of the conference terminal A20 are realized by a program that causes the arithmetic device 122 to perform processing. This program is stored in the main storage device 123 or a ROM device (not shown), loaded onto the main storage device 123 for execution, and executed by the arithmetic device 122.

また、会議端末A20のマイクアレイ位置データメモリ230は、主記憶装置123に格納されることで実現される。   Further, the microphone array position data memory 230 of the conference terminal A20 is realized by being stored in the main storage device 123.

マイクアレイA40は、本実施形態においては、独立して動作を行うマイク装置である。マイクアレイA40は、バス141と、演算装置142と、主記憶装置143と、通信装置144と、集音装置145と、を備える。演算装置142は、例えばCPU(Central Processing Unit)などの演算装置である。   In the present embodiment, the microphone array A40 is a microphone device that operates independently. The microphone array A40 includes a bus 141, a calculation device 142, a main storage device 143, a communication device 144, and a sound collection device 145. The arithmetic device 142 is an arithmetic device such as a CPU (Central Processing Unit).

主記憶装置143は、例えばRAM(Random Access Memory)などのメモリ装置である。   The main storage device 143 is a memory device such as a RAM (Random Access Memory).

通信装置144は、インターネットあるいはLAN等のネットワーク70に接続される装置および専用ケーブル等で接続される会議端末A20との通信を行う通信装置である。   The communication device 144 is a communication device that communicates with a device connected to the network 70 such as the Internet or a LAN and a conference terminal A20 connected with a dedicated cable or the like.

集音装置145は、例えば図4に示すような構造をしている。図4はマイクアレイ装置の構成を示す図である。マイクアレイA40は、環状に均等に配置された複数のマイクロホン420a〜420lにより構成される。一つのマイクロホン(図4ではマイクロホン420a)には、マイクアレイA40の集音方向の基準となる基準位置マーク460が外観上明確に認識可能に設けられている。   The sound collector 145 has a structure as shown in FIG. 4, for example. FIG. 4 is a diagram showing the configuration of the microphone array apparatus. The microphone array A40 includes a plurality of microphones 420a to 420l that are equally arranged in a ring shape. In one microphone (microphone 420a in FIG. 4), a reference position mark 460 serving as a reference for the sound collection direction of the microphone array A40 is provided so as to be clearly recognizable in appearance.

マイクロホン420a〜420lは、夫々が集音範囲に指向性を持つ。本実施形態においては、夫々が左右各30度の放射状の範囲で集音可能なマイクロホン420a〜420lの12個が組み合わされてマイクアレイA40を構成する。そのため、マイクアレイA40は周囲360°(全方位)について集音範囲を備えるものであるといえる。   Each of the microphones 420a to 420l has directivity in the sound collection range. In the present embodiment, twelve microphones 420a to 420l that can collect sound within a radial range of 30 degrees on the left and right respectively are combined to constitute the microphone array A40. Therefore, it can be said that the microphone array A40 has a sound collection range around 360 ° (omnidirectional).

マイクアレイA40は、全方位について集音範囲を有するものであるが、上記したように、複数のマイクロホン420a〜420lと、および各マイクロホンごとに調整を行うことができるマイクアンプ430a〜430lと、を含んで構成されるため、マイクロホンごとのゲインを調整することで、集音範囲を制御することができる。   The microphone array A40 has a sound collection range in all directions. As described above, the microphone array A40 includes a plurality of microphones 420a to 420l and microphone amplifiers 430a to 430l that can be adjusted for each microphone. Therefore, the sound collection range can be controlled by adjusting the gain for each microphone.

例えば、図4においては、発言者の方向(角度461)を基準位置マーク460を基準に特定し、当該方向に集音範囲を備えるマイクロホン420eのゲインを他のマイクロホンのゲインよりも高くすることで、より発言者の発言を集音し易く、周囲の雑音を抑えることができる。   For example, in FIG. 4, the speaker's direction (angle 461) is specified with reference to the reference position mark 460, and the gain of the microphone 420e having a sound collection range in that direction is made higher than the gains of other microphones. Therefore, it is easier to collect a speaker's speech and suppress ambient noise.

演算装置142と、主記憶装置143と、通信装置144と、集音装置145とは、バス141により互いに接続される。   The arithmetic device 142, the main storage device 143, the communication device 144, and the sound collecting device 145 are connected to each other via a bus 141.

上記したマイクアレイA40のマイクロホン420a〜420l、マイクアンプ430a〜430lおよびミキサ440は、集音装置145により実現される。また、マイクアレイA40のマイクゲイン制御部410および音声符号化部450は、演算装置142に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置143または図示しないROM装置内に記憶され、実行にあたって主記憶装置143上にロードされ、演算装置142により実行される。   The microphones 420a to 420l, the microphone amplifiers 430a to 430l, and the mixer 440 of the microphone array A40 described above are realized by the sound collecting device 145. The microphone gain control unit 410 and the speech encoding unit 450 of the microphone array A40 are realized by a program that causes the arithmetic unit 142 to perform processing. This program is stored in the main storage device 143 or a ROM device (not shown), loaded onto the main storage device 143 for execution, and executed by the arithmetic unit 142.

以上が、本実施形態におけるテレビ会議システム1のハードウェア構成例である。しかし、これに限らず、その他のハードウェアを用いて構成されるものであってもよい。例えば、ネットワーク70を無線によるネットワークあるいは携帯電話網とし、会議端末とカメラ、マイクアレイ、ディスプレイ、スピーカーをBluetooth(登録商標)等の無線通信により接続可能とするものであってもよい。   The above is the hardware configuration example of the video conference system 1 in the present embodiment. However, the configuration is not limited to this, and other hardware may be used. For example, the network 70 may be a wireless network or a mobile phone network, and the conference terminal and the camera, microphone array, display, and speaker may be connectable by wireless communication such as Bluetooth (registered trademark).

[動作の説明]次に、本実施形態におけるテレビ会議システム1の動作を説明する。図5は、本実施形態におけるテレビ会議システム1のカメラA30とマイクアレイA40についての配置例を示す図である。図5においては、マイクアレイA40を会議卓上(望ましくは、会議参加者の中心付近)、カメラA30を会議卓の片端に配置する。この時、マイクアレイA40は基準位置マーク460がカメラA30の正面に向けて設置されるものとする。   [Description of Operation] Next, the operation of the video conference system 1 in this embodiment will be described. FIG. 5 is a diagram illustrating an arrangement example of the camera A30 and the microphone array A40 of the video conference system 1 in the present embodiment. In FIG. 5, the microphone array A40 is arranged on the conference table (preferably near the center of the conference participant), and the camera A30 is arranged at one end of the conference table. At this time, the microphone array A40 is installed with the reference position mark 460 facing the front of the camera A30.

ここで、カメラA30の正面方向を基準(0度)とし、右方向をプラス方向、左方向をマイナス方向として360度法により表すと、カメラA30からみたマイクアレイA40の設置方向501は、マイナス(−)5°、すなわちカメラA30の正面より若干左方向にマイクアレイA40が配置されているものとする。なお、マイクアレイA40の位置の基準は、基準位置マーク460の位置としている。また、カメラA30からマイクアレイA40までの距離500は、2mであるとする。   Here, when the front direction of the camera A30 is set as a reference (0 degree), the right direction is a plus direction, and the left direction is a minus direction and expressed by the 360 degree method, the installation direction 501 of the microphone array A40 viewed from the camera A30 is minus ( -) It is assumed that the microphone array A40 is arranged at 5 °, that is, slightly to the left of the front of the camera A30. The reference position of the microphone array A40 is the position of the reference position mark 460. Further, it is assumed that the distance 500 from the camera A30 to the microphone array A40 is 2 m.

当該情報は、後述する初期化処理において特定され、マイクアレイ位置データメモリ230のマイクアレイ位置テーブル600に格納される。   The information is specified in an initialization process described later, and is stored in the microphone array position table 600 of the microphone array position data memory 230.

ここで、初期化処理について説明する。まず、カメラA30によりマイクアレイA40を図9に示すようにズームアップして初期設定映像340として撮影し、焦点をマイクアレイA40の基準位置マーク460に合わせる。当該操作は、会議室A10を使用する会議参加者が適宜光学装置35を操作して実施する。   Here, the initialization process will be described. First, the camera A30 zooms up the microphone array A40 as shown in FIG. 9 to photograph it as an initial setting image 340, and focuses on the reference position mark 460 of the microphone array A40. The operation is performed by a conference participant who uses the conference room A10 by appropriately operating the optical device 35.

その際、会議端末A20の図示しない制御部は、会議室A10のディスプレイA50に初期設定映像340を表示させる。制御部は、初期化処理においては映像の中心に照準の基準を示すスコープ350を重畳して表示させる。会議参加者は、スコープ350が基準位置マーク460と重なるようにカメラA30の向き(パン方向)を調整しピントを合わせる。   At that time, the control unit (not shown) of the conference terminal A20 displays the initial setting video 340 on the display A50 of the conference room A10. In the initialization process, the control unit superimposes and displays the scope 350 indicating the aiming reference at the center of the video. The conference participant adjusts the direction (pan direction) of the camera A30 so that the scope 350 overlaps the reference position mark 460 and focuses.

カメラ情報通知部320は、被写体にピントが合った時の焦点距離に基づき、カメラA30とマイクアレイA40間の距離500および設置方向501を特定し、会議端末A20に対し通知する。   The camera information notification unit 320 identifies the distance 500 between the camera A30 and the microphone array A40 and the installation direction 501 based on the focal length when the subject is in focus, and notifies the conference terminal A20.

以上が、初期化処理の流れである。初期化処理により、カメラA30からみたマイクアレイA40の位置を特定できる。   The above is the flow of the initialization process. By the initialization process, the position of the microphone array A40 viewed from the camera A30 can be specified.

次に、図8を用いて、会議室A10に関する会議中のマイクアレイ制御処理について説明する。マイクアレイ制御処理では、カメラが映す被写体周辺の音声を高品質に集音する。   Next, the microphone array control process during the conference related to the conference room A10 will be described with reference to FIG. In the microphone array control process, the sound around the subject projected by the camera is collected with high quality.

まず、カメラA30は、パン/ズーム操作を行う(ステップS001)。具体的には、カメラA30のカメラ操作有効/無効制御部330は、会議室A10の会議参加者による会議端末A20の操作、または会議に参加している他の会議端末B21または会議端末C22の操作に応じたカメラA30に対するパン/ズームの変更指示を受け付ける。そして、カメラ操作が有効である場合に、パン/ズーム制御部310は、受け付けた変更指示に応じたパン/ズーム操作を実現するよう光学装置35を制御する。なお、カメラ操作が無効であれば、カメラ操作有効/無効制御部330は、受け付けた変更指示を破棄し、応答しない。   First, the camera A30 performs a pan / zoom operation (step S001). Specifically, the camera operation enable / disable control unit 330 of the camera A30 operates the conference terminal A20 by a conference participant in the conference room A10, or operates another conference terminal B21 or conference terminal C22 participating in the conference. A pan / zoom change instruction to the camera A30 according to the above is accepted. Then, when the camera operation is valid, the pan / zoom control unit 310 controls the optical device 35 so as to realize the pan / zoom operation according to the received change instruction. If the camera operation is invalid, the camera operation valid / invalid control unit 330 discards the received change instruction and does not respond.

次に、カメラ情報通知部320は、規定の時間、カメラ操作がなされなかったか否かを判定する(ステップS002)。具体的には、カメラ情報通知部320は、直近に実施したステップS001のパン/ズーム操作の終了後、所定の時間(例えば、3秒)が経過したか否かを判定する。規定の時間内にカメラ操作がなされた場合、すなわち所定の時間が経っていない場合(ステップS002にて「No」の場合)には、カメラ情報通知部320は、ステップS002を再度実施する。   Next, the camera information notification unit 320 determines whether the camera operation has not been performed for a specified time (step S002). Specifically, the camera information notification unit 320 determines whether or not a predetermined time (for example, 3 seconds) has elapsed after the last pan / zoom operation in step S001. When the camera operation is performed within the specified time, that is, when the predetermined time has not passed (“No” in step S002), the camera information notification unit 320 performs step S002 again.

規定の時間内にカメラ操作がなされなかった場合、すなわち所定の時間が経った場合(ステップS002にて「Yes」の場合)には、カメラ情報通知部320は、カメラのパン方向を特定して会議端末A20に通知し(ステップS003)、カメラと被写体との距離を特定して会議端末A20に通知し(ステップS004)、カメラが撮影している画角を特定して会議端末A20に通知する(ステップS005)。   When the camera operation is not performed within the specified time, that is, when a predetermined time has passed (“Yes” in step S002), the camera information notification unit 320 specifies the pan direction of the camera. The conference terminal A20 is notified (step S003), the distance between the camera and the subject is specified and notified to the conference terminal A20 (step S004), the angle of view captured by the camera is specified, and the conference terminal A20 is notified. (Step S005).

なお、上記したように、本実施形態においては、カメラ情報通知部320は、パン方向は、台座の向き(正面)とカメラの光軸の向きの差から特定し、被写体までの距離は、所定の測距点において被写体にピントが合った状態の焦点距離から求め、画角は、レンズ群の繰り出し量に応じて求める。   As described above, in this embodiment, the camera information notification unit 320 specifies the pan direction from the difference between the orientation of the pedestal (front) and the orientation of the optical axis of the camera, and the distance to the subject is predetermined. The angle of view is determined according to the amount of extension of the lens group.

会議端末A20のカメラ状態検知部210が、ステップS003〜S005による通知を受け付けると、カメラ操作有効/無効指示部240は、カメラ操作ロック指示をカメラA30に対して行う(ステップS006)。   When the camera state detection unit 210 of the conference terminal A20 receives the notification in steps S003 to S005, the camera operation enable / disable instruction unit 240 issues a camera operation lock instruction to the camera A30 (step S006).

カメラA30のカメラ操作有効/無効制御部330は、ステップS006においてカメラ操作ロック指示を受け付けると、パン/ズームの操作を無効に設定する(ステップS007)。   Upon receiving the camera operation lock instruction in step S006, the camera operation enable / disable control unit 330 of the camera A30 sets the pan / zoom operation to be invalid (step S007).

会議端末A20のマイクアレイ制御部220は、後述するマイクアレイ設定算出処理を実施する(ステップS008)。   The microphone array control unit 220 of the conference terminal A20 performs a microphone array setting calculation process described later (step S008).

そして、マイクアレイ制御部220は、マイクアレイ設定算出処理により特定したマイクゲインの設定値を含むマイクゲイン設定指示をマイクアレイA40のマイクゲイン制御部410に対して行う(ステップS009)。   Then, the microphone array control unit 220 issues a microphone gain setting instruction including the setting value of the microphone gain specified by the microphone array setting calculation process to the microphone gain control unit 410 of the microphone array A40 (step S009).

マイクアレイA40のマイクゲイン制御部410は、マイクゲイン設定処理を実施する(ステップS010)。具体的には、マイクゲイン制御部410は、ステップS009において指示されたマイクゲイン設定指示に応じて、マイクアンプ430a〜430lのそれぞれに対してマイクゲインを設定する。   The microphone gain controller 410 of the microphone array A40 performs a microphone gain setting process (step S010). Specifically, microphone gain control unit 410 sets a microphone gain for each of microphone amplifiers 430a to 430l in accordance with the microphone gain setting instruction instructed in step S009.

カメラ操作有効/無効指示部240は、カメラ操作ロック解除指示をカメラA30に対して行う(ステップS011)。   The camera operation enable / disable instruction unit 240 issues a camera operation lock release instruction to the camera A30 (step S011).

カメラA30のカメラ操作有効/無効制御部330は、ステップS011においてカメラ操作ロック解除指示を受け付けると、カメラ操作ロック解除処理を行う(ステップS012)。具体的には、カメラ操作有効/無効制御部330は、パン/ズームの操作を有効に受け付ける状態へ移行する。   When the camera operation enable / disable control unit 330 of the camera A30 receives a camera operation lock release instruction in step S011, it performs a camera operation lock release process (step S012). Specifically, the camera operation valid / invalid control unit 330 shifts to a state where the pan / zoom operation is effectively accepted.

以上が、マイクアレイ制御処理の流れである。マイクアレイ制御処理によると、左右へのパン動作可能なイメージ取得手段の位置とイメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、イメージ取得手段のパンの方向と、イメージ取得手段の位置と集音範囲を変更可能な集音手段の位置との間の距離と、イメージ取得手段の位置を基準とした集音手段の位置の方向と、を用いて集音手段の集音範囲を変更することができる。すなわち、カメラとマイクが独立して配置されている状態において、被写体の方向にマイク感度を高めることができるため、集音の品質を向上させることができるといえる。   The above is the flow of the microphone array control process. According to the microphone array control process, the distance between the position of the image acquisition unit capable of panning left and right and the position of the subject reflected in the image acquired by the image acquisition unit, the pan direction of the image acquisition unit, Using the distance between the position of the image acquisition means and the position of the sound collection means capable of changing the sound collection range, and the direction of the position of the sound collection means with respect to the position of the image acquisition means. The sound collection range can be changed. That is, in the state where the camera and the microphone are arranged independently, the microphone sensitivity can be increased in the direction of the subject, so that it can be said that the quality of sound collection can be improved.

次に、図10を用いて、上記マイクアレイ制御処理のステップS008にて実施するマイクアレイ設定算出処理の処理およびその原理について説明する。本説明においては、図10に示すような配置で会議がなされている前提とする。すなわち、図5に示したカメラA30とマイクアレイA40の配置がなされている状態で、発言者に向けられたカメラA30の光軸方向(パン角度503)と、カメラA30からみたマイクアレイA40の方向(設置方向501)と、の差分を差分角α504とする。すなわち、カメラA30の正面からのパン角度503は、設置方向501と、差分角α504とを合成した角度とする。   Next, the microphone array setting calculation process performed in step S008 of the microphone array control process and its principle will be described with reference to FIG. In this description, it is assumed that the conference is held in the arrangement as shown in FIG. That is, in the state where the camera A30 and the microphone array A40 shown in FIG. 5 are arranged, the optical axis direction (pan angle 503) of the camera A30 directed toward the speaker and the direction of the microphone array A40 viewed from the camera A30 The difference between (installation direction 501) and the difference angle α504. That is, the pan angle 503 from the front of the camera A30 is an angle obtained by combining the installation direction 501 and the difference angle α504.

また、マイクアレイA40と被写体との距離を距離aとし、被写体とカメラA30との距離を距離b502とし、カメラA30とマイクアレイA40との距離をc500とする。また、カメラA30の撮影する画角505は、発言者が十分に視野に捕捉可能な画角であるとする。   The distance between the microphone array A40 and the subject is a distance a, the distance between the subject and the camera A30 is a distance b502, and the distance between the camera A30 and the microphone array A40 is c500. In addition, it is assumed that the angle of view 505 captured by the camera A30 is an angle of view that can be captured sufficiently by the speaker in the field of view.

また、発言者からみたマイクアレイA40の方向と、カメラA30の方向と、の差分の角度を差分角γとし、マイクアレイA40からみた発言者の方向と、カメラA30の方向と、の差分の角度を差分角βとする。   Further, the difference angle between the direction of the microphone array A40 viewed from the speaker and the direction of the camera A30 is defined as a difference angle γ, and the difference angle between the direction of the speaker viewed from the microphone array A40 and the direction of the camera A30 Is the difference angle β.

上記のように配置される場合において、距離a、距離b502、距離c500および差分角α504、差分角β、差分角γの間では、余弦定理90(下記式1、式2、式3)の関係が成立する。   In the case of the arrangement as described above, the relationship between the distance a, the distance b502, the distance c500, the difference angle α504, the difference angle β, and the difference angle γ is represented by the cosine theorem 90 (Equation 1, Equation 2, and Equation 3 below). Is established.

Figure 2012186551
Figure 2012186551

Figure 2012186551
Figure 2012186551

Figure 2012186551
Figure 2012186551

すなわち、上記の関係が成立するといえる。そのため、マイクアレイ制御部220は、上記式1、式2、式3の式を解くことで、マイクアレイA40が集音する方向(すなわち、差分角β)を特定する。   That is, it can be said that the above relationship is established. Therefore, the microphone array control unit 220 identifies the direction in which the microphone array A40 collects sound (that is, the difference angle β) by solving the equations (1), (2), and (3).

本実施形態においては、マイクアレイ制御部220は、ステップS003にてパン方向を、ステップS004にてカメラA30から被写体までの距離を、ステップS005にて画角の情報を受け取っており、初期化処理において格納したマイクアレイ位置テーブル600のカメラAとマイクアレイA間の距離601と、基準パン方向角度602とを読み出すことができる。マイクアレイ制御部220は、パン方向と基準パン方向角度602との差から差分角α504を特定し、カメラA30から被写体までの距離を距離b502として特定し、カメラAとマイクアレイA間の距離601を距離c500として特定し、余弦定理90の各式に代入することで、差分角βを算出する。   In this embodiment, the microphone array control unit 220 receives the pan direction in step S003, the distance from the camera A30 to the subject in step S004, and the angle of view information in step S005. The distance 601 between the camera A and the microphone array A and the reference pan direction angle 602 in the microphone array position table 600 stored in FIG. The microphone array control unit 220 identifies the difference angle α 504 from the difference between the pan direction and the reference pan direction angle 602, identifies the distance from the camera A 30 to the subject as the distance b 502, and the distance 601 between the camera A and the microphone array A. Is determined as the distance c500, and the difference angle β is calculated by substituting it into each equation of the cosine theorem 90.

そして、マイクアレイ制御部220は、差分角βの方向が含まれるマイクロホン420を集音方向のマイクロホンとして特定し、当該マイクロホンに隣接するマイクロホン420についても特定する。そして、ステップS005にて受け取った画角の情報と、マイクアレイ出力レベルテーブル650の情報と、を用いてマイクアンプ430の出力レベル(マイクゲイン設定値)を特定する。なお、集音方向のマイクロホンの感度(ゲイン)を他のいずれのマイクロホンの感度よりも高く設定し、集音方向のマイクロホンおよび集音方向のマイクロホンに隣接するマイクロホン以外のマイクロホンの感度(ゲイン)を他のいずれのマイクロホンの感度よりも低く設定することで、より発言者の発言内容を高品質に得ることができる。   Then, the microphone array control unit 220 identifies the microphone 420 including the direction of the difference angle β as the microphone in the sound collection direction, and also identifies the microphone 420 adjacent to the microphone. Then, the output level (microphone gain setting value) of the microphone amplifier 430 is specified using the field angle information received in step S005 and the information in the microphone array output level table 650. Note that the sensitivity (gain) of the microphone in the sound collection direction is set higher than the sensitivity of any other microphone, and the sensitivity (gain) of the microphone other than the microphone in the sound collection direction and the microphone adjacent to the microphone in the sound collection direction is set. By setting the sensitivity lower than the sensitivity of any other microphone, the speech content of the speaker can be obtained with higher quality.

以上が、マイクアレイ設定算出処理の原理および処理内容である。   The above is the principle and processing content of the microphone array setting calculation processing.

以上、本発明に係る第一の実施形態を適用したマイクロホン制御装置を含むテレビ会議システム1について説明した。第一の実施形態を適用したマイクロホン制御装置である会議端末A20、B21、C22によると、カメラとマイクが独立して配置されている状態において、被写体の方向にマイク感度を高めることができるため、集音の品質を向上させることができるといえる。   The video conference system 1 including the microphone control device to which the first embodiment according to the present invention is applied has been described above. According to the conference terminals A20, B21, and C22 that are microphone control devices to which the first embodiment is applied, the microphone sensitivity can be increased in the direction of the subject in a state where the camera and the microphone are arranged independently. It can be said that the quality of sound collection can be improved.

本発明は、上記第一の実施形態に制限されない。上記第一の実施形態は、本発明の技術的思想の範囲内で様々な変形が可能である。例えば、上記第一の実施形態においては、会議端末A20は、画角に応じて集音方向のマイクアンプの出力レベルを特定している。しかし、これに限られず、マイクアレイから発言者までの距離に応じて出力レベルを調整するようにしてもよい。例えば、図11に示す出力レベル調整テーブル700をマイクアレイ位置データメモリ230に格納しておき、マイクアレイ設定算出処理において算出した出力レベルを調整ようにしてもよい。これにより、より適切な出力レベルを設定することができるため、適切な音質を確保することができるといえる。   The present invention is not limited to the first embodiment. The first embodiment described above can be variously modified within the scope of the technical idea of the present invention. For example, in the first embodiment, the conference terminal A20 specifies the output level of the microphone amplifier in the sound collection direction according to the angle of view. However, the present invention is not limited to this, and the output level may be adjusted according to the distance from the microphone array to the speaker. For example, the output level adjustment table 700 shown in FIG. 11 may be stored in the microphone array position data memory 230, and the output level calculated in the microphone array setting calculation process may be adjusted. As a result, a more appropriate output level can be set, so that it can be said that an appropriate sound quality can be ensured.

具体的に説明すると、出力レベル調整テーブル700は、マイクアレイから発言者までの距離701に応じて、集音方向として選択されたマイクロホンの出力レベル702が対応付けて記憶されている。マイクアレイ制御部220は、マイクアレイA40から発言者までの距離、すなわち距離aを余弦定理90により算出すると、出力レベル調整テーブル700を用いて当該距離aに応じてマイクロホンの出力レベルを取得する。なお、マイクアレイ制御部220は、マイクアレイ出力レベルテーブル650と画角とを用いて特定した集音方向のマイクロホンの出力レベル以下の範囲内で、出力レベルを設定するものとする。そして、マイクアレイ制御部220は、取得した出力レベルでマイクゲイン設定指示を行う。   Specifically, the output level adjustment table 700 stores the output level 702 of the microphone selected as the sound collection direction in association with the distance 701 from the microphone array to the speaker. When the microphone array control unit 220 calculates the distance from the microphone array A40 to the speaker, that is, the distance a by the cosine theorem 90, the microphone array control unit 220 acquires the output level of the microphone according to the distance a using the output level adjustment table 700. Note that the microphone array control unit 220 sets the output level within a range equal to or smaller than the output level of the microphone in the sound collection direction specified using the microphone array output level table 650 and the angle of view. Then, the microphone array control unit 220 issues a microphone gain setting instruction at the acquired output level.

すなわち、当該変形実施形態によると、マイクアレイA40の集音方向、集音範囲の制御だけでなく、発言者の背景雑音低減をも行うことができるといえる。   That is, according to the modified embodiment, it can be said that not only the sound collection direction and sound collection range of the microphone array A40 but also the background noise of the speaker can be reduced.

例を挙げると、図12に示すように、マイクアレイA40の集音可能範囲520が会議参加者の着座位置に対して十分に広い範囲であるとする。この場合、第一の実施形態におけるマイクロホン制御装置での集音範囲制御実施後のマイクアレイA40の集音範囲は制御後の集音範囲521となる。この時、集音方向として選択されたマイクロホン420の出力レベルを、図11で示されるテーブルを用いて低減させることにより、マイクアレイA40の集音範囲は集音範囲522に減少する。つまり、発言者の背後に発生する雑音を低減することができる。   For example, as shown in FIG. 12, it is assumed that the sound collection possible range 520 of the microphone array A40 is sufficiently wide with respect to the seating position of the conference participant. In this case, the sound collection range of the microphone array A40 after the sound collection range control by the microphone control device in the first embodiment is the sound collection range 521 after the control. At this time, the sound collection range of the microphone array A40 is reduced to the sound collection range 522 by reducing the output level of the microphone 420 selected as the sound collection direction using the table shown in FIG. That is, the noise generated behind the speaker can be reduced.

ここまで説明した実施形態においては、マイクアレイA40を会議卓上に配置し、カメラA30を会議卓端に配置するものとしているが、マイクアレイA40の集音範囲内、カメラA30の撮影範囲内であって、かつカメラA30で撮影可能な位置に会議参加者がいるのであれば、それぞれをどこに置いても構わない。また、本実施例において説明した会議端末A20内の各部の機能を、カメラA30またはマイクアレイA40に分散させて内蔵し、カメラA30とマイクアレイA40間で連携して処理を行うようにしても良い。さらに、本発明はテレビ会議システムだけではなく、ネットワーク監視カメラを用いた監視システムでも同様に適用することができる。   In the embodiments described so far, the microphone array A40 is arranged on the conference table and the camera A30 is arranged on the end of the conference table. However, the microphone array A40 is within the sound collection range of the microphone array A40 and the shooting range of the camera A30. As long as there are conference participants at positions where the camera A30 can capture images, they can be placed anywhere. Further, the functions of the respective units in the conference terminal A20 described in the present embodiment may be distributed and incorporated in the camera A30 or the microphone array A40, and processing may be performed in cooperation between the camera A30 and the microphone array A40. . Furthermore, the present invention can be similarly applied not only to a video conference system but also to a surveillance system using a network surveillance camera.

また、上記した実施形態の変形は、単独で適用されてもよいし、部分的に組み合わされて適用されるようにしてもよい。   In addition, the above-described modification of the embodiment may be applied alone, or may be applied in a partial combination.

以上、本発明について、実施形態を中心に説明した。なお、上記の実施形態では、インターネット等の通信はHTTPやFTP、SIP、POP、SMTP、TCP/IP等の既存のプロトコルによる通信を想定しているが、これに限らず、他のプロトコルによる通信であってもよい。   In the above, this invention was demonstrated centering on embodiment. In the above embodiment, communication such as the Internet is assumed to be communication using an existing protocol such as HTTP, FTP, SIP, POP, SMTP, TCP / IP, etc. It may be.

1・・・テレビ会議システム、10・・・会議室A、11・・・会議室B、12・・・会議室C、20・・・会議端末A、21・・・会議端末B、22・・・会議端末C、30・・・カメラA、31・・・カメラB、32・・・カメラC、40・・・マイクアレイA、41・・・マイクアレイB、42・・・マイクアレイC、50・・・ディスプレイA、51・・・ディスプレイB、52・・・ディスプレイC、60・・・スピーカーA、61・・・スピーカーB、62・・・スピーカーC、70・・・ネットワーク、80・・・サーバー、90・・・余弦定理、340・・・初期設定映像、350・・・スコープ、420a-420l・・・マイクロホン、430a-430l・・・マイクアンプ、500・・・距離c、501・・・設置方向、502・・・距離b、503・・・パン角度、504・・・差分角α、505・・・画角、520・・・集音可能範囲、521・・・集音範囲、522・・・集音範囲、600・・・マイクアレイ位置テーブル、650・・・マイクアレイ出力レベルテーブル、700・・・出力レベル調整テーブル DESCRIPTION OF SYMBOLS 1 ... Video conference system, 10 ... Conference room A, 11 ... Conference room B, 12 ... Conference room C, 20 ... Conference terminal A, 21 ... Conference terminal B, 22. ..Conference terminal C, 30 ... Camera A, 31 ... Camera B, 32 ... Camera C, 40 ... Microphone array A, 41 ... Microphone array B, 42 ... Microphone array C 50 ... Display A, 51 ... Display B, 52 ... Display C, 60 ... Speaker A, 61 ... Speaker B, 62 ... Speaker C, 70 ... Network, 80 ... Server, 90 ... Cosine theorem, 340 ... Initial setting video, 350 ... Scope, 420a-420l ... Microphone, 430a-430l ... Microphone amplifier, 500 ... Distance c, 501 ... How to install 502 b Distance 503 Pan angle 504 Difference angle α 505 Angle of view 520 Sound collection range 521 Sound collection range 522 Sound collection range, 600: microphone array position table, 650: microphone array output level table, 700: output level adjustment table

Claims (13)

左右へのパン動作可能なイメージ取得手段と、
集音範囲を変更可能な集音手段と、を制御する制御装置であって、
前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更手段を備える、
ことを特徴とする制御装置。
Image acquisition means that can pan left and right;
A control device for controlling sound collection means capable of changing a sound collection range,
The distance between the position of the image acquisition means and the position of the subject reflected in the image acquired by the image acquisition means, the pan direction of the image acquisition means, the position of the image acquisition means, and the sound collection means A sound collection range changing means for changing a sound collection range of the sound collecting means using a distance between the sound collecting means and a direction of the position of the sound collecting means with reference to the position of the image acquisition means. ,
A control device characterized by that.
請求項1に記載の制御装置であって、
前記集音範囲変更手段は、
前記集音手段の位置からみた前記被写体の方向を特定して当該方向に集音範囲を変更する、
ことを特徴とする制御装置。
The control device according to claim 1,
The sound collection range changing means includes
Identify the direction of the subject as seen from the position of the sound collection means and change the sound collection range in that direction;
A control device characterized by that.
請求項1または2に記載の制御装置であって、
前記集音範囲変更手段は、
前記集音手段の位置と前記被写体との間の距離を求め、当該距離に応じて前記集音手段のゲインを調整する、
ことを特徴とする制御装置。
The control device according to claim 1 or 2,
The sound collection range changing means includes
Obtaining a distance between the position of the sound collecting means and the subject, and adjusting the gain of the sound collecting means according to the distance;
A control device characterized by that.
請求項1〜3のいずれか一項に記載の制御装置であって、
前記集音手段は、所定の集音範囲を有する複数のマイクロホンを備え、
前記集音範囲変更手段は、前記マイクロホンごとのゲインを調整することで集音範囲を変更する、
ことを特徴とする制御装置。
The control device according to any one of claims 1 to 3,
The sound collection means includes a plurality of microphones having a predetermined sound collection range,
The sound collection range changing means changes the sound collection range by adjusting a gain for each microphone.
A control device characterized by that.
請求項4に記載の制御装置であって、
前記集音範囲変更手段は、前記被写体の方向を集音するマイクロホンのゲインを、他の方向を集音するマイクロホンのゲインよりも高く設定する、
ことを特徴とする制御装置。
The control device according to claim 4,
The sound collection range changing means sets a gain of a microphone that collects the direction of the subject higher than a gain of a microphone that collects the sound in another direction.
A control device characterized by that.
請求項1〜5のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記イメージ取得手段から画角を特定する情報を取得し、取得した画角に応じて前記集音範囲を変更する、
ことを特徴とする制御装置。
The control device according to any one of claims 1 to 5,
The sound collection range changing means acquires information for specifying an angle of view from the image acquisition means, and changes the sound collection range according to the acquired angle of view.
A control device characterized by that.
請求項6に記載の制御装置であって、
前記集音範囲変更手段は、前記画角が狭いほど前記集音範囲の感度を高めて集音する、
ことを特徴とする制御装置。
The control device according to claim 6,
The sound collection range changing means collects sound by increasing the sensitivity of the sound collection range as the angle of view is narrower.
A control device characterized by that.
請求項1〜7のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向に基づき、前記イメージ取得手段のパンの方向との差分を算出し、余弦定理を用いて被写体の方向を特定し、前記集音範囲を変更する、
ことを特徴とする制御装置。
The control device according to any one of claims 1 to 7,
The sound collection range changing means calculates a difference with the pan direction of the image acquisition means based on the direction of the position of the sound collection means with respect to the position of the image acquisition means, and uses the cosine theorem to calculate the subject. Identify the direction of the and change the sound collection range,
A control device characterized by that.
請求項1〜8のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記イメージ取得手段のパン動作が所定の時間なされない場合に、前記集音範囲の変更を行う、
ことを特徴とする制御装置。
The control device according to any one of claims 1 to 8,
The sound collection range changing means changes the sound collection range when the pan operation of the image acquisition means is not performed for a predetermined time.
A control device characterized by that.
請求項1〜9のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記集音範囲の変更を行う間、前記イメージ取得手段のパン動作を無効にする、
ことを特徴とする制御装置。
The control device according to any one of claims 1 to 9,
The sound collection range changing means invalidates a pan operation of the image acquisition means while changing the sound collection range;
A control device characterized by that.
左右へのパン動作手段を備える撮像装置と、
集音範囲の変更手段を備える集音装置と、
前記撮像装置および前記集音装置を制御する制御装置と、を備え、
前記制御装置は、
前記撮像装置の位置と前記撮像装置により取得される映像に映りこむ被写体の位置との間の距離と、前記撮像装置のパンの方向と、前記撮像装置の位置と前記集音装置の位置との間の距離と、前記撮像装置の位置を基準とした前記集音装置の位置の方向と、を用いて前記集音装置の集音範囲を変更するよう指示する集音範囲変更指示手段を備える、
ことを特徴とする制御システム。
An imaging device comprising a left and right panning means;
A sound collecting device comprising means for changing the sound collecting range;
A control device for controlling the imaging device and the sound collecting device,
The controller is
The distance between the position of the imaging device and the position of the subject reflected in the video acquired by the imaging device, the pan direction of the imaging device, the position of the imaging device, and the position of the sound collector A sound collection range change instructing unit that instructs to change the sound collection range of the sound collection device using a distance between the sound collection device and a direction of the sound collection device position with respect to the position of the imaging device.
A control system characterized by that.
左右へのパン動作を行うパン動作手段と、
撮影している画角を変更する動作を行う画角変更動作手段と、
パン方向を特定するパン方向情報を取得するパン方向情報取得手段と、
被写体までの距離を特定する距離情報を取得する距離情報取得手段と、
撮影している画角を特定する画角情報を取得する画角情報取得手段と、
前記パン方向情報と、前記距離情報と、前記画角情報と、を出力する出力手段と、を備え、
前記出力手段は、前記パン動作手段および前記画角変更動作手段のいずれの動作も終了して所定の時間経過した場合に、前記出力を行う、
ことを特徴とする撮像装置。
Panning means for panning left and right;
An angle-of-view changing operation means for changing the angle of view being shot;
Pan direction information acquisition means for acquiring pan direction information for specifying the pan direction;
Distance information acquisition means for acquiring distance information for specifying the distance to the subject;
Angle-of-view information acquisition means for acquiring angle-of-view information for specifying the angle of view being shot;
An output means for outputting the pan direction information, the distance information, and the angle of view information;
The output means performs the output when a predetermined time elapses after completion of both the pan operation means and the angle of view change operation means.
An imaging apparatus characterized by that.
左右へのパン動作可能なイメージ取得手段と、
集音範囲を変更可能な集音手段と、を制御する制御装置の制御方法であって、
前記制御装置は、
前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更ステップを実施する、
ことを特徴とする制御方法。
Image acquisition means that can pan left and right;
A sound collection means capable of changing a sound collection range, and a control method of a control device for controlling the sound collection range,
The controller is
The distance between the position of the image acquisition means and the position of the subject reflected in the image acquired by the image acquisition means, the pan direction of the image acquisition means, the position of the image acquisition means, and the sound collection means A sound collection range changing step of changing the sound collection range of the sound collecting means using the distance between the sound collecting means and the direction of the position of the sound collecting means relative to the position of the image acquisition means To
A control method characterized by that.
JP2011046686A 2011-03-03 2011-03-03 Control device, control system, and control method Withdrawn JP2012186551A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011046686A JP2012186551A (en) 2011-03-03 2011-03-03 Control device, control system, and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011046686A JP2012186551A (en) 2011-03-03 2011-03-03 Control device, control system, and control method

Publications (1)

Publication Number Publication Date
JP2012186551A true JP2012186551A (en) 2012-09-27

Family

ID=47016253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011046686A Withdrawn JP2012186551A (en) 2011-03-03 2011-03-03 Control device, control system, and control method

Country Status (1)

Country Link
JP (1) JP2012186551A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014125835A1 (en) 2013-02-15 2014-08-21 パナソニック株式会社 Directionality control system, calibration method, horizontal deviation angle computation method, and directionality control method
WO2014132533A1 (en) * 2013-03-01 2014-09-04 シャープ株式会社 Voice input device and image display device equipped with voice input device
JP2014207589A (en) * 2013-04-15 2014-10-30 シャープ株式会社 Voice input apparatus and image display apparatus
CN104243779A (en) * 2013-06-24 2014-12-24 松下电器产业株式会社 Directivity control system and sound output control method
EP2827610A2 (en) 2013-07-19 2015-01-21 Panasonic Corporation Directivity control system, directivity control method, sound collection system and sound collection control method
US9392036B2 (en) 2014-02-19 2016-07-12 Ricoh Company, Ltd. Terminal device and communication system
US20170133036A1 (en) * 2015-11-10 2017-05-11 Avaya Inc. Enhancement of audio captured by multiple microphones at unspecified positions
WO2017098773A1 (en) * 2015-12-11 2017-06-15 ソニー株式会社 Information processing device, information processing method, and program
JP2017229011A (en) * 2016-06-24 2017-12-28 日本電信電話株式会社 Mixing device, and method, program, and recording medium therefor
CN110493690A (en) * 2019-08-29 2019-11-22 北京搜狗科技发展有限公司 A kind of sound collection method and device
CN111277931A (en) * 2020-01-20 2020-06-12 东风汽车集团有限公司 Device capable of realizing automobile privacy communication function
CN114374903A (en) * 2020-10-16 2022-04-19 华为技术有限公司 Sound pickup method and sound pickup apparatus
WO2023093078A1 (en) * 2021-11-25 2023-06-01 华为技术有限公司 Broadcast-directing control method and apparatus, and storage medium and computer program product

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014125835A1 (en) 2013-02-15 2014-08-21 パナソニック株式会社 Directionality control system, calibration method, horizontal deviation angle computation method, and directionality control method
US10244162B2 (en) 2013-02-15 2019-03-26 Panasonic Intellectual Property Management Co., Ltd. Directionality control system, calibration method, horizontal deviation angle computation method, and directionality control method
US9860439B2 (en) 2013-02-15 2018-01-02 Panasonic Intellectual Property Management Co., Ltd. Directionality control system, calibration method, horizontal deviation angle computation method, and directionality control method
WO2014132533A1 (en) * 2013-03-01 2014-09-04 シャープ株式会社 Voice input device and image display device equipped with voice input device
JPWO2014132533A1 (en) * 2013-03-01 2017-02-02 シャープ株式会社 Voice input device and image display device provided with the voice input device
JP2014207589A (en) * 2013-04-15 2014-10-30 シャープ株式会社 Voice input apparatus and image display apparatus
US9747454B2 (en) 2013-06-24 2017-08-29 Panasonic Intellectual Property Management Co., Ltd. Directivity control system and sound output control method
CN104243779A (en) * 2013-06-24 2014-12-24 松下电器产业株式会社 Directivity control system and sound output control method
EP2819108A1 (en) 2013-06-24 2014-12-31 Panasonic Corporation Directivity control system and sound output control method
CN104243779B (en) * 2013-06-24 2018-11-09 松下电器产业株式会社 Directive property control system and sound output control method
EP2827610A2 (en) 2013-07-19 2015-01-21 Panasonic Corporation Directivity control system, directivity control method, sound collection system and sound collection control method
US9549244B2 (en) 2013-07-19 2017-01-17 Panasonic Intellectual Property Management Co., Ltd. Directivity control system, directivity control method, sound collection system and sound collection control method
US9392036B2 (en) 2014-02-19 2016-07-12 Ricoh Company, Ltd. Terminal device and communication system
US9832583B2 (en) * 2015-11-10 2017-11-28 Avaya Inc. Enhancement of audio captured by multiple microphones at unspecified positions
US20170133036A1 (en) * 2015-11-10 2017-05-11 Avaya Inc. Enhancement of audio captured by multiple microphones at unspecified positions
WO2017098773A1 (en) * 2015-12-11 2017-06-15 ソニー株式会社 Information processing device, information processing method, and program
JP2017229011A (en) * 2016-06-24 2017-12-28 日本電信電話株式会社 Mixing device, and method, program, and recording medium therefor
CN110493690A (en) * 2019-08-29 2019-11-22 北京搜狗科技发展有限公司 A kind of sound collection method and device
WO2021037129A1 (en) * 2019-08-29 2021-03-04 北京搜狗科技发展有限公司 Sound collection method and apparatus
CN111277931A (en) * 2020-01-20 2020-06-12 东风汽车集团有限公司 Device capable of realizing automobile privacy communication function
CN114374903A (en) * 2020-10-16 2022-04-19 华为技术有限公司 Sound pickup method and sound pickup apparatus
CN114374903B (en) * 2020-10-16 2023-04-07 华为技术有限公司 Sound pickup method and sound pickup apparatus
WO2023093078A1 (en) * 2021-11-25 2023-06-01 华为技术有限公司 Broadcast-directing control method and apparatus, and storage medium and computer program product

Similar Documents

Publication Publication Date Title
JP2012186551A (en) Control device, control system, and control method
US9516201B2 (en) Imaging control apparatus, imaging control method, and program
JP2018521593A5 (en)
US8390665B2 (en) Apparatus, system and method for video call
JP5379856B2 (en) Remote camera control method, system, and apparatus
JP2016114946A (en) Camera module
KR20120108747A (en) Monitoring camera for generating 3 dimensional scene and method thereof
JP2021078124A (en) Intelligent imaging system imaging control method, device, storage medium, and system
US9602758B2 (en) Communication apparatus, conference system, computer-readable recording medium, and display control method
KR101814714B1 (en) Method and system for remote control of camera in smart phone
JP2007124140A (en) Photographing device and communication conference system
JP2007081477A5 (en)
WO2021200184A1 (en) Information processing device, information processing method, and program
JP2017163301A (en) Imaging apparatus
JP2013141231A (en) Video conference apparatus and control method of video conference apparatus
JP2013016929A (en) Imaging apparatus, imaging method, and program
CN102308597B (en) Conference microphone system
JP2015106860A (en) Monitoring imaging system and program
JP2015144369A (en) Imaging system, imaging method, water tank and control terminal
JP2009171486A (en) Video conference system
US11245830B2 (en) Image capture apparatus and control method for same, and storage medium
KR101193129B1 (en) A real time omni-directional and remote surveillance system which is allowable simultaneous multi-user controls
WO2016151974A1 (en) Information processing device, information processing method, client device, server device, and information processing system
TW201740246A (en) Instruction input apparatus with panoramic photography function
JP2013141090A (en) Imaging apparatus and processing method of the same

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140513