JP2017092576A - Communication device, control method, and control program - Google Patents

Communication device, control method, and control program Download PDF

Info

Publication number
JP2017092576A
JP2017092576A JP2015217093A JP2015217093A JP2017092576A JP 2017092576 A JP2017092576 A JP 2017092576A JP 2015217093 A JP2015217093 A JP 2015217093A JP 2015217093 A JP2015217093 A JP 2015217093A JP 2017092576 A JP2017092576 A JP 2017092576A
Authority
JP
Japan
Prior art keywords
communication device
control
microphone
sound
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015217093A
Other languages
Japanese (ja)
Other versions
JP6645129B2 (en
Inventor
清人 五十嵐
Kiyoto Igarashi
清人 五十嵐
耕司 桑田
Koji Kuwata
耕司 桑田
高橋 仁人
Masahito Takahashi
仁人 高橋
智幸 後藤
Tomoyuki Goto
智幸 後藤
和紀 北澤
Kazuki Kitazawa
和紀 北澤
宣正 銀川
Nobumasa Gingawa
宣正 銀川
未来 袴谷
Miku Hakamatani
未来 袴谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2015217093A priority Critical patent/JP6645129B2/en
Publication of JP2017092576A publication Critical patent/JP2017092576A/en
Application granted granted Critical
Publication of JP6645129B2 publication Critical patent/JP6645129B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

PROBLEM TO BE SOLVED: To appropriately control a direction of a camera.SOLUTION: A communication device comprises a detection part, a directivity control part and an imaging control part. The detection part detects a generation source of a sound different from utterance at a position where the communication device is installed. The directivity control part performs control for reducing a sensitivity of a microphone that is directed towards the detected generation source, among a plurality of microphones mounted in the communication device. The imaging control part controls a direction of imaging by the camera in accordance with the control upon the microphone.SELECTED DRAWING: Figure 3

Description

本発明は、通信装置、制御方法及び制御プログラムに関する。   The present invention relates to a communication device, a control method, and a control program.

従来、インターネット等のネットワークを利用して、各拠点のユーザ間の会話を実現するテレビ会議のための通信システムが知られている。テレビ会議のための通信システムでは、各拠点に設置されたカメラやマイクによって収集された映像や音を、ネットワークに接続された各拠点の通信装置間で送受して、他の拠点の表示装置やスピーカから出力させることにより、拠点間でのテレビ会議を実現する。例えば、表示装置としては、プロジェクタや液晶パネルが利用されている。このようなテレビ会議では、より円滑な会話を実現することを目的として、マイクアレイ機能等により音を検知し、検知した音の音源方向にカメラの向きを制御する話者追尾機能を搭載した装置が利用されることがある。   2. Description of the Related Art Conventionally, a communication system for a video conference that realizes a conversation between users at each site using a network such as the Internet is known. In a communication system for video conferencing, video and sound collected by cameras and microphones installed at each site are transmitted and received between communication devices at each site connected to the network, and display devices at other sites are installed. Realize video conferencing between sites by outputting from speakers. For example, projectors and liquid crystal panels are used as display devices. In such a video conference, for the purpose of realizing a smoother conversation, a device equipped with a speaker tracking function that detects sound with a microphone array function etc. and controls the direction of the camera in the direction of the sound source of the detected sound May be used.

しかしながら、従来技術では、不要な方向にカメラの向きを制御してしまう可能性があるという問題がある。具体的には、従来技術では、マイクアレイ機能等により検知された音の方向にカメラの向きを制御しているものの、検知された音が実際には会議における話者の音声であるとは限られないため、話者ではない方向にカメラの向きを制御してしまう可能性がある。例えば、表示装置としてプロジェクタが利用される場合には、プロジェクタに搭載されたファンの回転によって発生する音が検知されることにより、プロジェクタの方向にカメラの向きが制御されてしまう可能性がある。一般に、話者の音声以外の音については、ノイズリダクション機能やノイズキャンセル機能等の音響処理機能により除去する処理が行なわれている。但し、音響処理機能を適用する場合には、話者の音声の音質が劣化してしまうことを避けるのは困難である。   However, the conventional technique has a problem that the direction of the camera may be controlled in an unnecessary direction. Specifically, in the prior art, the camera direction is controlled in the direction of the sound detected by the microphone array function or the like, but the detected sound is not necessarily the voice of the speaker in the conference. Therefore, there is a possibility that the direction of the camera is controlled in a direction that is not a speaker. For example, when a projector is used as a display device, there is a possibility that the direction of the camera is controlled in the direction of the projector by detecting the sound generated by the rotation of a fan mounted on the projector. In general, a sound other than the voice of a speaker is subjected to processing for removal by an acoustic processing function such as a noise reduction function or a noise cancellation function. However, when applying the acoustic processing function, it is difficult to avoid the deterioration of the sound quality of the speaker's voice.

本発明は、上記に鑑みてなされたものであって、カメラの向きを好適に制御することを目的とする。   The present invention has been made in view of the above, and an object thereof is to suitably control the orientation of a camera.

上述した課題を解決し、目的を達成するため、本発明に係る通信装置は、通信装置であって、前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出する検出部と、前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なう指向性制御部と、マイクに対する制御に応じて、カメラによる撮影の向きを制御する撮影制御部とを有する。   In order to solve the above-described problems and achieve the object, the communication device according to the present invention is a communication device, and a detection unit that detects a sound source different from speech at a base where the communication device is installed A directivity control unit that performs control to reduce the sensitivity of the microphone directed toward the detected generation source among the plurality of microphones mounted on the communication device, and a camera according to the control on the microphone A shooting control unit that controls the shooting direction.

本発明の一つの様態によれば、カメラの向きを好適に制御することができるという効果を奏する。   According to one aspect of the present invention, there is an effect that the direction of the camera can be suitably controlled.

図1は、実施の形態1に係る通信システムのシステム構成例を示す図である。FIG. 1 is a diagram illustrating a system configuration example of a communication system according to the first embodiment. 図2は、実施の形態1に係る通信装置のハードウェア構成例を示すブロック図である。FIG. 2 is a block diagram illustrating a hardware configuration example of the communication apparatus according to the first embodiment. 図3は、実施の形態1に係る通信装置の機能構成例を示すブロック図である。FIG. 3 is a block diagram illustrating a functional configuration example of the communication apparatus according to the first embodiment. 図4は、実施の形態1に係る通信装置による制御処理の流れの例を示すフローチャートである。FIG. 4 is a flowchart illustrating an example of a flow of control processing by the communication apparatus according to the first embodiment.

以下に添付図面を参照して、本発明に係る通信装置、制御方法及び制御プログラムの実施の形態を説明する。以下では、本発明に係る通信装置を適用した通信システムの一例として、地理的に離れた拠点間での会議を可能にするテレビ会議システムを例示する。但し、本発明は、複数の通信装置の間で映像や音を送受する各種の通信システム、及び、該通信システムで用いられる各種の通信装置に対して広く適用可能であり、以下の実施の形態により限定されるものではない。   Embodiments of a communication device, a control method, and a control program according to the present invention will be described below with reference to the accompanying drawings. Hereinafter, as an example of a communication system to which the communication device according to the present invention is applied, a video conference system that enables a conference between geographically distant bases will be exemplified. However, the present invention can be widely applied to various communication systems that transmit and receive video and sound between a plurality of communication devices, and various communication devices used in the communication systems. It is not limited by.

(実施の形態1)
[実施の形態1に係るシステム構成]
図1を用いて、実施の形態1に係る通信システムの構成を説明する。図1は、実施の形態1に係る通信システムのシステム構成例を示す図である。
(Embodiment 1)
[System Configuration According to Embodiment 1]
The configuration of the communication system according to the first embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating a system configuration example of a communication system according to the first embodiment.

図1に示すように、通信システム1には、複数の拠点に設置された通信装置100と、中継装置200とが含まれる。複数の拠点に設置された通信装置100と、中継装置200とは、インターネットやLAN(Local Area Network)等のネットワーク2に接続し、相互に通信可能である。これらのうち、通信システム1に含まれる通信装置100の台数は、テレビ会議等に参加する拠点数に対応する。図1では、拠点A、拠点B及び拠点Cのそれぞれに通信装置100が設置されている場合を例に挙げている。   As shown in FIG. 1, the communication system 1 includes a communication device 100 installed at a plurality of bases and a relay device 200. The communication device 100 and the relay device 200 installed at a plurality of bases are connected to a network 2 such as the Internet or a LAN (Local Area Network) and can communicate with each other. Among these, the number of communication devices 100 included in the communication system 1 corresponds to the number of bases participating in a video conference or the like. In FIG. 1, the case where the communication apparatus 100 is installed in each of the base A, the base B, and the base C is taken as an example.

通信装置100は、中継装置200を介して、他拠点の通信装置100との間で各種情報を送受信する。また、通信装置100は、受信した情報の出力を制御する。例えば、出力される情報は、カメラによって撮影された各拠点の映像や、マイクによって収集された各拠点の音(主に、話者の音声)等である。通信装置100は、テレビ会議のための専用端末であっても良いし、PC(Personal Computer)やスマートフォン、タブレット端末等の汎用端末であっても良い。汎用端末は、本実施の形態に係る制御プログラムをインストールすることによって、アプリケーションの一つとして通信装置100の各機能を実現する。中継装置200は、各拠点に設置された複数の通信装置100の間における映像や音等の各種情報の伝送を中継するサーバ装置等である。   The communication device 100 transmits and receives various types of information to and from the communication device 100 at another site via the relay device 200. Further, the communication device 100 controls the output of the received information. For example, the output information is video of each base taken by a camera, sound of each base collected by a microphone (mainly the voice of a speaker), and the like. The communication device 100 may be a dedicated terminal for a video conference, or may be a general-purpose terminal such as a PC (Personal Computer), a smartphone, or a tablet terminal. The general-purpose terminal implements each function of the communication apparatus 100 as one of the applications by installing the control program according to the present embodiment. The relay device 200 is a server device or the like that relays transmission of various types of information such as video and sound between a plurality of communication devices 100 installed at each base.

上述した構成において、通信装置100は、通信装置100が設置された拠点で、話者の発話とは異なる音の発生源を検出する。例えば、話者の発話とは異なる音とは、拠点に設置されたプロジェクタ等に搭載されたファンの回転によって発生する音である。ファンの回転によって発生する音は、他拠点の通信装置100に対して送信することは好ましくない。また、マイクアレイ機能等により音を検知し、検知した音の音源方向にカメラの向きを制御する話者追尾機能を適用する場合、ファンの回転によって音を発しているプロジェクタの方向にカメラの向きを制御することは好ましくない。これらのことから、通信装置100は、発話以外の音の発生源を検出している。   In the configuration described above, the communication device 100 detects a sound source that is different from the speaker's utterance at the site where the communication device 100 is installed. For example, the sound different from the speaker's utterance is a sound generated by the rotation of a fan mounted on a projector or the like installed at the base. It is not preferable to transmit the sound generated by the rotation of the fan to the communication device 100 at another site. In addition, when applying a speaker tracking function that detects sound with a microphone array function, etc., and controls the camera direction in the direction of the detected sound source, the camera direction is in the direction of the projector that is generating sound by the rotation of the fan. It is not preferable to control this. From these things, the communication apparatus 100 has detected the generation sources of sound other than speech.

そして、通信装置100は、通信装置100に搭載された複数のマイクのうち、検出された発生源の方向に向けられたマイクの感度を低下させる制御を行なう。例えば、通信装置100は、複数のマイクを搭載しており、複数のマイクによってマイクアレイ機能を実現する。マイクアレイ機能を有する通信装置100は、ファンの回転によって音を発しているプロジェクタ等の発生源の方向に向けられているマイクの感度を低下させる。これにより、マイクアレイ機能の指向性を制御することによる音の収集において、発話以外の音の収集を抑制することができる。   Then, communication device 100 performs control to reduce the sensitivity of the microphone directed toward the detected generation source among the plurality of microphones mounted on communication device 100. For example, the communication apparatus 100 is equipped with a plurality of microphones, and a microphone array function is realized by the plurality of microphones. The communication device 100 having the microphone array function reduces the sensitivity of the microphone directed toward the generation source such as a projector that emits sound by the rotation of the fan. Thereby, in the collection of sound by controlling the directivity of the microphone array function, it is possible to suppress the collection of sounds other than speech.

続いて、通信装置100は、マイクに対する制御に応じて、カメラによる撮影の向きを制御する。例えば、発話以外の音の発生源等であるプロジェクタの方向に向けられているマイクの感度を低下させるマイクアレイ機能の指向性制御に応じて、話者追尾機能により、カメラによる撮影の向きを制御する。これにより、プロジェクタ等に向けられているマイクの感度を低下させるため、カメラによる撮影の向きを、プロジェクタ等の方向に制御することを抑制することができる。その後、通信装置100は、カメラの撮影によって取得された映像と、マイクに対する制御によって収集された音とを含む出力情報を、他の拠点に設置された通信装置100に対して送信する。   Subsequently, the communication apparatus 100 controls the direction of shooting by the camera according to the control with respect to the microphone. For example, the direction of shooting by the camera is controlled by the speaker tracking function according to the directivity control of the microphone array function that reduces the sensitivity of the microphone directed toward the projector, which is the source of sound other than speech. To do. Thereby, since the sensitivity of the microphone directed to the projector or the like is lowered, it is possible to suppress the direction of photographing by the camera from being controlled to the direction of the projector or the like. Thereafter, the communication device 100 transmits output information including video acquired by camera shooting and sound collected by control of the microphone to the communication device 100 installed at another base.

つまり、通信装置100は、テレビ会議等において、発話とは異なる音の発生源を検出し、検出した発生源に向けられているマイクの感度を低下させるマイクアレイ機能の指向性制御に応じて、カメラの向きを制御するので、カメラの向きを好適に制御することができる。換言すると、通信装置100は、会議等における発話以外の音の収集を抑制することで、カメラによる撮影の向きを、発話以外の音の発生源の方向に制御することを抑制することができる。   That is, the communication device 100 detects a sound generation source different from an utterance in a video conference or the like, and according to directivity control of the microphone array function that reduces the sensitivity of the microphone directed to the detected generation source, Since the orientation of the camera is controlled, the orientation of the camera can be suitably controlled. In other words, the communication device 100 can suppress the control of the direction of shooting by the camera to the direction of the sound source other than the utterance by suppressing the collection of sound other than the utterance in the conference or the like.

[実施の形態1に係る通信装置のハードウェア構成]
次に、図2を用いて、実施の形態1に係る通信装置100のハードウェア構成を説明する。図2は、実施の形態1に係る通信装置100のハードウェア構成例を示すブロック図である。
[Hardware Configuration of Communication Device According to Embodiment 1]
Next, the hardware configuration of communication apparatus 100 according to Embodiment 1 will be described using FIG. FIG. 2 is a block diagram illustrating a hardware configuration example of the communication apparatus 100 according to the first embodiment.

図2に示すように、通信装置100は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、SSD(Solid State Drive)15と、メディアドライブ17と、操作ボタン18と、電源スイッチ19とを有する。加えて、通信装置100は、ネットワークI/F21と、カメラ22と、撮像素子I/F23と、マイクアレイ24と、スピーカ25と、音声入出力I/F26と、ディスプレイI/F27と、外部機器接続I/F28とを有する。   As shown in FIG. 2, the communication device 100 includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, an SSD (Solid State Drive) 15, and a media drive. 17, an operation button 18, and a power switch 19. In addition, the communication device 100 includes a network I / F 21, a camera 22, an image sensor I / F 23, a microphone array 24, a speaker 25, a voice input / output I / F 26, a display I / F 27, and an external device. Connection I / F28.

CPU11は、通信装置100全体の動作を制御する。CPU11は、ROM12等に記憶されたプログラムを、RAM13等を作業領域として実行することで、通信装置100全体の動作を制御する。ROM12は、通信装置100による処理を実現するためのプログラムを記憶する。RAM13は、ROM12等に格納されたプログラムの実行時の作業領域である。SSD15は、各種プログラムや各種データを記憶可能なフラッシュメモリ14に対する、データの読み出しや書き込みを制御する。メディアドライブ17は、記録メディア16に対するデータの読み出しや書き込み(記録)を制御する。   The CPU 11 controls the overall operation of the communication device 100. The CPU 11 controls the overall operation of the communication apparatus 100 by executing a program stored in the ROM 12 or the like using the RAM 13 or the like as a work area. The ROM 12 stores a program for realizing processing by the communication device 100. The RAM 13 is a work area when executing a program stored in the ROM 12 or the like. The SSD 15 controls reading and writing of data with respect to the flash memory 14 capable of storing various programs and various data. The media drive 17 controls reading and writing (recording) of data with respect to the recording medium 16.

操作ボタン18は、通信装置100の通信先となる他拠点の通信装置100の選択や、この他の各種設定のために操作される。電源スイッチ19は、通信装置100の電源の投入と切断とを切り替えるためのものである。ネットワークI/F21は、ネットワーク2への接続や、各種情報の送受信を制御するためのインタフェースである。カメラ22は、拠点内を撮影する。撮像素子I/F23は、CPU11による制御に従って、カメラ22の駆動を制御するためのインタフェースである。例えば、カメラ22は、マイクアレイ機能によって検出された音の方向に追従して、撮影方向の切り替えができる構成となっている。一つの様態として、カメラ22は、全方位カメラを適用することができるが、これに限定されるものではない。なお、撮影方向の切り替えについては、デジタル式とアナログ式との何れであっても良い。   The operation button 18 is operated to select the communication device 100 at another site that is the communication destination of the communication device 100 and other various settings. The power switch 19 is for switching between turning on and off the power of the communication apparatus 100. The network I / F 21 is an interface for controlling connection to the network 2 and transmission / reception of various information. The camera 22 photographs the inside of the base. The image sensor I / F 23 is an interface for controlling driving of the camera 22 in accordance with control by the CPU 11. For example, the camera 22 is configured to be able to switch the shooting direction following the direction of sound detected by the microphone array function. As one aspect, the camera 22 may be an omnidirectional camera, but is not limited thereto. Note that the switching of the shooting direction may be either digital or analog.

マイクアレイ24は、複数のマイクで構成されたマイクアレイ機能により拠点内の音を収集し、収集した音を通信装置100に入力する。スピーカ25は、音を出力する。音声入出力I/F26は、CPU11による制御に従って、マイクアレイ24に対する指向性を制御して信号(主に、音声信号)の入力を処理するとともに、スピーカ25の音量等を制御して信号の出力を処理するためのインタフェースである。ディスプレイI/F27は、CPU11による制御に従って、表示装置50に表示させる映像のデータを伝送するためのインタフェースである。例えば、表示装置50は、通信装置100に外付けされるプロジェクタや液晶パネル等である。外部機器接続I/F28は、各種の外部機器を通信装置100に接続するためのインタフェースである。また、通信装置100は、上記各部を電気的に接続するためのアドレスバスやデータバス等のバス20を有する。なお、図2に示したハードウェア構成は一例であり、上記以外のハードウェアを追加しても良い。   The microphone array 24 collects sounds in the base by a microphone array function including a plurality of microphones, and inputs the collected sounds to the communication device 100. The speaker 25 outputs sound. The voice input / output I / F 26 controls the directivity with respect to the microphone array 24 according to control by the CPU 11 to process input of signals (mainly voice signals), and controls the volume of the speaker 25 and the like to output signals. It is an interface for processing. The display I / F 27 is an interface for transmitting video data to be displayed on the display device 50 under the control of the CPU 11. For example, the display device 50 is a projector or a liquid crystal panel that is externally attached to the communication device 100. The external device connection I / F 28 is an interface for connecting various external devices to the communication device 100. The communication device 100 also includes a bus 20 such as an address bus or a data bus for electrically connecting the above-described units. Note that the hardware configuration shown in FIG. 2 is an example, and hardware other than the above may be added.

[実施の形態1に係る通信装置の機能構成]
次に、図3を用いて、実施の形態1に係る通信装置100の機能構成を説明する。図3は、実施の形態1に係る通信装置100の機能構成例を示すブロック図である。
[Functional Configuration of Communication Device According to Embodiment 1]
Next, the functional configuration of the communication apparatus 100 according to Embodiment 1 will be described with reference to FIG. FIG. 3 is a block diagram illustrating a functional configuration example of the communication apparatus 100 according to the first embodiment.

図3に示すように、通信装置100は、操作入力受付部101と、表示制御部102と、音声出力制御部103と、検出部104と、判定部105と、指向性制御部106と、撮影制御部107と、音声入力制御部108と、送受信制御部109とを有する。上記各部は、ソフトウェア(プログラム)で実現されても良いし、ハードウェア回路で実現されても良い。また、上記各部は、例えば、フラッシュメモリ14等からRAM13上に展開された制御プログラムをCPU11が実行することにより実現される機能である。   As illustrated in FIG. 3, the communication device 100 includes an operation input receiving unit 101, a display control unit 102, an audio output control unit 103, a detection unit 104, a determination unit 105, a directivity control unit 106, and an imaging. A control unit 107, a voice input control unit 108, and a transmission / reception control unit 109 are included. Each of the above units may be realized by software (program) or a hardware circuit. Moreover, each said part is a function implement | achieved when CPU11 runs the control program expand | deployed on RAM13 from the flash memory 14 grade | etc., For example.

操作入力受付部101は、通信装置100を利用するユーザによる各種の操作入力を受け付ける。例えば、操作入力受付部101は、操作ボタン18や電源スイッチ19等に対するユーザ操作に応じて、各種設定に関する情報や電源制御のための情報の入力を受け付ける。   The operation input receiving unit 101 receives various operation inputs by a user who uses the communication device 100. For example, the operation input accepting unit 101 accepts input of information regarding various settings and information for power control in response to a user operation on the operation button 18, the power switch 19, and the like.

表示制御部102は、表示装置50に対する表示処理を制御する。例えば、表示制御部102は、他拠点の通信装置100から受け付けられた他拠点における映像に対し、描画処理等を実行し、処理したデータを表示装置50に対して出力する。これにより、表示装置50は、他拠点における映像を含んだ画像を表示出力する。   The display control unit 102 controls display processing for the display device 50. For example, the display control unit 102 performs drawing processing or the like on the video at the other site received from the communication device 100 at the other site, and outputs the processed data to the display device 50. As a result, the display device 50 displays and outputs an image including a video at another site.

音声出力制御部103は、スピーカ25に対する音の出力処理を制御する。例えば、音声出力制御部103は、他拠点の通信装置100から受け付けられた他拠点における音データを復号し、復号したデータ(主に、音声データ)をスピーカ25に対して出力する。これにより、スピーカ25は、他拠点における音声データを再生出力する。   The sound output control unit 103 controls sound output processing for the speaker 25. For example, the audio output control unit 103 decodes sound data at another site received from the communication device 100 at another site, and outputs the decoded data (mainly audio data) to the speaker 25. As a result, the speaker 25 reproduces and outputs the audio data at the other site.

検出部104は、発話とは異なる音の発生源を検出する。より具体的には、検出部104は、カメラ22によって撮影された映像に所定画像が含まれている場合に、所定画像が含まれる方向に、話者の発話とは異なる音の発生源が存在することを検出する。例えば、発話とは異なる音の発生源とは、プロジェクタ等の表示装置50を指す。また、例えば、所定画像とは、予め決められた文字や数字、記号等を含む画像を指す。通信装置100は、これらの文字や数字、記号等を予め保持している。すなわち、検出部104は、プロジェクタ等の表示装置50に貼り付けられているメーカのロゴタイプや製品型番等を所定画像の検出のために保持し、カメラ22によって撮影された映像に所定画像が含まれていれば、その方向に表示装置50が存在することを検出する。   The detection unit 104 detects a sound generation source different from the utterance. More specifically, when a predetermined image is included in the video captured by the camera 22, the detection unit 104 has a sound source different from the speaker's utterance in the direction including the predetermined image. Detect what to do. For example, the sound source different from the utterance refers to the display device 50 such as a projector. For example, the predetermined image refers to an image including predetermined characters, numbers, symbols, and the like. The communication device 100 holds these characters, numbers, symbols, and the like in advance. That is, the detection unit 104 holds a manufacturer's logo type, product model number, and the like attached to the display device 50 such as a projector for detection of a predetermined image, and the video captured by the camera 22 includes the predetermined image. If so, the presence of the display device 50 in that direction is detected.

プロジェクタ等にはファンが搭載されており、ファンの回転によって発生する音は会議において不要である。検出部104は、このような不要な音を発する発生源であるプロジェクタ等の有無や、存在する方向を検出する。なお、所定画像は、メーカのロゴタイプや製品型番に限られるものではない。具体的には、所定画像は、発話とは異なる音の発生源が検出できるのであれば何であっても良い。例えば、所定画像に二次元コード等を採用する場合、検出部104は、二次元コードから読み取った文字が予め保持している文字に合致すれば、二次元コードが含まれる映像の方向に発生源が存在することを検出する。なお、通信装置100に保持させる文字や記号等を、ユーザが事前に指定できるようにしても良いし、任意に追加・変更できるようにしても良い。   A projector or the like is equipped with a fan, and the sound generated by the rotation of the fan is unnecessary in a meeting. The detecting unit 104 detects the presence or absence of a projector or the like that is a source that generates such unnecessary sound, and the direction in which it exists. The predetermined image is not limited to the manufacturer's logo type or product model number. Specifically, the predetermined image may be anything as long as a sound source different from the utterance can be detected. For example, when a two-dimensional code or the like is employed for a predetermined image, the detection unit 104 generates a source in the direction of the video including the two-dimensional code if a character read from the two-dimensional code matches a character stored in advance. Detect that exists. Note that characters, symbols, and the like to be held in the communication apparatus 100 may be specified in advance by the user, or may be arbitrarily added / changed.

判定部105は、所定画像の大きさが所定閾値以上であるか否かを判定する。より具体的には、判定部105は、検出部104によって発話とは異なる音の発生源であるプロジェクタ等が検出された場合に、文字や数字、記号等である所定画像の大きさが所定閾値以上であるか否かを判定する。そして、判定部105は、所定画像の大きさが所定閾値以上である場合に、所定画像の大きさが所定閾値以上である旨を指向性制御部106に対して通知する。一方、通信装置100は、判定部105によって所定画像の大きさが所定閾値未満であると判定された場合に、処理を終了する。文字や数字、記号等の大きさを判定するための閾値は、通信装置100に予め保持されていても良いし、ユーザが事前に指定できるようにしても良いし、任意に変更できるようにしても良い。   The determination unit 105 determines whether or not the size of the predetermined image is greater than or equal to a predetermined threshold value. More specifically, when the detection unit 104 detects a projector or the like that is a sound source different from the utterance, the determination unit 105 determines that the size of a predetermined image such as a character, number, or symbol is a predetermined threshold value. It is determined whether it is above. Then, when the size of the predetermined image is equal to or greater than the predetermined threshold, the determination unit 105 notifies the directivity control unit 106 that the size of the predetermined image is equal to or greater than the predetermined threshold. On the other hand, when the determination unit 105 determines that the size of the predetermined image is less than the predetermined threshold, the communication device 100 ends the process. The threshold for determining the size of characters, numbers, symbols, etc. may be held in the communication device 100 in advance, or may be specified in advance by the user, or may be arbitrarily changed. Also good.

すなわち、判定部105は、プロジェクタ等に貼り付けられている文字や数字等の大きさが所定閾値以上であるか否かを判定することにより、プロジェクタ等と通信装置100との位置関係について、近くに設置されているか否かを判定する。例えば、文字や数字等の大きさが所定閾値以上であれば互いに近い位置に設置されているため、プロジェクタ等に搭載されたファンの回転によって話者追尾機能に影響を与える可能性がある。一方、文字や数字等の大きさが所定閾値未満であれば、通信装置100からプロジェクタ等までの距離が十分に離れているものとして、プロジェクタ等に搭載されたファンの回転による音は会議に不要な音にならないものとする。   In other words, the determination unit 105 determines whether the size of characters or numbers pasted on the projector or the like is equal to or greater than a predetermined threshold, and thus the positional relationship between the projector and the communication device 100 is close. It is determined whether or not it is installed. For example, if the size of letters, numbers, and the like is equal to or greater than a predetermined threshold, they are installed at positions close to each other, so that the speaker tracking function may be affected by the rotation of a fan mounted on a projector or the like. On the other hand, if the size of letters, numbers, etc. is less than the predetermined threshold, it is assumed that the distance from the communication device 100 to the projector etc. is sufficiently far away, and the sound due to the rotation of the fan mounted on the projector etc. is unnecessary for the conference It shall not be a sound.

指向性制御部106は、マイクアレイ24の複数のマイクのうち、発話とは異なる音の発生源の方向に向けられたマイクの感度を低下させる制御を行なう。より具体的には、指向性制御部106は、判定部105によって所定画像の大きさが所定閾値以上であると判定された場合に、発話とは異なる音の発生源であるプロジェクタ等の方向に向けられたマイクによって収集された音の音量が所定閾値以上であるか否かを判定する。そして、指向性制御部106は、音量が所定閾値以上である場合に、マイクアレイ24の複数のマイクのうち、プロジェクタ等の方向に向けられたマイクの感度を低下させるように、マイクアレイ機能の指向性を制御する。なお、指向性制御部106は、プロジェクタ等の方向に向けられたマイクによって収集された音の音量が所定閾値未満である場合には、処理を終了する。なお、音量を判定するための閾値は、通信装置100に予め保持されていても良いし、ユーザが事前に指定できるようにしても良いし、任意に変更できるようにしても良い。   The directivity control unit 106 performs control to reduce the sensitivity of the microphones directed to the direction of the sound generation source different from the utterance among the plurality of microphones of the microphone array 24. More specifically, when the determining unit 105 determines that the size of the predetermined image is equal to or greater than a predetermined threshold, the directivity control unit 106 moves in the direction of a projector or the like that is a sound generation source different from the utterance. It is determined whether or not the volume of sound collected by the directed microphone is equal to or greater than a predetermined threshold. Then, the directivity control unit 106 has a microphone array function so as to reduce the sensitivity of the microphones directed toward the projector or the like among the plurality of microphones of the microphone array 24 when the volume is equal to or higher than a predetermined threshold. Control directivity. The directivity control unit 106 ends the process when the volume of the sound collected by the microphone directed in the direction of the projector or the like is less than a predetermined threshold. Note that the threshold for determining the volume may be stored in advance in the communication apparatus 100, may be specified in advance by the user, or may be arbitrarily changed.

撮影制御部107は、マイクアレイ24に対する制御に応じて、カメラ22による撮影の向きを制御する。より具体的には、撮影制御部107は、指向性制御部106によって制御されたマイクアレイ機能の指向性に応じて、感度を低下させたマイクの方向の撮影を制限し、カメラ22による撮影の向きを制御する。例えば、感度を低下させたマイクの方向の撮影を禁止するように設定しても良いし、話者追尾機能が適用される場合は結果として感度を低下させたマイクの方向の撮影が抑制される。これらにより、発話とは異なる音の発生源となり得る表示装置50の方向に対しては、マイクアレイ24による音の収集や、カメラ22による撮影が制限されることになる。撮影制御部107は、カメラ22によって撮影された映像を送受信制御部109に対して出力する。   The shooting control unit 107 controls the direction of shooting by the camera 22 in accordance with control of the microphone array 24. More specifically, the shooting control unit 107 restricts shooting in the direction of the microphone with reduced sensitivity according to the directivity of the microphone array function controlled by the directivity control unit 106, and Control the orientation. For example, it may be set to prohibit shooting in the direction of the microphone with reduced sensitivity, and when the speaker tracking function is applied, shooting in the direction of the microphone with reduced sensitivity is suppressed as a result. . As a result, the sound collection by the microphone array 24 and the photographing by the camera 22 are restricted with respect to the direction of the display device 50 that can be a sound generation source different from the speech. The shooting control unit 107 outputs the video shot by the camera 22 to the transmission / reception control unit 109.

音声入力制御部108は、マイクアレイ24からの音の入力処理を制御する。例えば、音声入力制御部108は、マイクアレイ24によって収集された拠点内の音に対し、PCM(Pulse Code Modulation)等の任意の符号化フォーマットで符号化し、符号化したデータ(主に、音声データ)を送受信制御部109に対して出力する。   The sound input control unit 108 controls sound input processing from the microphone array 24. For example, the voice input control unit 108 encodes the sound in the base collected by the microphone array 24 with an arbitrary encoding format such as PCM (Pulse Code Modulation) and the encoded data (mainly the voice data). ) To the transmission / reception control unit 109.

送受信制御部109は、ネットワーク2を介して、中継装置200を経由して他拠点の通信装置100との間における各種情報の送受信を制御する。送受信制御部109は、一つの様態として「送信制御部」に対応する。例えば、送受信制御部109は、撮影制御部107によって出力された映像と、音声入力制御部108によって出力された音声データとを含む出力情報を、他拠点に設置された通信装置100に対して送信する。また、送受信制御部109は、他拠点に設置された通信装置100からの出力情報を受信する。送受信制御部109は、受信した出力情報に含まれる映像に関するデータについては表示制御部102に対して出力し、音声に関するデータについては音声出力制御部103に対して出力する。これらにより、表示制御部102や音声出力制御部103による制御によって、他拠点の映像や音声が出力される。また、通信装置100は、会議中、検出部104、判定部105、指向性制御部106及び撮影制御部107による処理を、一定時間の経過毎に繰り返し実行する。   The transmission / reception control unit 109 controls transmission / reception of various kinds of information to / from the communication device 100 at another site via the relay device 200 via the network 2. The transmission / reception control unit 109 corresponds to a “transmission control unit” as one aspect. For example, the transmission / reception control unit 109 transmits output information including the video output by the imaging control unit 107 and the audio data output by the audio input control unit 108 to the communication device 100 installed at another base. To do. Also, the transmission / reception control unit 109 receives output information from the communication device 100 installed at another base. The transmission / reception control unit 109 outputs data related to video included in the received output information to the display control unit 102 and outputs data related to audio to the audio output control unit 103. As a result, the video and audio of another base are output under the control of the display control unit 102 and the audio output control unit 103. In addition, the communication apparatus 100 repeatedly executes the processes by the detection unit 104, the determination unit 105, the directivity control unit 106, and the imaging control unit 107 during a certain period of time.

[実施の形態1に係る制御処理フロー]
次に、図4を用いて、実施の形態1に係る通信装置100による制御処理の流れを説明する。図4は、実施の形態1に係る通信装置100による制御処理の流れの例を示すフローチャートである。
[Control processing flow according to Embodiment 1]
Next, the flow of control processing by the communication apparatus 100 according to Embodiment 1 will be described with reference to FIG. FIG. 4 is a flowchart illustrating an example of a flow of control processing by the communication device 100 according to the first embodiment.

図4に示すように、通信装置100は、制御開始のための操作を受け付けた場合に(ステップS101:Yes)、カメラ22によって撮影された映像を入力する(ステップS102)。一方、通信装置100は、制御開始のための操作を受け付けていない場合に(ステップS101:No)、該操作の受け付け待ちの状態となる。そして、通信装置100は、撮影された映像に所定の文字が含まれているか否かを判定する(ステップS103)。このとき、通信装置100は、撮影された映像に所定の文字が含まれている場合に(ステップS103:Yes)、所定の文字を含む映像の方向に、発話とは異なる音の発生源が存在するものとして検出し、文字の大きさが所定閾値以上であるか否かを判定する(ステップS104)。一方、通信装置100は、撮影された映像に所定の文字が含まれていない場合に(ステップS103:No)、ステップS108の処理を実行する。   As illustrated in FIG. 4, when the communication device 100 receives an operation for starting control (step S101: Yes), the communication device 100 inputs an image captured by the camera 22 (step S102). On the other hand, when the communication device 100 has not received an operation for starting control (step S101: No), the communication device 100 is in a state of waiting for the operation. Then, the communication device 100 determines whether or not a predetermined character is included in the captured video (step S103). At this time, when a predetermined character is included in the captured video (step S103: Yes), the communication device 100 has a sound source different from the utterance in the direction of the video including the predetermined character. It is determined that the character size is equal to or greater than a predetermined threshold value (step S104). On the other hand, the communication apparatus 100 performs the process of step S108 when the predetermined | prescribed character is not contained in the image | photographed image | video (step S103: No).

続いて、通信装置100は、文字の大きさが所定閾値以上である場合に(ステップS104:Yes)、発話とは異なる音の発生源の方向に向けられたマイクによって収集された音を入力する(ステップS105)。一方、通信装置100は、文字の大きさが所定閾値未満である場合に(ステップS104:No)、ステップS108の処理を実行する。その後、通信装置100は、発話とは異なる音の発生源からの音の音量が所定閾値以上であるか否かを判定する(ステップS106)。このとき、通信装置100は、音量が所定閾値以上である場合に(ステップS106:Yes)、発話とは異なる音の発生源の方向に向けられたマイクの感度を低下させ、カメラ22による該方向の撮影を制限する(ステップS107)。一方、通信装置100は、音量が所定閾値未満である場合に(ステップS106:No)、ステップS108の処理を実行する。   Subsequently, when the size of the character is equal to or greater than the predetermined threshold (step S104: Yes), the communication device 100 inputs the sound collected by the microphone directed in the direction of the sound source different from the utterance. (Step S105). On the other hand, when the character size is less than the predetermined threshold (step S104: No), the communication device 100 executes the process of step S108. Thereafter, the communication apparatus 100 determines whether or not the volume of the sound from the sound source different from the utterance is equal to or higher than a predetermined threshold (step S106). At this time, when the volume is equal to or higher than the predetermined threshold (step S106: Yes), the communication apparatus 100 reduces the sensitivity of the microphone directed to the direction of the sound source different from the utterance, and the direction by the camera 22 Is restricted (step S107). On the other hand, when the volume is less than the predetermined threshold (step S106: No), the communication device 100 executes the process of step S108.

通信装置100は、制御終了のための操作を受け付けたか否かを判定する(ステップS108)。このとき、通信装置100は、制御終了のための操作を受け付けていない場合に(ステップS108:No)、マイク及びカメラ22の制御から所定時間が経過したか否かを判定する(ステップS109)。一方、通信装置100は、制御終了のための操作を受け付けた場合に(ステップS108:Yes)、処理を終了する。また、通信装置100は、マイク及びカメラ22の制御から所定時間が経過した場合に(ステップS109:Yes)、ステップS102の処理を再度実行する。一方、通信装置100は、マイク及びカメラ22の制御から所定時間が経過していない場合に(ステップS109:No)、ステップS108の処理を実行する。   The communication device 100 determines whether an operation for ending control is accepted (step S108). At this time, when the operation for ending the control is not received (step S108: No), the communication device 100 determines whether or not a predetermined time has elapsed since the control of the microphone and the camera 22 (step S109). On the other hand, the communication apparatus 100 complete | finishes a process, when operation for control completion | finish is received (step S108: Yes). In addition, when a predetermined time has elapsed from the control of the microphone and the camera 22 (step S109: Yes), the communication device 100 executes the process of step S102 again. On the other hand, when the predetermined time has not elapsed since the control of the microphone and the camera 22 (step S109: No), the communication device 100 executes the process of step S108.

[実施の形態1による効果]
上述したように、通信装置100は、発話とは異なる音の発生源を検出し、検出された発生源の方向に向けられたマイクの感度を低下させるマイクアレイ機能の指向性を制御し、制御された指向性に応じて、カメラ22による撮影の向きを制御するので、カメラ22の向きを好適に制御することができる。
[Effects of Embodiment 1]
As described above, the communication apparatus 100 detects the sound source different from the utterance, and controls the directivity of the microphone array function for reducing the sensitivity of the microphone directed toward the detected source. Since the direction of shooting by the camera 22 is controlled according to the directivity, the direction of the camera 22 can be suitably controlled.

また、通信装置100は、カメラ22の撮影で得られた映像に、所定文字等が含まれている場合に、所定文字が含まれる方向に、発話とは異なる音の発生源が存在するものとして検出し、該所定文字の大きさが所定閾値以上である場合に、検出された発生源の方向に向けられたマイクの感度を低下させるマイクアレイ機能の指向性を制御する。この結果、通信装置100は、通信装置100と発生源との距離が近い場合に、発生源の方向に向けられたマイクの感度を低下させるので、発生源からの会議に不要な音が混入することを抑制することができる。   Further, the communication apparatus 100 assumes that when a video obtained by the camera 22 includes a predetermined character or the like, a sound source different from the utterance exists in a direction including the predetermined character. When the size of the predetermined character is detected and equal to or larger than a predetermined threshold value, the directivity of the microphone array function for reducing the sensitivity of the microphone directed toward the detected generation source is controlled. As a result, when the communication device 100 is close to the generation source, the communication device 100 reduces the sensitivity of the microphone directed toward the generation source, so that unnecessary sound is mixed in the conference from the generation source. This can be suppressed.

また、通信装置100は、発話とは異なる音の発生源の方向に向けられたマイクによって収集された音の音量が所定閾値以上である場合に、発生源の方向に向けられたマイクの感度を低下させるマイクアレイ機能の指向性を制御する。この結果、通信装置100は、発生源からの会議に不要な音が混入することをより高精度に抑制することができる。   Further, the communication device 100 increases the sensitivity of the microphone directed in the direction of the generation source when the volume of the sound collected by the microphone directed in the direction of the sound generation source different from the speech is equal to or greater than a predetermined threshold. Controls the directivity of the microphone array function to be lowered. As a result, the communication apparatus 100 can suppress the mixing of unnecessary sound in the conference from the generation source with higher accuracy.

(実施の形態2)
さて、これまで本発明に係る通信装置100の実施の形態について説明したが、上述した実施の形態以外にも種々の異なる形態にて実施されて良いものである。そこで、(1)構成、(2)プログラム、について異なる実施の形態を説明する。
(Embodiment 2)
Although the embodiments of the communication device 100 according to the present invention have been described so far, the present invention may be implemented in various different forms other than the above-described embodiments. Therefore, different embodiments of (1) configuration and (2) program will be described.

(1)構成
上記文書中や図面中等で示した処理手順、制御手順、具体的名称、各種のデータやパラメタ等を含む情報は、特記する場合を除いて任意に変更することができる。また、図示した装置の各構成要素は、機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、装置の分散又は統合の具体的形態は、図示のものに限られず、その全部又は一部を各種の負担や使用状況等に応じて、任意の単位で機能的又は物理的に、分散又は統合することができる。例えば、カメラ22については、通信装置100に搭載されていなくても良く、外部機器として通信装置100に接続されていれば良い。
(1) Configuration Information including processing procedures, control procedures, specific names, various data, parameters, and the like shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. Each component of the illustrated apparatus is functionally conceptual and does not necessarily need to be physically configured as illustrated. That is, the specific form of the distribution or integration of the devices is not limited to the illustrated one, and all or a part of the distribution or integration is functionally or physically distributed or arbitrarily in any unit according to various burdens or usage conditions. Can be integrated. For example, the camera 22 does not have to be mounted on the communication device 100 and may be connected to the communication device 100 as an external device.

また、上記実施の形態では、通信装置100の近傍に、発話とは異なる音の発生源となり得るプロジェクタ等の表示装置50が存在するか否かについて、映像に含まれる文字や数字、記号等の大きさによって判定したが、通信装置100の近傍にプロジェクタ等の表示装置50が存在するか否かを認識できれば、いかなる手段であっても良い。例えば、映像に含まれる文字や数字、記号間の幅や間隔をもとに、通信装置100の近傍にプロジェクタ等の表示装置50が存在するか否かを判定しても良い。   Further, in the above embodiment, whether or not there is a display device 50 such as a projector that can be a sound source different from the utterance in the vicinity of the communication device 100 such as letters, numbers, symbols, etc. Although it is determined based on the size, any means may be used as long as it can recognize whether or not the display device 50 such as a projector exists in the vicinity of the communication device 100. For example, it may be determined whether or not the display device 50 such as a projector is present in the vicinity of the communication device 100 based on the width and interval between characters, numbers, and symbols included in the video.

(2)プログラム
また、通信装置100で実行される制御プログラムは、一つの様態として、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。また、通信装置100で実行される制御プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしても良い。また、通信装置100で実行される制御プログラムをインターネット等のネットワーク経由で提供又は配布するように構成しても良い。また、通信装置100で実行される制御プログラムを、ROM等に予め組み込んで提供するように構成しても良い。
(2) Program The control program executed by the communication apparatus 100 is, as one form, a file in an installable format or an executable format as a CD-ROM, flexible disk (FD), CD-R, DVD ( And recorded on a computer-readable recording medium such as a digital versatile disk. The control program executed by the communication apparatus 100 may be stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. The control program executed by the communication apparatus 100 may be provided or distributed via a network such as the Internet. The control program executed by the communication device 100 may be provided by being incorporated in advance in a ROM or the like.

通信装置100で実行される制御プログラムは、上述した各部(検出部104、判定部105、指向性制御部106、撮影制御部107、送受信制御部109)を含むモジュール構成となっており、実際のハードウェアとしてはCPUが記憶媒体からプログラムを読み出して実行することにより、上記各部が主記憶装置上にロードされ、検出部104、判定部105、指向性制御部106、撮影制御部107、送受信制御部109が主記憶装置上に生成されるようになっている。   The control program executed by the communication device 100 has a module configuration including the above-described units (the detection unit 104, the determination unit 105, the directivity control unit 106, the imaging control unit 107, and the transmission / reception control unit 109). As the hardware, the CPU reads the program from the storage medium and executes it, so that the above-described units are loaded on the main storage device, and the detection unit 104, the determination unit 105, the directivity control unit 106, the imaging control unit 107, the transmission / reception control. The unit 109 is generated on the main storage device.

1 通信システム
100 通信装置
101 操作入力受付部
102 表示制御部
103 音声出力制御部
104 検出部
105 判定部
106 指向性制御部
107 撮影制御部
108 音声入力制御部
109 送受信制御部
200 中継装置
DESCRIPTION OF SYMBOLS 1 Communication system 100 Communication apparatus 101 Operation input reception part 102 Display control part 103 Audio | voice output control part 104 Detection part 105 Judgment part 106 Directivity control part 107 Shooting control part 108 Voice input control part 109 Transmission / reception control part 200 Relay apparatus

特許第5028944号公報Japanese Patent No. 5028944 特許第3140866号公報Japanese Patent No. 3140866 特許第5776313号公報Japanese Patent No. 5776313

Claims (8)

通信装置であって、
前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出する検出部と、
前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なう指向性制御部と、
マイクに対する制御に応じて、カメラによる撮影の向きを制御する撮影制御部と
を有することを特徴とする通信装置。
A communication device,
At a base where the communication device is installed, a detection unit that detects a sound generation source different from speech,
A directivity control unit that performs control to reduce the sensitivity of the microphone directed toward the detected generation source among the plurality of microphones mounted on the communication device;
And a shooting control unit that controls a shooting direction of the camera according to control of the microphone.
前記検出部は、前記カメラの撮影によって取得された映像に所定画像が含まれている場合に、前記所定画像が含まれる方向に前記発生源が存在することを検出することを特徴とする請求項1に記載の通信装置。   The said detection part detects that the said generation source exists in the direction in which the said predetermined image is included, when the predetermined image is contained in the image | video acquired by imaging | photography of the said camera. The communication apparatus according to 1. 前記所定画像の大きさが所定閾値以上であるか否かを判定する判定部をさらに有し、
前記指向性制御部は、前記所定画像の大きさが所定閾値以上であると判定された場合に、前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうことを特徴とする請求項2に記載の通信装置。
A determination unit for determining whether the size of the predetermined image is equal to or greater than a predetermined threshold;
The directivity control unit performs control to reduce sensitivity of a microphone directed toward the generation source when it is determined that the size of the predetermined image is equal to or greater than a predetermined threshold. Item 3. The communication device according to Item 2.
前記指向性制御部は、前記発生源の方向に向けられたマイクによって収集された音の音量が所定閾値以上である場合に、前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうことを特徴とする請求項1〜3の何れか一つに記載の通信装置。   The directivity control unit performs control to reduce the sensitivity of the microphone directed toward the source when the volume of sound collected by the microphone directed toward the source is equal to or greater than a predetermined threshold. The communication device according to claim 1, wherein the communication device is performed. 前記撮影制御部は、感度を低下させたマイクの方向の撮影を制限することを特徴とする請求項1〜4の何れか一つに記載の通信装置。   The communication apparatus according to claim 1, wherein the photographing control unit restricts photographing in the direction of the microphone with reduced sensitivity. 前記カメラの撮影によって取得された映像と、マイクに対する制御によって収集された音とを含む出力情報の、他の拠点に設置された通信装置に対する送信を制御する送信制御部をさらに有することを特徴とする請求項1〜5の何れか一つに記載の通信装置。   It further includes a transmission control unit that controls transmission of output information including video acquired by photographing with the camera and sound collected by controlling the microphone to a communication device installed at another base. The communication device according to any one of claims 1 to 5. 通信装置における制御方法であって、
前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出するステップと、
前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうステップと、
マイクに対する制御に応じて、カメラによる撮影の向きを制御するステップと
を含むことを特徴とする制御方法。
A control method in a communication device,
Detecting a sound source different from the utterance at the base where the communication device is installed;
Performing a control to reduce the sensitivity of the microphone directed toward the detected source among the plurality of microphones mounted on the communication device;
And a step of controlling a direction of photographing by the camera in accordance with control of the microphone.
通信装置に、
前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出するステップと、
前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうステップと、
マイクに対する制御に応じて、カメラによる撮影の向きを制御するステップと
を実行させるための制御プログラム。
In communication equipment,
Detecting a sound source different from the utterance at the base where the communication device is installed;
Performing a control to reduce the sensitivity of the microphone directed toward the detected source among the plurality of microphones mounted on the communication device;
A control program for executing the step of controlling the direction of shooting by the camera in accordance with the control of the microphone.
JP2015217093A 2015-11-04 2015-11-04 Communication device, control method, and control program Expired - Fee Related JP6645129B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015217093A JP6645129B2 (en) 2015-11-04 2015-11-04 Communication device, control method, and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015217093A JP6645129B2 (en) 2015-11-04 2015-11-04 Communication device, control method, and control program

Publications (2)

Publication Number Publication Date
JP2017092576A true JP2017092576A (en) 2017-05-25
JP6645129B2 JP6645129B2 (en) 2020-02-12

Family

ID=58769286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015217093A Expired - Fee Related JP6645129B2 (en) 2015-11-04 2015-11-04 Communication device, control method, and control program

Country Status (1)

Country Link
JP (1) JP6645129B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331827A (en) * 1998-05-12 1999-11-30 Fujitsu Ltd Television camera
US20030160862A1 (en) * 2002-02-27 2003-08-28 Charlier Michael L. Apparatus having cooperating wide-angle digital camera system and microphone array
JP2005151042A (en) * 2003-11-13 2005-06-09 Sony Corp Sound source position specifying apparatus, and imaging apparatus and imaging method
JP2005184386A (en) * 2003-12-18 2005-07-07 Sony Corp Sound collecting/video recording device
JP2005250397A (en) * 2004-03-08 2005-09-15 Nec Corp Robot
JP2006123161A (en) * 2004-09-30 2006-05-18 Samsung Electronics Co Ltd Audio video sensor fusion device and fusion method for grasping, tracking and separating position

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331827A (en) * 1998-05-12 1999-11-30 Fujitsu Ltd Television camera
US20030160862A1 (en) * 2002-02-27 2003-08-28 Charlier Michael L. Apparatus having cooperating wide-angle digital camera system and microphone array
JP2005151042A (en) * 2003-11-13 2005-06-09 Sony Corp Sound source position specifying apparatus, and imaging apparatus and imaging method
JP2005184386A (en) * 2003-12-18 2005-07-07 Sony Corp Sound collecting/video recording device
JP2005250397A (en) * 2004-03-08 2005-09-15 Nec Corp Robot
JP2006123161A (en) * 2004-09-30 2006-05-18 Samsung Electronics Co Ltd Audio video sensor fusion device and fusion method for grasping, tracking and separating position

Also Published As

Publication number Publication date
JP6645129B2 (en) 2020-02-12

Similar Documents

Publication Publication Date Title
US10848889B2 (en) Intelligent audio rendering for video recording
JP6489563B2 (en) Volume control method, system, device and program
US9792602B2 (en) Apparatus and method for providing emotion expression service in mobile communication terminal
US9648278B1 (en) Communication system, communication apparatus and communication method
US10079996B2 (en) Communication system, communication device, and communication method
JP2017034502A (en) Communication equipment, communication method, program, and communication system
JP6528574B2 (en) INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING PROGRAM
JP2017034312A (en) Communication device, communication system, and program
US8914007B2 (en) Method and apparatus for voice conferencing
JP6149433B2 (en) Video conference device, video conference device control method, and program
JP6645129B2 (en) Communication device, control method, and control program
JP6835205B2 (en) Shooting sound pickup device, sound pick-up control system, shooting sound pick-up device control method, and shooting sound pick-up control system control method
US11368611B2 (en) Control method for camera device, camera device, camera system, and storage medium
US9392036B2 (en) Terminal device and communication system
JP2016521471A (en) Mixed media from multimodal sensors
JP6029626B2 (en) Control device and control method
JP6500366B2 (en) Management device, terminal device, transmission system, transmission method and program
JP2018036688A (en) Information processing device, server device, information processing system, control method thereof, and program
US20120300126A1 (en) Electronic apparatus and tv phone method
JP2017168903A (en) Information processing apparatus, conference system, and method for controlling information processing apparatus
JP2017108287A (en) Communication device, control method and control program
JP2017158134A (en) Information processing apparatus, conference system, and method for controlling information processing apparatus
JP2008005028A (en) Video voice conference system and terminal
JP5857984B2 (en) Sound data processing device
JP6287230B2 (en) Communication system and communication management apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191223

R151 Written notification of patent or utility model registration

Ref document number: 6645129

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees