JP2017092576A - Communication device, control method, and control program - Google Patents
Communication device, control method, and control program Download PDFInfo
- Publication number
- JP2017092576A JP2017092576A JP2015217093A JP2015217093A JP2017092576A JP 2017092576 A JP2017092576 A JP 2017092576A JP 2015217093 A JP2015217093 A JP 2015217093A JP 2015217093 A JP2015217093 A JP 2015217093A JP 2017092576 A JP2017092576 A JP 2017092576A
- Authority
- JP
- Japan
- Prior art keywords
- communication device
- control
- microphone
- sound
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 138
- 238000000034 method Methods 0.000 title claims description 16
- 230000035945 sensitivity Effects 0.000 claims abstract description 23
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000003384 imaging method Methods 0.000 claims abstract description 9
- 230000005540 biological transmission Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Studio Devices (AREA)
Abstract
Description
本発明は、通信装置、制御方法及び制御プログラムに関する。 The present invention relates to a communication device, a control method, and a control program.
従来、インターネット等のネットワークを利用して、各拠点のユーザ間の会話を実現するテレビ会議のための通信システムが知られている。テレビ会議のための通信システムでは、各拠点に設置されたカメラやマイクによって収集された映像や音を、ネットワークに接続された各拠点の通信装置間で送受して、他の拠点の表示装置やスピーカから出力させることにより、拠点間でのテレビ会議を実現する。例えば、表示装置としては、プロジェクタや液晶パネルが利用されている。このようなテレビ会議では、より円滑な会話を実現することを目的として、マイクアレイ機能等により音を検知し、検知した音の音源方向にカメラの向きを制御する話者追尾機能を搭載した装置が利用されることがある。 2. Description of the Related Art Conventionally, a communication system for a video conference that realizes a conversation between users at each site using a network such as the Internet is known. In a communication system for video conferencing, video and sound collected by cameras and microphones installed at each site are transmitted and received between communication devices at each site connected to the network, and display devices at other sites are installed. Realize video conferencing between sites by outputting from speakers. For example, projectors and liquid crystal panels are used as display devices. In such a video conference, for the purpose of realizing a smoother conversation, a device equipped with a speaker tracking function that detects sound with a microphone array function etc. and controls the direction of the camera in the direction of the sound source of the detected sound May be used.
しかしながら、従来技術では、不要な方向にカメラの向きを制御してしまう可能性があるという問題がある。具体的には、従来技術では、マイクアレイ機能等により検知された音の方向にカメラの向きを制御しているものの、検知された音が実際には会議における話者の音声であるとは限られないため、話者ではない方向にカメラの向きを制御してしまう可能性がある。例えば、表示装置としてプロジェクタが利用される場合には、プロジェクタに搭載されたファンの回転によって発生する音が検知されることにより、プロジェクタの方向にカメラの向きが制御されてしまう可能性がある。一般に、話者の音声以外の音については、ノイズリダクション機能やノイズキャンセル機能等の音響処理機能により除去する処理が行なわれている。但し、音響処理機能を適用する場合には、話者の音声の音質が劣化してしまうことを避けるのは困難である。 However, the conventional technique has a problem that the direction of the camera may be controlled in an unnecessary direction. Specifically, in the prior art, the camera direction is controlled in the direction of the sound detected by the microphone array function or the like, but the detected sound is not necessarily the voice of the speaker in the conference. Therefore, there is a possibility that the direction of the camera is controlled in a direction that is not a speaker. For example, when a projector is used as a display device, there is a possibility that the direction of the camera is controlled in the direction of the projector by detecting the sound generated by the rotation of a fan mounted on the projector. In general, a sound other than the voice of a speaker is subjected to processing for removal by an acoustic processing function such as a noise reduction function or a noise cancellation function. However, when applying the acoustic processing function, it is difficult to avoid the deterioration of the sound quality of the speaker's voice.
本発明は、上記に鑑みてなされたものであって、カメラの向きを好適に制御することを目的とする。 The present invention has been made in view of the above, and an object thereof is to suitably control the orientation of a camera.
上述した課題を解決し、目的を達成するため、本発明に係る通信装置は、通信装置であって、前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出する検出部と、前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なう指向性制御部と、マイクに対する制御に応じて、カメラによる撮影の向きを制御する撮影制御部とを有する。 In order to solve the above-described problems and achieve the object, the communication device according to the present invention is a communication device, and a detection unit that detects a sound source different from speech at a base where the communication device is installed A directivity control unit that performs control to reduce the sensitivity of the microphone directed toward the detected generation source among the plurality of microphones mounted on the communication device, and a camera according to the control on the microphone A shooting control unit that controls the shooting direction.
本発明の一つの様態によれば、カメラの向きを好適に制御することができるという効果を奏する。 According to one aspect of the present invention, there is an effect that the direction of the camera can be suitably controlled.
以下に添付図面を参照して、本発明に係る通信装置、制御方法及び制御プログラムの実施の形態を説明する。以下では、本発明に係る通信装置を適用した通信システムの一例として、地理的に離れた拠点間での会議を可能にするテレビ会議システムを例示する。但し、本発明は、複数の通信装置の間で映像や音を送受する各種の通信システム、及び、該通信システムで用いられる各種の通信装置に対して広く適用可能であり、以下の実施の形態により限定されるものではない。 Embodiments of a communication device, a control method, and a control program according to the present invention will be described below with reference to the accompanying drawings. Hereinafter, as an example of a communication system to which the communication device according to the present invention is applied, a video conference system that enables a conference between geographically distant bases will be exemplified. However, the present invention can be widely applied to various communication systems that transmit and receive video and sound between a plurality of communication devices, and various communication devices used in the communication systems. It is not limited by.
(実施の形態1)
[実施の形態1に係るシステム構成]
図1を用いて、実施の形態1に係る通信システムの構成を説明する。図1は、実施の形態1に係る通信システムのシステム構成例を示す図である。
(Embodiment 1)
[System Configuration According to Embodiment 1]
The configuration of the communication system according to the first embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating a system configuration example of a communication system according to the first embodiment.
図1に示すように、通信システム1には、複数の拠点に設置された通信装置100と、中継装置200とが含まれる。複数の拠点に設置された通信装置100と、中継装置200とは、インターネットやLAN(Local Area Network)等のネットワーク2に接続し、相互に通信可能である。これらのうち、通信システム1に含まれる通信装置100の台数は、テレビ会議等に参加する拠点数に対応する。図1では、拠点A、拠点B及び拠点Cのそれぞれに通信装置100が設置されている場合を例に挙げている。
As shown in FIG. 1, the communication system 1 includes a
通信装置100は、中継装置200を介して、他拠点の通信装置100との間で各種情報を送受信する。また、通信装置100は、受信した情報の出力を制御する。例えば、出力される情報は、カメラによって撮影された各拠点の映像や、マイクによって収集された各拠点の音(主に、話者の音声)等である。通信装置100は、テレビ会議のための専用端末であっても良いし、PC(Personal Computer)やスマートフォン、タブレット端末等の汎用端末であっても良い。汎用端末は、本実施の形態に係る制御プログラムをインストールすることによって、アプリケーションの一つとして通信装置100の各機能を実現する。中継装置200は、各拠点に設置された複数の通信装置100の間における映像や音等の各種情報の伝送を中継するサーバ装置等である。
The
上述した構成において、通信装置100は、通信装置100が設置された拠点で、話者の発話とは異なる音の発生源を検出する。例えば、話者の発話とは異なる音とは、拠点に設置されたプロジェクタ等に搭載されたファンの回転によって発生する音である。ファンの回転によって発生する音は、他拠点の通信装置100に対して送信することは好ましくない。また、マイクアレイ機能等により音を検知し、検知した音の音源方向にカメラの向きを制御する話者追尾機能を適用する場合、ファンの回転によって音を発しているプロジェクタの方向にカメラの向きを制御することは好ましくない。これらのことから、通信装置100は、発話以外の音の発生源を検出している。
In the configuration described above, the
そして、通信装置100は、通信装置100に搭載された複数のマイクのうち、検出された発生源の方向に向けられたマイクの感度を低下させる制御を行なう。例えば、通信装置100は、複数のマイクを搭載しており、複数のマイクによってマイクアレイ機能を実現する。マイクアレイ機能を有する通信装置100は、ファンの回転によって音を発しているプロジェクタ等の発生源の方向に向けられているマイクの感度を低下させる。これにより、マイクアレイ機能の指向性を制御することによる音の収集において、発話以外の音の収集を抑制することができる。
Then,
続いて、通信装置100は、マイクに対する制御に応じて、カメラによる撮影の向きを制御する。例えば、発話以外の音の発生源等であるプロジェクタの方向に向けられているマイクの感度を低下させるマイクアレイ機能の指向性制御に応じて、話者追尾機能により、カメラによる撮影の向きを制御する。これにより、プロジェクタ等に向けられているマイクの感度を低下させるため、カメラによる撮影の向きを、プロジェクタ等の方向に制御することを抑制することができる。その後、通信装置100は、カメラの撮影によって取得された映像と、マイクに対する制御によって収集された音とを含む出力情報を、他の拠点に設置された通信装置100に対して送信する。
Subsequently, the
つまり、通信装置100は、テレビ会議等において、発話とは異なる音の発生源を検出し、検出した発生源に向けられているマイクの感度を低下させるマイクアレイ機能の指向性制御に応じて、カメラの向きを制御するので、カメラの向きを好適に制御することができる。換言すると、通信装置100は、会議等における発話以外の音の収集を抑制することで、カメラによる撮影の向きを、発話以外の音の発生源の方向に制御することを抑制することができる。
That is, the
[実施の形態1に係る通信装置のハードウェア構成]
次に、図2を用いて、実施の形態1に係る通信装置100のハードウェア構成を説明する。図2は、実施の形態1に係る通信装置100のハードウェア構成例を示すブロック図である。
[Hardware Configuration of Communication Device According to Embodiment 1]
Next, the hardware configuration of
図2に示すように、通信装置100は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、SSD(Solid State Drive)15と、メディアドライブ17と、操作ボタン18と、電源スイッチ19とを有する。加えて、通信装置100は、ネットワークI/F21と、カメラ22と、撮像素子I/F23と、マイクアレイ24と、スピーカ25と、音声入出力I/F26と、ディスプレイI/F27と、外部機器接続I/F28とを有する。
As shown in FIG. 2, the
CPU11は、通信装置100全体の動作を制御する。CPU11は、ROM12等に記憶されたプログラムを、RAM13等を作業領域として実行することで、通信装置100全体の動作を制御する。ROM12は、通信装置100による処理を実現するためのプログラムを記憶する。RAM13は、ROM12等に格納されたプログラムの実行時の作業領域である。SSD15は、各種プログラムや各種データを記憶可能なフラッシュメモリ14に対する、データの読み出しや書き込みを制御する。メディアドライブ17は、記録メディア16に対するデータの読み出しや書き込み(記録)を制御する。
The
操作ボタン18は、通信装置100の通信先となる他拠点の通信装置100の選択や、この他の各種設定のために操作される。電源スイッチ19は、通信装置100の電源の投入と切断とを切り替えるためのものである。ネットワークI/F21は、ネットワーク2への接続や、各種情報の送受信を制御するためのインタフェースである。カメラ22は、拠点内を撮影する。撮像素子I/F23は、CPU11による制御に従って、カメラ22の駆動を制御するためのインタフェースである。例えば、カメラ22は、マイクアレイ機能によって検出された音の方向に追従して、撮影方向の切り替えができる構成となっている。一つの様態として、カメラ22は、全方位カメラを適用することができるが、これに限定されるものではない。なお、撮影方向の切り替えについては、デジタル式とアナログ式との何れであっても良い。
The operation button 18 is operated to select the
マイクアレイ24は、複数のマイクで構成されたマイクアレイ機能により拠点内の音を収集し、収集した音を通信装置100に入力する。スピーカ25は、音を出力する。音声入出力I/F26は、CPU11による制御に従って、マイクアレイ24に対する指向性を制御して信号(主に、音声信号)の入力を処理するとともに、スピーカ25の音量等を制御して信号の出力を処理するためのインタフェースである。ディスプレイI/F27は、CPU11による制御に従って、表示装置50に表示させる映像のデータを伝送するためのインタフェースである。例えば、表示装置50は、通信装置100に外付けされるプロジェクタや液晶パネル等である。外部機器接続I/F28は、各種の外部機器を通信装置100に接続するためのインタフェースである。また、通信装置100は、上記各部を電気的に接続するためのアドレスバスやデータバス等のバス20を有する。なお、図2に示したハードウェア構成は一例であり、上記以外のハードウェアを追加しても良い。
The microphone array 24 collects sounds in the base by a microphone array function including a plurality of microphones, and inputs the collected sounds to the
[実施の形態1に係る通信装置の機能構成]
次に、図3を用いて、実施の形態1に係る通信装置100の機能構成を説明する。図3は、実施の形態1に係る通信装置100の機能構成例を示すブロック図である。
[Functional Configuration of Communication Device According to Embodiment 1]
Next, the functional configuration of the
図3に示すように、通信装置100は、操作入力受付部101と、表示制御部102と、音声出力制御部103と、検出部104と、判定部105と、指向性制御部106と、撮影制御部107と、音声入力制御部108と、送受信制御部109とを有する。上記各部は、ソフトウェア(プログラム)で実現されても良いし、ハードウェア回路で実現されても良い。また、上記各部は、例えば、フラッシュメモリ14等からRAM13上に展開された制御プログラムをCPU11が実行することにより実現される機能である。
As illustrated in FIG. 3, the
操作入力受付部101は、通信装置100を利用するユーザによる各種の操作入力を受け付ける。例えば、操作入力受付部101は、操作ボタン18や電源スイッチ19等に対するユーザ操作に応じて、各種設定に関する情報や電源制御のための情報の入力を受け付ける。
The operation
表示制御部102は、表示装置50に対する表示処理を制御する。例えば、表示制御部102は、他拠点の通信装置100から受け付けられた他拠点における映像に対し、描画処理等を実行し、処理したデータを表示装置50に対して出力する。これにより、表示装置50は、他拠点における映像を含んだ画像を表示出力する。
The display control unit 102 controls display processing for the
音声出力制御部103は、スピーカ25に対する音の出力処理を制御する。例えば、音声出力制御部103は、他拠点の通信装置100から受け付けられた他拠点における音データを復号し、復号したデータ(主に、音声データ)をスピーカ25に対して出力する。これにより、スピーカ25は、他拠点における音声データを再生出力する。
The sound output control unit 103 controls sound output processing for the speaker 25. For example, the audio output control unit 103 decodes sound data at another site received from the
検出部104は、発話とは異なる音の発生源を検出する。より具体的には、検出部104は、カメラ22によって撮影された映像に所定画像が含まれている場合に、所定画像が含まれる方向に、話者の発話とは異なる音の発生源が存在することを検出する。例えば、発話とは異なる音の発生源とは、プロジェクタ等の表示装置50を指す。また、例えば、所定画像とは、予め決められた文字や数字、記号等を含む画像を指す。通信装置100は、これらの文字や数字、記号等を予め保持している。すなわち、検出部104は、プロジェクタ等の表示装置50に貼り付けられているメーカのロゴタイプや製品型番等を所定画像の検出のために保持し、カメラ22によって撮影された映像に所定画像が含まれていれば、その方向に表示装置50が存在することを検出する。
The detection unit 104 detects a sound generation source different from the utterance. More specifically, when a predetermined image is included in the video captured by the camera 22, the detection unit 104 has a sound source different from the speaker's utterance in the direction including the predetermined image. Detect what to do. For example, the sound source different from the utterance refers to the
プロジェクタ等にはファンが搭載されており、ファンの回転によって発生する音は会議において不要である。検出部104は、このような不要な音を発する発生源であるプロジェクタ等の有無や、存在する方向を検出する。なお、所定画像は、メーカのロゴタイプや製品型番に限られるものではない。具体的には、所定画像は、発話とは異なる音の発生源が検出できるのであれば何であっても良い。例えば、所定画像に二次元コード等を採用する場合、検出部104は、二次元コードから読み取った文字が予め保持している文字に合致すれば、二次元コードが含まれる映像の方向に発生源が存在することを検出する。なお、通信装置100に保持させる文字や記号等を、ユーザが事前に指定できるようにしても良いし、任意に追加・変更できるようにしても良い。
A projector or the like is equipped with a fan, and the sound generated by the rotation of the fan is unnecessary in a meeting. The detecting unit 104 detects the presence or absence of a projector or the like that is a source that generates such unnecessary sound, and the direction in which it exists. The predetermined image is not limited to the manufacturer's logo type or product model number. Specifically, the predetermined image may be anything as long as a sound source different from the utterance can be detected. For example, when a two-dimensional code or the like is employed for a predetermined image, the detection unit 104 generates a source in the direction of the video including the two-dimensional code if a character read from the two-dimensional code matches a character stored in advance. Detect that exists. Note that characters, symbols, and the like to be held in the
判定部105は、所定画像の大きさが所定閾値以上であるか否かを判定する。より具体的には、判定部105は、検出部104によって発話とは異なる音の発生源であるプロジェクタ等が検出された場合に、文字や数字、記号等である所定画像の大きさが所定閾値以上であるか否かを判定する。そして、判定部105は、所定画像の大きさが所定閾値以上である場合に、所定画像の大きさが所定閾値以上である旨を指向性制御部106に対して通知する。一方、通信装置100は、判定部105によって所定画像の大きさが所定閾値未満であると判定された場合に、処理を終了する。文字や数字、記号等の大きさを判定するための閾値は、通信装置100に予め保持されていても良いし、ユーザが事前に指定できるようにしても良いし、任意に変更できるようにしても良い。
The determination unit 105 determines whether or not the size of the predetermined image is greater than or equal to a predetermined threshold value. More specifically, when the detection unit 104 detects a projector or the like that is a sound source different from the utterance, the determination unit 105 determines that the size of a predetermined image such as a character, number, or symbol is a predetermined threshold value. It is determined whether it is above. Then, when the size of the predetermined image is equal to or greater than the predetermined threshold, the determination unit 105 notifies the
すなわち、判定部105は、プロジェクタ等に貼り付けられている文字や数字等の大きさが所定閾値以上であるか否かを判定することにより、プロジェクタ等と通信装置100との位置関係について、近くに設置されているか否かを判定する。例えば、文字や数字等の大きさが所定閾値以上であれば互いに近い位置に設置されているため、プロジェクタ等に搭載されたファンの回転によって話者追尾機能に影響を与える可能性がある。一方、文字や数字等の大きさが所定閾値未満であれば、通信装置100からプロジェクタ等までの距離が十分に離れているものとして、プロジェクタ等に搭載されたファンの回転による音は会議に不要な音にならないものとする。
In other words, the determination unit 105 determines whether the size of characters or numbers pasted on the projector or the like is equal to or greater than a predetermined threshold, and thus the positional relationship between the projector and the
指向性制御部106は、マイクアレイ24の複数のマイクのうち、発話とは異なる音の発生源の方向に向けられたマイクの感度を低下させる制御を行なう。より具体的には、指向性制御部106は、判定部105によって所定画像の大きさが所定閾値以上であると判定された場合に、発話とは異なる音の発生源であるプロジェクタ等の方向に向けられたマイクによって収集された音の音量が所定閾値以上であるか否かを判定する。そして、指向性制御部106は、音量が所定閾値以上である場合に、マイクアレイ24の複数のマイクのうち、プロジェクタ等の方向に向けられたマイクの感度を低下させるように、マイクアレイ機能の指向性を制御する。なお、指向性制御部106は、プロジェクタ等の方向に向けられたマイクによって収集された音の音量が所定閾値未満である場合には、処理を終了する。なお、音量を判定するための閾値は、通信装置100に予め保持されていても良いし、ユーザが事前に指定できるようにしても良いし、任意に変更できるようにしても良い。
The
撮影制御部107は、マイクアレイ24に対する制御に応じて、カメラ22による撮影の向きを制御する。より具体的には、撮影制御部107は、指向性制御部106によって制御されたマイクアレイ機能の指向性に応じて、感度を低下させたマイクの方向の撮影を制限し、カメラ22による撮影の向きを制御する。例えば、感度を低下させたマイクの方向の撮影を禁止するように設定しても良いし、話者追尾機能が適用される場合は結果として感度を低下させたマイクの方向の撮影が抑制される。これらにより、発話とは異なる音の発生源となり得る表示装置50の方向に対しては、マイクアレイ24による音の収集や、カメラ22による撮影が制限されることになる。撮影制御部107は、カメラ22によって撮影された映像を送受信制御部109に対して出力する。
The
音声入力制御部108は、マイクアレイ24からの音の入力処理を制御する。例えば、音声入力制御部108は、マイクアレイ24によって収集された拠点内の音に対し、PCM(Pulse Code Modulation)等の任意の符号化フォーマットで符号化し、符号化したデータ(主に、音声データ)を送受信制御部109に対して出力する。
The sound input control unit 108 controls sound input processing from the microphone array 24. For example, the voice input control unit 108 encodes the sound in the base collected by the microphone array 24 with an arbitrary encoding format such as PCM (Pulse Code Modulation) and the encoded data (mainly the voice data). ) To the transmission /
送受信制御部109は、ネットワーク2を介して、中継装置200を経由して他拠点の通信装置100との間における各種情報の送受信を制御する。送受信制御部109は、一つの様態として「送信制御部」に対応する。例えば、送受信制御部109は、撮影制御部107によって出力された映像と、音声入力制御部108によって出力された音声データとを含む出力情報を、他拠点に設置された通信装置100に対して送信する。また、送受信制御部109は、他拠点に設置された通信装置100からの出力情報を受信する。送受信制御部109は、受信した出力情報に含まれる映像に関するデータについては表示制御部102に対して出力し、音声に関するデータについては音声出力制御部103に対して出力する。これらにより、表示制御部102や音声出力制御部103による制御によって、他拠点の映像や音声が出力される。また、通信装置100は、会議中、検出部104、判定部105、指向性制御部106及び撮影制御部107による処理を、一定時間の経過毎に繰り返し実行する。
The transmission /
[実施の形態1に係る制御処理フロー]
次に、図4を用いて、実施の形態1に係る通信装置100による制御処理の流れを説明する。図4は、実施の形態1に係る通信装置100による制御処理の流れの例を示すフローチャートである。
[Control processing flow according to Embodiment 1]
Next, the flow of control processing by the
図4に示すように、通信装置100は、制御開始のための操作を受け付けた場合に(ステップS101:Yes)、カメラ22によって撮影された映像を入力する(ステップS102)。一方、通信装置100は、制御開始のための操作を受け付けていない場合に(ステップS101:No)、該操作の受け付け待ちの状態となる。そして、通信装置100は、撮影された映像に所定の文字が含まれているか否かを判定する(ステップS103)。このとき、通信装置100は、撮影された映像に所定の文字が含まれている場合に(ステップS103:Yes)、所定の文字を含む映像の方向に、発話とは異なる音の発生源が存在するものとして検出し、文字の大きさが所定閾値以上であるか否かを判定する(ステップS104)。一方、通信装置100は、撮影された映像に所定の文字が含まれていない場合に(ステップS103:No)、ステップS108の処理を実行する。
As illustrated in FIG. 4, when the
続いて、通信装置100は、文字の大きさが所定閾値以上である場合に(ステップS104:Yes)、発話とは異なる音の発生源の方向に向けられたマイクによって収集された音を入力する(ステップS105)。一方、通信装置100は、文字の大きさが所定閾値未満である場合に(ステップS104:No)、ステップS108の処理を実行する。その後、通信装置100は、発話とは異なる音の発生源からの音の音量が所定閾値以上であるか否かを判定する(ステップS106)。このとき、通信装置100は、音量が所定閾値以上である場合に(ステップS106:Yes)、発話とは異なる音の発生源の方向に向けられたマイクの感度を低下させ、カメラ22による該方向の撮影を制限する(ステップS107)。一方、通信装置100は、音量が所定閾値未満である場合に(ステップS106:No)、ステップS108の処理を実行する。
Subsequently, when the size of the character is equal to or greater than the predetermined threshold (step S104: Yes), the
通信装置100は、制御終了のための操作を受け付けたか否かを判定する(ステップS108)。このとき、通信装置100は、制御終了のための操作を受け付けていない場合に(ステップS108:No)、マイク及びカメラ22の制御から所定時間が経過したか否かを判定する(ステップS109)。一方、通信装置100は、制御終了のための操作を受け付けた場合に(ステップS108:Yes)、処理を終了する。また、通信装置100は、マイク及びカメラ22の制御から所定時間が経過した場合に(ステップS109:Yes)、ステップS102の処理を再度実行する。一方、通信装置100は、マイク及びカメラ22の制御から所定時間が経過していない場合に(ステップS109:No)、ステップS108の処理を実行する。
The
[実施の形態1による効果]
上述したように、通信装置100は、発話とは異なる音の発生源を検出し、検出された発生源の方向に向けられたマイクの感度を低下させるマイクアレイ機能の指向性を制御し、制御された指向性に応じて、カメラ22による撮影の向きを制御するので、カメラ22の向きを好適に制御することができる。
[Effects of Embodiment 1]
As described above, the
また、通信装置100は、カメラ22の撮影で得られた映像に、所定文字等が含まれている場合に、所定文字が含まれる方向に、発話とは異なる音の発生源が存在するものとして検出し、該所定文字の大きさが所定閾値以上である場合に、検出された発生源の方向に向けられたマイクの感度を低下させるマイクアレイ機能の指向性を制御する。この結果、通信装置100は、通信装置100と発生源との距離が近い場合に、発生源の方向に向けられたマイクの感度を低下させるので、発生源からの会議に不要な音が混入することを抑制することができる。
Further, the
また、通信装置100は、発話とは異なる音の発生源の方向に向けられたマイクによって収集された音の音量が所定閾値以上である場合に、発生源の方向に向けられたマイクの感度を低下させるマイクアレイ機能の指向性を制御する。この結果、通信装置100は、発生源からの会議に不要な音が混入することをより高精度に抑制することができる。
Further, the
(実施の形態2)
さて、これまで本発明に係る通信装置100の実施の形態について説明したが、上述した実施の形態以外にも種々の異なる形態にて実施されて良いものである。そこで、(1)構成、(2)プログラム、について異なる実施の形態を説明する。
(Embodiment 2)
Although the embodiments of the
(1)構成
上記文書中や図面中等で示した処理手順、制御手順、具体的名称、各種のデータやパラメタ等を含む情報は、特記する場合を除いて任意に変更することができる。また、図示した装置の各構成要素は、機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、装置の分散又は統合の具体的形態は、図示のものに限られず、その全部又は一部を各種の負担や使用状況等に応じて、任意の単位で機能的又は物理的に、分散又は統合することができる。例えば、カメラ22については、通信装置100に搭載されていなくても良く、外部機器として通信装置100に接続されていれば良い。
(1) Configuration Information including processing procedures, control procedures, specific names, various data, parameters, and the like shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. Each component of the illustrated apparatus is functionally conceptual and does not necessarily need to be physically configured as illustrated. That is, the specific form of the distribution or integration of the devices is not limited to the illustrated one, and all or a part of the distribution or integration is functionally or physically distributed or arbitrarily in any unit according to various burdens or usage conditions. Can be integrated. For example, the camera 22 does not have to be mounted on the
また、上記実施の形態では、通信装置100の近傍に、発話とは異なる音の発生源となり得るプロジェクタ等の表示装置50が存在するか否かについて、映像に含まれる文字や数字、記号等の大きさによって判定したが、通信装置100の近傍にプロジェクタ等の表示装置50が存在するか否かを認識できれば、いかなる手段であっても良い。例えば、映像に含まれる文字や数字、記号間の幅や間隔をもとに、通信装置100の近傍にプロジェクタ等の表示装置50が存在するか否かを判定しても良い。
Further, in the above embodiment, whether or not there is a
(2)プログラム
また、通信装置100で実行される制御プログラムは、一つの様態として、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。また、通信装置100で実行される制御プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしても良い。また、通信装置100で実行される制御プログラムをインターネット等のネットワーク経由で提供又は配布するように構成しても良い。また、通信装置100で実行される制御プログラムを、ROM等に予め組み込んで提供するように構成しても良い。
(2) Program The control program executed by the
通信装置100で実行される制御プログラムは、上述した各部(検出部104、判定部105、指向性制御部106、撮影制御部107、送受信制御部109)を含むモジュール構成となっており、実際のハードウェアとしてはCPUが記憶媒体からプログラムを読み出して実行することにより、上記各部が主記憶装置上にロードされ、検出部104、判定部105、指向性制御部106、撮影制御部107、送受信制御部109が主記憶装置上に生成されるようになっている。
The control program executed by the
1 通信システム
100 通信装置
101 操作入力受付部
102 表示制御部
103 音声出力制御部
104 検出部
105 判定部
106 指向性制御部
107 撮影制御部
108 音声入力制御部
109 送受信制御部
200 中継装置
DESCRIPTION OF SYMBOLS 1
Claims (8)
前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出する検出部と、
前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なう指向性制御部と、
マイクに対する制御に応じて、カメラによる撮影の向きを制御する撮影制御部と
を有することを特徴とする通信装置。 A communication device,
At a base where the communication device is installed, a detection unit that detects a sound generation source different from speech,
A directivity control unit that performs control to reduce the sensitivity of the microphone directed toward the detected generation source among the plurality of microphones mounted on the communication device;
And a shooting control unit that controls a shooting direction of the camera according to control of the microphone.
前記指向性制御部は、前記所定画像の大きさが所定閾値以上であると判定された場合に、前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうことを特徴とする請求項2に記載の通信装置。 A determination unit for determining whether the size of the predetermined image is equal to or greater than a predetermined threshold;
The directivity control unit performs control to reduce sensitivity of a microphone directed toward the generation source when it is determined that the size of the predetermined image is equal to or greater than a predetermined threshold. Item 3. The communication device according to Item 2.
前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出するステップと、
前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうステップと、
マイクに対する制御に応じて、カメラによる撮影の向きを制御するステップと
を含むことを特徴とする制御方法。 A control method in a communication device,
Detecting a sound source different from the utterance at the base where the communication device is installed;
Performing a control to reduce the sensitivity of the microphone directed toward the detected source among the plurality of microphones mounted on the communication device;
And a step of controlling a direction of photographing by the camera in accordance with control of the microphone.
前記通信装置が設置された拠点で、発話とは異なる音の発生源を検出するステップと、
前記通信装置に搭載された複数のマイクのうち、検出された前記発生源の方向に向けられたマイクの感度を低下させる制御を行なうステップと、
マイクに対する制御に応じて、カメラによる撮影の向きを制御するステップと
を実行させるための制御プログラム。 In communication equipment,
Detecting a sound source different from the utterance at the base where the communication device is installed;
Performing a control to reduce the sensitivity of the microphone directed toward the detected source among the plurality of microphones mounted on the communication device;
A control program for executing the step of controlling the direction of shooting by the camera in accordance with the control of the microphone.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015217093A JP6645129B2 (en) | 2015-11-04 | 2015-11-04 | Communication device, control method, and control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015217093A JP6645129B2 (en) | 2015-11-04 | 2015-11-04 | Communication device, control method, and control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017092576A true JP2017092576A (en) | 2017-05-25 |
JP6645129B2 JP6645129B2 (en) | 2020-02-12 |
Family
ID=58769286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015217093A Expired - Fee Related JP6645129B2 (en) | 2015-11-04 | 2015-11-04 | Communication device, control method, and control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6645129B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11331827A (en) * | 1998-05-12 | 1999-11-30 | Fujitsu Ltd | Television camera |
US20030160862A1 (en) * | 2002-02-27 | 2003-08-28 | Charlier Michael L. | Apparatus having cooperating wide-angle digital camera system and microphone array |
JP2005151042A (en) * | 2003-11-13 | 2005-06-09 | Sony Corp | Sound source position specifying apparatus, and imaging apparatus and imaging method |
JP2005184386A (en) * | 2003-12-18 | 2005-07-07 | Sony Corp | Sound collecting/video recording device |
JP2005250397A (en) * | 2004-03-08 | 2005-09-15 | Nec Corp | Robot |
JP2006123161A (en) * | 2004-09-30 | 2006-05-18 | Samsung Electronics Co Ltd | Audio video sensor fusion device and fusion method for grasping, tracking and separating position |
-
2015
- 2015-11-04 JP JP2015217093A patent/JP6645129B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11331827A (en) * | 1998-05-12 | 1999-11-30 | Fujitsu Ltd | Television camera |
US20030160862A1 (en) * | 2002-02-27 | 2003-08-28 | Charlier Michael L. | Apparatus having cooperating wide-angle digital camera system and microphone array |
JP2005151042A (en) * | 2003-11-13 | 2005-06-09 | Sony Corp | Sound source position specifying apparatus, and imaging apparatus and imaging method |
JP2005184386A (en) * | 2003-12-18 | 2005-07-07 | Sony Corp | Sound collecting/video recording device |
JP2005250397A (en) * | 2004-03-08 | 2005-09-15 | Nec Corp | Robot |
JP2006123161A (en) * | 2004-09-30 | 2006-05-18 | Samsung Electronics Co Ltd | Audio video sensor fusion device and fusion method for grasping, tracking and separating position |
Also Published As
Publication number | Publication date |
---|---|
JP6645129B2 (en) | 2020-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10848889B2 (en) | Intelligent audio rendering for video recording | |
JP6489563B2 (en) | Volume control method, system, device and program | |
US9792602B2 (en) | Apparatus and method for providing emotion expression service in mobile communication terminal | |
US9648278B1 (en) | Communication system, communication apparatus and communication method | |
US10079996B2 (en) | Communication system, communication device, and communication method | |
JP2017034502A (en) | Communication equipment, communication method, program, and communication system | |
JP6528574B2 (en) | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING PROGRAM | |
JP2017034312A (en) | Communication device, communication system, and program | |
US8914007B2 (en) | Method and apparatus for voice conferencing | |
JP6149433B2 (en) | Video conference device, video conference device control method, and program | |
JP7313807B2 (en) | Communication device, its control method, and its program | |
CN105119984B (en) | Send the method and device of file | |
JP6645129B2 (en) | Communication device, control method, and control program | |
JP6835205B2 (en) | Shooting sound pickup device, sound pick-up control system, shooting sound pick-up device control method, and shooting sound pick-up control system control method | |
US11368611B2 (en) | Control method for camera device, camera device, camera system, and storage medium | |
US9392036B2 (en) | Terminal device and communication system | |
JP6029626B2 (en) | Control device and control method | |
JP6500366B2 (en) | Management device, terminal device, transmission system, transmission method and program | |
JP2018036688A (en) | Information processing device, server device, information processing system, control method thereof, and program | |
US20120300126A1 (en) | Electronic apparatus and tv phone method | |
JP2017168903A (en) | Information processing apparatus, conference system, and method for controlling information processing apparatus | |
JP2017108287A (en) | Communication device, control method and control program | |
JP2017158134A (en) | Information processing apparatus, conference system, and method for controlling information processing apparatus | |
JP2008005028A (en) | Video voice conference system and terminal | |
JP5857984B2 (en) | Sound data processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191223 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6645129 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |