JP2014216787A - 会議端末装置及び増幅率登録方法 - Google Patents
会議端末装置及び増幅率登録方法 Download PDFInfo
- Publication number
- JP2014216787A JP2014216787A JP2013091651A JP2013091651A JP2014216787A JP 2014216787 A JP2014216787 A JP 2014216787A JP 2013091651 A JP2013091651 A JP 2013091651A JP 2013091651 A JP2013091651 A JP 2013091651A JP 2014216787 A JP2014216787 A JP 2014216787A
- Authority
- JP
- Japan
- Prior art keywords
- conference
- unit
- terminal device
- face image
- conference terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】ネットワークを介して接続された相手端末との間の電話会議又はテレビ会議において、会議出席者の発言内容を含む通話音声の音声信号の音量レベルを会議出席者に応じて増幅又は減衰でき、電話会議又はテレビ会議を円滑に行う。
【解決手段】会議端末装置10Aは、会議出席者の画像をカメラ210において撮像し、会議出席者の発言内容を含む通話音声をマイク220において収音する。顔画像処理部600は、撮像された会議出席者の画像を基に、会議出席者の顔画像を抽出する。マイクゲイン設定部640は、収音された通話音声の音声信号を増幅させるためのマイク220のゲインを設定する。マイクゲイン登録部650は、抽出された会議出席者の顔画像に、設定されたマイク220のゲインを対応付けて登録する。
【選択図】図3
【解決手段】会議端末装置10Aは、会議出席者の画像をカメラ210において撮像し、会議出席者の発言内容を含む通話音声をマイク220において収音する。顔画像処理部600は、撮像された会議出席者の画像を基に、会議出席者の顔画像を抽出する。マイクゲイン設定部640は、収音された通話音声の音声信号を増幅させるためのマイク220のゲインを設定する。マイクゲイン登録部650は、抽出された会議出席者の顔画像に、設定されたマイク220のゲインを対応付けて登録する。
【選択図】図3
Description
本発明は、例えば双方向型の電話会議又はテレビ会議に用いられ、電話会議又はテレビ会議の相手に対する音声信号を収音するマイクのゲイン(増幅率)を登録する会議端末装置及び増幅率登録方法に関する。
近年、カメラ及びマイクを含む会議端末装置(例えばスマートフォン又はタブレット端末)等の利用が急速に広まっている。このような会議端末装置は、例えば企業内のテレビ会議においても利用され始めている。従来のテレビ会議では、会議出席者はテレビ会議用設備が備えられた専用会議室に居る必要があったが、例えばネットワークに接続された会議端末装置を会議出席者が個々に用いることで、会議出席者は、専用会議室に居なくてもそれぞれ離れた場所においてテレビ会議に参加できる。
音声信号及び映像信号を送受信するテレビ会議において、会議出席者の発話音声を的確に収音するためにマイクのゲイン(増幅度)を設定する先行技術として、例えば特許文献1に示すビデオ会議装置が知られている。特許文献1に示すビデオ会議装置は、カメラにより撮像された会議室内の画像から会議出席者の顔を検出することで会議出席者の在席状態を判定し、更に、この判定結果に応じて、マイクユニット内の複数の各マイクの増幅度を個別に設定する。
これにより、特許文献1に示すビデオ会議装置は、会議室内の会議出席者の在席状態に応じて、マイクユニットの収音特性を最適に設定することができる。
しかしながら、特許文献1では、ビデオ会議装置がマイクユニット内の各マイクのゲインを設定する場合には、会議出席者が声の大きな人であるか又は声の小さな人であるかの会議出席者毎の声量の差異が考慮されていない。
このため、会議出席者の声量の大小に拘わらず一定のゲインが設定されたマイクにより収音される会議出席者が声の大きな人である場合には、声の大きな会議出席者の発言内容の音声の音量レベルが大きくなり過ぎて音声が割れてしまって通話が快適に行えず、ビデオ会議の相手との間で円滑な会議を進行することが困難となるという課題があった。
本発明は、上述した従来の課題を解決するために、ネットワークを介して接続された相手端末との間の電話会議又はテレビ会議において、会議出席者の発言内容を含む通話音声の音声信号の音量レベルを会議出席者に応じて増幅又は減衰でき、電話会議又はテレビ会議を円滑に行う会議端末装置及び増幅率登録方法を提供することを目的とする。
本発明は、ネットワークを介して接続された相手端末装置と通信する会議端末装置であって、前記会議端末装置を用いる会議出席者の画像を撮像する撮像部と、前記会議出席者の発言内容を含む通話音声を収音する収音部と、撮像された前記会議出席者の画像を基に、前記会議出席者の顔画像を抽出する顔画像抽出部と、収音された前記通話音声の音声信号を増幅させるための前記収音部の増幅率を設定する増幅率設定部と、抽出された前記会議出席者の顔画像と設定された前記収音部の増幅率とを対応付けて登録する登録部と、を備える会議端末装置である。
また、本発明は、ネットワークを介して接続された相手端末装置と通信する会議端末装置における増幅率登録方法であって、前記会議端末装置を用いる会議出席者の画像を撮像するステップと、前記会議出席者の発言内容を含む通話音声を収音するステップと、撮像された前記会議出席者の画像を基に、前記会議出席者の顔画像を抽出するステップと、収音された前記通話音声の音声信号を増幅させるための前記収音部の増幅率を設定するステップと、抽出された前記会議出席者の顔画像と設定された前記収音部の増幅率とを対応付けて登録するステップと、を有する増幅率登録方法である。
本発明によれば、ネットワークを介して接続された相手端末との間の電話会議又はテレビ会議において、会議出席者の発言内容を含む通話音声の音声信号の音量レベルを会議出席者に応じて増幅又は減衰でき、電話会議又はテレビ会議を円滑に行うことができる。
以下、本発明に係る会議端末装置及び増幅率登録方法の各実施形態について、図面を参照して説明する。各実施形態の会議端末装置は、例えば携帯電話機、スマートフォン、タブレット端末又はPDA(Personal Digital Assistant)である。
以下の各実施形態では、本発明に係る会議端末装置の使用形態の一例として、例えば企業内の会議(例えば電話会議又はテレビ会議)において会議端末装置を用いるシチュエーションを説明し、説明を簡単にするためにテレビ会議のシチュエーションを具体的な一例として説明する。即ち、以下の各実施形態におけるテレビ会議では、テレビ会議の参加者が各実施形態の会議端末装置を個々に用いる。但し、各実施形態の会議端末装置の使用方法は以下の各実施形態における使用形態に限定されない。
なお、本発明は、会議端末装置が行う各動作(ステップ)を有する増幅率登録方法として表現することも可能である。更に、本発明は、コンピュータとしての会議端末装置が行う各動作(ステップ)を、会議端末装置に内蔵されるプロセッサ(例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor))に実行させるためのプログラムとして表現しても良い。
(第1の実施形態)
第1の実施形態では、会議端末装置10A,10B,10Cは、各会議端末装置10A,10B,10Cを用いる各会議出席者UA,UB,UCの画像を撮像し、各会議出席者UA,UB,UCのテレビ会議における通話音声の音声信号を収音する。会議端末装置10A,10B,10Cは、各会議端末装置10A,10B,10Cを用いる各会議出席者UA,UB,UCの画像から顔画像を抽出し、抽出された各顔画像と会議端末装置10A,10B,10C毎に設定されたマイクのゲイン、即ちマイクにより収音された音声信号の音量レベルを増幅又は減衰させるため増幅率の値(以下、「マイクゲイン値」という)とを1対1に対応付けて登録して各会議端末装置10A,10B,10C内に保存(記憶)する。
第1の実施形態では、会議端末装置10A,10B,10Cは、各会議端末装置10A,10B,10Cを用いる各会議出席者UA,UB,UCの画像を撮像し、各会議出席者UA,UB,UCのテレビ会議における通話音声の音声信号を収音する。会議端末装置10A,10B,10Cは、各会議端末装置10A,10B,10Cを用いる各会議出席者UA,UB,UCの画像から顔画像を抽出し、抽出された各顔画像と会議端末装置10A,10B,10C毎に設定されたマイクのゲイン、即ちマイクにより収音された音声信号の音量レベルを増幅又は減衰させるため増幅率の値(以下、「マイクゲイン値」という)とを1対1に対応付けて登録して各会議端末装置10A,10B,10C内に保存(記憶)する。
先ず、本実施形態の会議端末装置10A,10B,10Cを含むテレビ会議システム100のシステム構成について、図1を参照して説明する。図1は、各実施形態のテレビ会議システム100のシステム構成の一例を示すブロック図である。テレビ会議システム100は、例えば3個の会議端末装置10Aと、会議端末装置10Bと、会議端末装置10Cとを含むが、3個の会議端末装置10A,10B,10Cの構成に限定されない。各会議端末装置10A,10B,10Cは、それぞれネットワークNWを介して接続されている。ネットワークNWは、無線ネットワークでも良いし、有線ネットワークでも良い。
以下の各実施形態では、会議端末装置10Aは会議出席者UAにより使用され、会議端末装置10Bは会議出席者UBにより使用され、会議端末装置10Cは会議出席者UCにより使用されるものとして説明する。なお、1個の会議端末装置10Aは、1人の会議出席者UAにより使用されず、例えば複数の会議出席者により共用されても良い。
会議端末装置10A,10B,10Cの内部構成は同一であるため、以下、例えば会議端末装置10Aの構成及び動作について、図2及び図3を参照して例示的に説明する。図2は、各実施形態の会議端末装置10Aの内部構成の一例を示すブロック図である。図3は、第1の実施形態の会議端末装置10Aの登録処理部213の内部構成の一例を示すブロック図である。
図2に示す会議端末装置10Aは、カメラ210と、画像入力I/F212と、登録処理部213と、画像エンコーダ214と、マイク220と、音声処理部222と、音声エンコーダ224と、多重化部230と、無線送信部240と、ディスプレイ310と、画像出力I/F312と、画像デコーダ314と、スピーカ320と、音声出力I/F322と、音声デコーダ324と、分離部330と、無線受信部340と、制御部400と、入力部500とを含む。
撮像部の一例としてのカメラ210は、例えば入力部500を介して入力された撮像操作に応じて、カメラ210の画角の範囲に含まれる会議出席者UA、即ち会議端末装置10Aを用いる会議出席者UAを撮像する。撮像された会議出席者UAの画像は、画像入力I/F212に入力される。
画像入力I/F(interface)212は、制御部400から出力された制御信号に応じて、カメラ210の撮像動作を制御し、更に、カメラ210から出力された画像信号を登録処理部213に出力する。また、画像入力I/F212は、制御部400から出力された制御信号に応じて、カメラ210から出力された画像信号に対して所定の信号処理(例えば符号化処理が可能となるように行われる正規化処理)を施し、所定の信号処理後の画像信号を画像エンコーダ214に出力する。
登録処理部213は、画像入力I/F212から出力された画像信号から会議出席者UAの顔画像を抽出し、抽出された会議出席者UAの顔画像と、例えば制御部400を介して入力部500から入力されたマイクゲイン値とを1対1に対応付けて登録する。登録処理部213の詳細な動作については図3から図5を参照して後述する。
画像エンコーダ214は、画像入力I/F212から出力された画像信号を符号化処理し、符号化処理後の画像信号を多重化部230に出力する。なお、画像エンコーダ214における符号化処理の方式及びその内容は、会議端末装置10A,10B,10Cにおいて既知である。
収音部の一例としてのマイク220は、会議端末装置10Aのユーザである会議出席者UAがテレビ会議の間における通話音声と周囲の音声(例えば環境音、ノイズ)とを収音し、更に、会議出席者UAが通話時でない間では周囲の音声を収音する。収音された音声は、マイク220によって電気信号、即ち音声信号に変換されて音声処理部222に入力される。
音声処理部222は、マイク220から出力された音声信号に所定の音声処理を行い、所定の音声処理後の音声信号を音声エンコーダ224に出力する。例えば、音声処理部222は、例えばマイク220から出力された音声信号の音量レベルを、登録処理部213から出力されたマイクゲイン値を用いて増幅又は減衰する(後述する数式(1)参照)。また、音声処理部222は、マイクゲイン値を用いて増幅又は減衰されたアナログの音声信号をデジタルの音声信号にAD変換(Analog Digital)して音声エンコーダ224に出力する。
ここで、本実施形態を含む各実施形態におけるマイクゲイン値について簡単に説明する。
本実施形態を含む各実施形態では、会議端末装置10A,10B,10Cは、ネットワークNWを介して、画像信号及び音声信号を互いに送受信する。この場合、送信側の会議端末装置(例えば会議端末装置10A)は、マイク220により収音された通話音声の音声信号の音量レベルを音声処理部222において調整(増幅又は減衰)する。また、受信側の会議端末装置(例えば会議端末装置10B)は、送信側の会議端末装置(例えば会議端末装置10A)から送信された音声信号の音量レベルを音声出力I/Fにおいて調整して出力する。
従って、受信側の会議端末装置(例えば会議端末装置10B)では、送信側の会議端末装置(例えば会議端末装置10A)のマイク220により収音された通話音声の音声信号の音量レベルが小さ過ぎると、送信側及び受信側の両方の会議端末装置間のテレビ会議における通話の快適さが損なわれる可能性がある。
また、受信側の会議端末装置(例えば会議端末装置10B)では、送信側の会議端末装置(例えば会議端末装置10A)のマイク220により収音された通話音声の音声信号の音量レベルが大き過ぎると、ノイズのレベルも増幅されてしまい、音声が割れてしまって送信側及び受信側の両方の会議端末装置間のテレビ会議における通話の快適さが損なわれる可能性がある。
そこで、本実施形態を含む各実施形態では、マイクゲイン値Gaは、所定の最小保証値と最大保証値との間の値として設定される。最小保証値と最大保証値とは、各会議端末装置10A,10B,10C間において音声信号の送受信テストを複数回繰り返して得られた実測値を基に統計処理等によって算出された値である。
例えば、音声処理部222は、例えばマイク220から出力された音声信号の音量レベルLvを、顔画像認証/登録部620から出力されたマイクゲイン値Gaを用いて増幅又は減衰することで、数式(1)に示す音量レベルVALUEに調整する。即ち、音声処理部222は、音量レベルVALUEの音声信号を音声エンコーダ224に出力する。数式(1)において、Lvはマイク220により収音された音声信号の音量レベルを表し、Gaはマイクゲイン値を表す。
音声エンコーダ224は、音声処理部222から出力された音声信号を符号化処理し、符号化処理後の音声信号を多重化部230に出力する。なお、音声エンコーダ224における符号化処理の方式及びその内容は、会議端末装置10A,10B,10Cにおいて既知である。
多重化部230は、画像エンコーダ214から出力された符号化処理後の画像信号と、音声エンコーダ224から出力された符号化処理後の音声信号とを多重化処理し、多重化処理後の信号を無線送信部240に出力する。
無線送信部240は、多重化部230から出力された多重化処理後の信号を、例えば無線通信用の所定周波数帯の信号に変換して他の会議端末装置10B,10Cに送信する。
ディスプレイ310は、カメラ210が撮像した画像信号、又は他の会議端末装置10B,10Cから送信された画像信号、即ちテレビ会議の状況(例えば他の会議出席者UB,UCが話している状況)を表す画像信号を表示する。
表示制御部の一例としての画像出力I/F312は、画像デコーダ314から出力された復号処理後の画像信号をディスプレイ310に表示させる。
画像デコーダ314は、分離部330から出力された画像信号を復号処理し、復号処理後の画像信号を画像出力I/F312に出力する。なお、画像デコーダ314における復号処理の方式及びその内容は、会議端末装置10A,10B,10Cにおいて既知である。
音声出力部の一例としてのスピーカ320は、音声出力I/F322から出力された音声信号、即ち他の会議端末装置10B,10Cを用いる他の会議出席者UB,UCがテレビ会議の間に話す通話音声の音声信号を出力する。
音声出力I/F322は、音声デコーダ324から出力された復号処理後のデジタルの音声信号をアナログの音声信号にDA(Digital Analog)変換してスピーカ320に出力する。また、音声出力I/F322は、DA変換後の音声信号の音量レベルを調整(増幅又は減衰)してスピーカ320に出力しても良い。
音声デコーダ324は、分離部330から出力された音声信号を復号処理し、復号処理後の音声信号を音声出力I/F322に出力する。なお、音声デコーダ324における復号処理の方式及びその内容は、会議端末装置10A,10B,10Cにおいて既知である。
分離部330は、無線受信部340から出力された多重化処理後の信号を、画像信号と音声信号とに分離し、画像信号を画像デコーダ314に出力し、音声信号を音声デコーダ324に出力する。
無線受信部340は、例えば他の会議端末装置10B,10Cから送信された無線通信用の所定周波数帯の信号を受信し、更に、受信した信号をベースバンドの多重化処理後の信号に変換して分離部330に出力する。
制御部400は、会議端末装置10Aの各部を動作させるための制御信号を生成し、会議端末装置10Aの各部に制御信号を出力する。
入力部500は、会議出席者UAが会議端末装置10Aに対する操作を入力するためのユーザインターフェースであり、会議出席者UAの操作内容に応じた操作コマンド信号を制御部400に出力する。入力部500は、例えば、会議端末装置10Aがスマートフォン又はタブレット端末である場合には、ディスプレイ310の上に配置され、会議出席者UAの指又はスタイラスペンによる入力操作を受け付け可能なタッチパネルを用いて構成される。また、入力部500は、会議端末装置10Aが携帯電話機である場合には、電話番号等を入力するテンキー、オンフック又はオフフックを行う通話器キー及びファンクションキー等の各種キーを用いて構成可能である。
ここで図3を参照して、登録処理部213の内部構成及びその動作を詳細に説明する。図3に示す登録処理部213は、顔画像切り出し部600と、顔画像正規化部610と、顔画像認証/登録部620と、顔画像DB(database)630と、マイクゲイン設定部640と、マイクゲイン登録部650とを含む。
顔画像切り出し部600は、公知の顔画像抽出処理によって、画像入力I/F212から出力された会議出席者UAの画像を含む画像信号から会議出席者UAの顔画像データを抽出する(切り出す)。顔画像切り出し部600は、抽出された会議出席者UAの顔画像データを顔画像正規化部610に出力する。
顔画像正規化部610は、顔画像切り出し部600から出力された顔画像データに対し所定の正規化処理を施して顔画像認証/登録部620に出力する。所定の正規化処理は、例えば顔画像データに対する顔画像のサイズ及び明るさを調整し、顔画像認証/登録部620における顔画像の認証処理を効率的に行わせるための既定の処理である。
登録部の一例としての顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データに対して公知の顔認証処理を行うことで、顔画像正規化部610から出力された顔画像が顔画像DB630に登録(記憶)されているか否かを判定する。
顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データが顔画像DB630に登録(記憶)されていないと判定した場合には、顔画像正規化部610から出力された顔画像データを、顔画像DB630の個人認証用顔画像データ格納フィールド710(図5参照)に登録する。また、顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データを、顔画像DB630の個人認証用顔画像データ格納フィールド710(図5参照)に登録した旨の通知をマイクゲイン設定部640に出力する。
図5は、顔画像DBに登録されるデータの構造の一例を示す説明図である。顔画像DB630では、個人認証用顔画像データ格納フィールド710と、マイクゲイン値格納フィールド720とが1対1に対応付けられたレコードが複数格納されている。
個人認証用顔画像データ格納フィールド710には、顔画像正規化部610から出力された顔画像データ、又は顔画像認証/登録部620における顔認証処理結果としての顔画像の特徴点のデータが格納される。個人認証用顔画像データ格納フィールド710に顔画像認証/登録部620における顔認証処理結果としての顔画像の特徴点のデータが格納されることで、顔画像DB630の容量を低減できる。マイクゲイン値格納フィールド720には、マイクゲイン登録部650により書き込まれて登録されたマイクゲイン値が格納される。
また、顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データが顔画像DB630に既に登録(記憶)されていると判定した場合には、顔画像正規化部610から出力された顔画像データに対応付けて登録されているマイクゲイン値を音声処理部222に出力する。
記憶部の一例としての顔画像DB630は、図5に示す個人認証用顔画像データ格納フィールド710とマイクゲイン値格納フィールド720とを含むレコードを記憶する。このレコードは、個人認証用顔画像データ格納フィールド710に格納される顔画像、即ち会議端末装置10Aを用いる会議出席者毎に生成される。
増幅率設定部の一例としてのマイクゲイン設定部640は、入力部500において入力されたマイクゲイン値を制御部400から取得した場合には、顔画像認証/登録部620から出力された通知を基に、マイクゲイン値をマイクゲイン登録部650に出力する。なお、制御部400は、入力部500において入力されたマイクゲイン値が上述した最小保証値から最大保証値の間の値ではない場合には、所定の警告メッセージをディスプレイ310に表示させ、適正なマイクゲイン値を会議出席者UAに再度入力させても良い。
なお、マイクゲイン設定部640は、顔画像正規化部610から出力された顔画像データに対応付けられるマイクゲイン値が未だ登録されていない場合には、入力部500において入力されたマイクゲイン値を用いずに、例えば参考特許文献1に示すゲイン自動設定装置の構成を用いることで、マイク220により収音された通話音声の音声信号に適したマイクゲイン値を算出してマイクゲイン登録部650に出力しても良い。
(参考特許文献1) 特開2011−151634号公報
登録部の一例としてのマイクゲイン登録部650は、マイクゲイン設定部640から出力されたマイクゲイン値を、顔画像認証/登録部620により登録された顔画像データに対応付けて顔画像DB630に登録する。即ち、マイクゲイン登録部650は、マイクゲイン設定部640から出力されたマイクゲイン値を、顔画像認証/登録部620により登録された顔画像データが格納された個人認証用顔画像データ格納フィールド710に対応するマイクゲイン値格納フィールド720に書き込むことで登録する。
マイクゲイン登録部650は、マイクゲイン設定部640から出力されたマイクゲイン値を個人認証用顔画像データ格納フィールド710に対応するマイクゲイン値格納フィールド720に登録した旨の通知を顔画像認証/登録部620に出力する。これにより、顔画像認証/登録部620は、顔画像データとマイクゲイン値とが1対1に対応付けられたレコードが顔画像DB630に記憶されたことを判定することができる。
次に、本実施形態の会議端末装置10Aの登録処理部213の動作手順について、図4を参照して説明する。図4は、第1の実施形態の会議端末装置10Aの登録処理部213の動作手順を説明するフローチャートである。
図4において、顔画像切り出し部600は、公知の顔画像抽出処理によって、画像入力I/F212から出力された会議出席者UAの画像を含む画像信号から会議出席者UAの顔画像データを抽出する(S11)。顔画像切り出し部600は、抽出された会議出席者UAの顔画像データを顔画像正規化部610に出力する。
顔画像正規化部610は、顔画像切り出し部600から出力された顔画像データに対し所定の正規化処理を施して顔画像認証/登録部620に出力する(S12)。
顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データに対して公知の顔認証処理を行うことで、顔画像正規化部610から出力された顔画像が顔画像DB630に登録(記憶)されているか否かを判定する(S13)。
顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データが顔画像DB630に既に登録(記憶)されていると判定した場合には(S13、YES)、顔画像正規化部610から出力された顔画像データに対応付けて登録されているマイク220のマイクゲイン値を顔画像DB630から取得する(S14)。更に、顔画像認証/登録部620は、顔画像DB630から取得したマイク220のマイクゲイン値を音声処理部222に出力する(S18)。
一方、顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データが顔画像DB630に登録(記憶)されていないと判定した場合には(S13、NO)、顔画像正規化部610から出力された顔画像データを、顔画像DB630の個人認証用顔画像データ格納フィールド710(図5参照)に新規に登録する(S15)。顔画像認証/登録部620は、顔画像正規化部610から出力された顔画像データを、顔画像DB630の個人認証用顔画像データ格納フィールド710(図5参照)に登録した旨の通知をマイクゲイン設定部640に出力する。
マイクゲイン設定部640は、入力部500において入力されたマイクゲイン値を制御部400から取得した場合には、顔画像認証/登録部620から出力された通知を基に、入力部500において入力されたマイクゲイン値を設定値としてマイクゲイン登録部650に出力する(S16)。
マイクゲイン登録部650は、マイクゲイン設定部640から出力されたマイクゲイン値を、顔画像認証/登録部620により登録された顔画像データが格納された個人認証用顔画像データ格納フィールド710に対応するマイクゲイン値格納フィールド720に書き込むことで登録する(S17)。ステップS17の後、顔画像認証/登録部620は、顔画像DB630から取得したマイク220のマイクゲイン値を音声処理部222に出力する(S18)。
なお、音声処理部222は、ステップS18において取得したマイクゲイン値を用いて、例えばマイク220から出力された音声信号の音量レベルLvを増幅又は減衰することで、数式(1)に示す音量レベルVALUEに調整する。
以上により、本実施形態の会議端末装置10Aは、カメラ210により撮像された会議出席者UAの顔画像と、マイク220により収音された会議出席者UAが会議(例えば電話会議又はテレビ会議)における発言内容を含む通話音声の音声信号を増幅させるためのマイクゲイン値と、を対応付けて登録することができる。
これにより、会議端末装置10Aは、例えばネットワークNWを介して接続された相手端末装置(例えば会議端末装置10B,10C)との間の電話会議又はテレビ会議において、会議端末装置10Aを用いる会議出席者UAの発言内容を含む通話音声の音声信号の音量レベルを、会議出席者UAに応じて増幅又は減衰させることができる。従って、会議端末装置10Aは、会議端末装置10Aを用いる会議出席者UAの声の声量に合わせてマイクゲイン値を調整できるので、通話音声が割れることがないので通話の快適さを損なわずに電話会議又はテレビ会議を円滑に行うことができる。
(第2の実施形態)
例えば会議出席者UAの声量が一定である場合、会議端末装置10Aと会議出席者UAとの間の距離が長いと、会議端末装置10Aと会議出席者UAとの間の距離が短い場合に比べて、マイク220により収音された会議出席者UAの音声の音量レベルは小さくなる。一方、同様に会議端末装置10Aと会議出席者UAとの間の距離が短いと、会議端末装置10Aと会議出席者UAとの間の距離が長い場合に比べて、マイク220により収音された会議出席者UAの音声の音量レベルは大きくなる。
例えば会議出席者UAの声量が一定である場合、会議端末装置10Aと会議出席者UAとの間の距離が長いと、会議端末装置10Aと会議出席者UAとの間の距離が短い場合に比べて、マイク220により収音された会議出席者UAの音声の音量レベルは小さくなる。一方、同様に会議端末装置10Aと会議出席者UAとの間の距離が短いと、会議端末装置10Aと会議出席者UAとの間の距離が長い場合に比べて、マイク220により収音された会議出席者UAの音声の音量レベルは大きくなる。
第1の実施形態では、上述した会議端末装置10Aと会議出席者UAとの間の距離に起因する音声信号の音量レベルの大小関係は考慮されていない。
第2の実施形態では、会議端末装置10Aaは、マイクゲイン値を顔画像DB630に登録する際、会議端末装置10Aと会議出席者UAとの間の距離に起因する音声信号の音量レベルの大小関係を考慮して、マイクゲイン値を補正する。
図6は、第2の実施形態の会議端末装置10Aaの登録処理部213の内部構成の一例を示すブロック図である。本実施形態の会議端末装置10Aaは、図2に示す会議端末装置10の構成に、測距部810を更に含む構成である。即ち、会議端末装置10Aaは、カメラ210と、画像入力I/F212と、登録処理部213と、画像エンコーダ214と、マイク220と、音声処理部222と、音声エンコーダ224と、多重化部230と、無線送信部240と、ディスプレイ310と、画像出力I/F312と、画像デコーダ314と、スピーカ320と、音声出力I/F322と、音声デコーダ324と、分離部330と、無線受信部340と、制御部400と、入力部500と、測距部810とを含む。
図6に示す本実施形態の会議端末装置10Aaでは、図2又は図3に示す会議端末装置10A又は登録処理部213と同一の構成及び動作をするものには同一の符号を付して説明を省略又は簡略化し、異なる内容について説明する。
測距部810は、予め定められた既定の周期毎に、例えば市販されている測距センサを用いて構成され、会議端末装置10Aと会議出席者UAとの間の距離を測定し、測定結果の距離データを顔画像認証/登録部620に出力する。なお、測距部810は、複数のカメラ210を用いて三角測量の原理に基づいて、会議端末装置10Aと会議出席者UAとの間の距離を測定しても良い。また、測距部810は、スペクトル拡散された超音波の往復時間を基にして、会議端末装置10Aと会議出席者UAとの間の距離を測定しても良い。
顔画像認証/登録部620は、測距部810から出力された距離データを用いて、数式(2)に従って、会議出席者UAの顔画像データに対応付けられたマイクゲイン値Gaを補正する。顔画像認証/登録部620、顔画像正規化部610から出力された顔画像データに対応付けられているマイクゲイン値Gaを、数式(2)に従って補正されたマイクゲイン値Gaに更新する。顔画像認証/登録部620は、更新されたマイクゲイン値Gaを音声処理部222に出力する。
数式(2)において、Gaは補正後のマイクゲイン値を表し、Ga0は会議端末装置10Aから既定の基準距離(例えば100cm)離れた位置におけるマイクゲイン値を表し、Faは会議端末装置10Aと会議出席者UAとの間の距離と基準距離(例えば100cm)との違いに応じたマイクゲイン値の補正要因係数を表す。
なお、基準距離はマイク220の性能に応じて定められる値であり、常に100cmに限定されない。また、補正要因係数Faは、例えば音源が点である点音源モデルを想定した場合に、音声信号の音量レベルは点音源からの距離の2乗に比例して減衰する事実を基にして定められる。本実施形態では、補正要因係数Faは、数式(3)により示される。数式(3)において、B1は基準距離を表し、B2は測距部810により測定された会議端末装置10Aと会議出席者UAとの距離を表す。
次に、本実施形態の会議端末装置10Aaの登録処理部213の動作手順について、図7を参照して説明する。図7は、第2の実施形態の会議端末装置10Aaの登録処理部213の動作手順を説明するフローチャートである。図7では、図4に示すフローチャートの各動作と同一の内容の図示及び説明を省略又は簡略化し、異なる内容について説明する。
図7において、顔画像認証/登録部620は、ステップS14又はステップS17の後、会議出席者UAの顔画像データに対応付けて登録されているマイクゲイン値Gaを顔画像DB630から読み出して取得する(S21)。
顔画像認証/登録部620は、会議端末装置10Aと会議出席者UAとの間の距離データを測距部810から取得する(S22)。
顔画像認証/登録部620は、ステップS21において読み出されたマイクゲイン値Gaと、ステップS22において取得された会議端末装置10Aと会議出席者UAとの間の距離データとを基に、上述した数式(2)に従って、会議出席者UAの顔画像データに対応付けられたマイクゲイン値Gaを補正する(S23)。
顔画像認証/登録部620は、ステップS23において補正されたマイクゲイン値Gaを音声処理部222に出力する(S24)。
以上により、本実施形態の会議端末装置10Aaは、測距部810においてマイク220と会議端末装置10Aaを用いる会議出席者UAとの間の距離を測定する。これにより、会議端末装置10Aaは、会議端末装置10Aaと会議出席者UAとの間の距離に起因する音声信号の音量レベルの大小関係を考慮して、測定結果の距離に応じて、会議出席者毎に登録されたマイク220のマイクゲイン値を効果的に補正することができる。例えば、会議端末装置10Aaは、マイク220と会議出席者UAとの距離が長い場合には、マイク220のマイクゲイン値Gaを大きな値に補正でき、マイク220と会議出席者UAとの距離が短い場合には、マイク220のマイクゲイン値Gaを小さい値に補正できる。
(第3の実施形態)
第3の実施形態では、会議端末装置10Abは、会議出席者UAの入力操作に応じて、顔画像DB630に記憶されている1つ又は複数のレコード、即ち会議出席者の顔画像データとマイク220のマイクゲイン値Gaとが1対1に対応付けられた1つ又は複数のレコードを削除し、又は、顔画像データ若しくはマイクゲイン値Gaを修正する。
第3の実施形態では、会議端末装置10Abは、会議出席者UAの入力操作に応じて、顔画像DB630に記憶されている1つ又は複数のレコード、即ち会議出席者の顔画像データとマイク220のマイクゲイン値Gaとが1対1に対応付けられた1つ又は複数のレコードを削除し、又は、顔画像データ若しくはマイクゲイン値Gaを修正する。
図8は、第3の実施形態の会議端末装置10Abの登録処理部213及び制御部400の内部構成の一例を示すブロック図である。本実施形態の会議端末装置10Abは、図2に示す会議端末装置10の制御部400の構成に、顔画像DBエディタ420を更に含む構成である。即ち、会議端末装置10Abは、カメラ210と、画像入力I/F212と、登録処理部213と、画像エンコーダ214と、マイク220と、音声処理部222と、音声エンコーダ224と、多重化部230と、無線送信部240と、ディスプレイ310と、画像出力I/F312と、画像デコーダ314と、スピーカ320と、音声出力I/F322と、音声デコーダ324と、分離部330と、無線受信部340と、顔画像DBエディタ420を含む制御部400と、入力部500とを含む。
図8に示す本実施形態の会議端末装置10Abでは、図2又は図3に示す会議端末装置10A又は登録処理部213と同一の構成及び動作をするものには同一の符号を付して説明を省略又は簡略化し、異なる内容について説明する。
顔画像DBエディタ420は、会議出席者UAの入力部500に入力された修正操作に応じて、会議出席者の顔画像データとマイク220のマイクゲイン値Gaとが1対1に対応付けて顔画像DB630に記憶されている1つ又は複数のレコードを削除し、又は、顔画像データ若しくはマイクゲイン値Gaを修正する。
例えば、退職者の顔画像データとマイクゲイン値Gaとが1対1に対応付けて登録されたレコードが顔画像DB630に記憶されている場合、そのレコードは今後不要となる可能性が高いと考えられる。この場合、顔画像DBエディタ420は、会議出席者UAの入力部500に入力された修正操作に応じて、退職者の顔画像データとマイクゲイン値Gaとが1対1に対応付けて登録されたレコードを削除する(図11参照)。
また、例えば会議出席者UAの顔画像データと1対1に対応付けて登録されているマイクゲイン値Gaが少し低いと考えられる場合、他の会議端末装置10B,10Cに送信される通話音声の音声信号の音量レベルが小さくなり、快適なテレビ会議の進行が困難となる場合がある。この場合、顔画像DBエディタ420は、会議出席者UAの入力部500に入力された修正操作に応じて、会議出席者UAの顔画像データと1対1に対応付けられたマイクゲイン値Gaを現在値より大きな値に修正する(図9及び図10参照)。
次に、本実施形態の会議端末装置10Abの顔画像DBエディタ420の動作と、その動作に用いられる画面の状態遷移について、図12を参照して説明する。図12は、第3の実施形態における顔画像DBエディタ420の動作に用いられる画面の状態遷移の一例を示す図である。図12の説明では、必要に応じて、図9(A)、図9(B)、図10、図11(A)及び図11(B)を参照する。
図9(A)は、顔画像DBエディタ420を起動した場合のメイン画面の一例を示す図である。図9(B)は、処理選択画面の一例を示す図である。
例えば図9(A)に示すメイン画面において会議出席者UAの指FGによって「AAAさん」のレコードが選択(例えばタップ操作)されたとする(S31)。顔画像DBエディタ420は、指FGによる「AAAさん」のレコードの選択に応じて、「AAAさん」のレコードに関する処理画面として、例えば「マイクゲイン値更新」のメニューと「レコード削除」のメニューとをディスプレイ310に表示させて、会議出席者UAに選択を促す(図9(B)参照)。
ここで、会議出席者UAの指FGが「マイクゲイン値更新」のメニューを選択した場合(S32−1)、顔画像DBエディタ420は、ステップS31において選択された「AAAさん」のレコードにおいて登録されているマイクゲイン値Gaの更新用画面をディスプレイ310に表示する(図10参照)。図10は、マイクゲイン値Gaの更新用画面の一例を示す図である。
例えば図10に示す更新用画面において会議出席者UAの指FGによって「AAAさん」のマイクゲイン値が「12」と入力されて「更新実行」のボタンが選択されたとする(S32−2)。顔画像DBエディタ420は、「AAAさん」のレコードのマイクゲイン値Gaを、ステップS32−2において入力されたマイクゲイン値に更新する。
また、会議出席者UAの指FGが「レコード削除」のメニューを選択した場合(S33−1)、顔画像DBエディタ420は、ステップS31において選択された「AAAさん」のレコードを削除するための確認用画面をディスプレイ310に表示する(図11(A)参照)。図11(A)は、メイン画面において選択されたレコードを削除する確認用画面の一例を示す図である。図11(B)は、選択されたレコードの削除後のメイン画面の一例を示す図である。
例えば図11(A)に示す確認用画面において会議出席者UAの指FGによって「AAAさん」に関するレコードを削除するための「はい」のボタンが選択されたとする(S33−2)。顔画像DBエディタ420は、「AAAさん」のレコードを、顔画像DB630から削除する。
以上により、本実施形態の会議端末装置10Abは、会議端末装置10Aを用いる会議出席者UAの入力操作に応じて、会議出席者毎に登録されたマイク220のマイクゲイン値を適宜修正することができ、又は必要ないレコードを削除することができ、顔画像DB630のメンテナンスを容易に行うことができる。
以下、上述した本発明に係る会議端末装置の構成、作用及び効果を説明する。
本発明の一実施形態は、ネットワークを介して接続された相手端末装置と通信する会議端末装置であって、前記会議端末装置を用いる会議出席者の画像を撮像する撮像部と、前記会議出席者の発言内容を含む通話音声を収音する収音部と、撮像された前記会議出席者の画像を基に、前記会議出席者の顔画像を抽出する顔画像抽出部と、収音された前記通話音声の音声信号を増幅させるための前記収音部の増幅率を設定する増幅率設定部と、抽出された前記会議出席者の顔画像と設定された前記収音部の増幅率とを対応付けて登録する登録部と、を備える会議端末装置である。
この構成によれば、会議端末装置10Aは、撮像部としてのカメラ210により撮像された会議出席者の顔画像と、収音部としてのマイク220により収音された会議出席者が会議(例えば電話会議又はテレビ会議)における発言内容を含む通話音声の音声信号を増幅させるためのマイクゲイン値と、を対応付けて登録することができる。
これにより、会議端末装置10Aは、例えばネットワークNWを介して接続された相手端末装置(例えば会議端末装置10B,10C)との間の電話会議又はテレビ会議において、会議端末装置10Aを用いる会議出席者の発言内容を含む通話音声の音声信号の音量レベルを、会議出席者に応じて増幅又は減衰させることができる。従って、会議端末装置10Aは、会議端末装置10Aを用いる会議出席者の声の声量に合わせてマイクゲイン値を調整できるので、通話音声が割れることがないので電話会議又はテレビ会議を円滑に行うことができる。
また、本発明の一実施形態は、前記会議出席者の顔画像と前記収音部の増幅率とを対応付けて記憶する記憶部を更に備える会議端末装置である。
この構成によれば、会議端末装置10Aは、会議出席者の顔画像とマイク220のマイクゲイン値とを1対1に対応付けて登録したデータを記憶することができる。
また、本発明の一実施形態は、前記会議出席者毎に登録された前記収音部の増幅率に応じて、収音された前記通話音声の音声信号の音量レベルを調整する音声処理部、を更に備える会議端末装置である。
この構成によれば、会議端末装置10Aは、会議端末装置10Aを用いる会議出席者毎に登録されたマイク220のマイクゲイン値に応じて、マイク220により収音された通話音声の音声信号の音量レベルを調整(例えば増幅又は減衰)することができる。
また、本発明の一実施形態は、前記収音部と前記会議出席者との間の距離を測定する測距部を更に備え、前記登録部は、測定された前記距離に応じて、前記会議出席者毎に登録された収音部の増幅率を補正する会議端末装置である。
この構成によれば、会議端末装置10Aaは、測距部810においてマイク220と会議端末装置10Aaを用いる会議出席者との間の距離を測定できるので、測定結果の距離に応じて、会議出席者毎に登録されたマイク220のマイクゲイン値を効果的に補正することができる。例えば、会議端末装置10Aaは、マイク220と会議出席者との距離が長い場合には、マイク220のマイクゲイン値を大きな値に補正でき、マイク220と会議出席者との距離が短い場合には、マイク220のマイクゲイン値を小さい値に補正できる。
また、本発明の一実施形態は、所定の修正操作に応じて、前記記憶部に記憶された前記収音部の増幅率を修正する修正部を更に備える会議端末装置である。
この構成によれば、会議端末装置10Aは、テレビ会議の会議出席者毎に登録されたマイク220のマイクゲイン値を、会議出席者の修正操作に応じて、適宜修正することができ、顔画像DB630のメンテナンスを容易に行うことができる。
また、本発明の一実施形態は、ネットワークを介して接続された相手端末装置と通信する会議端末装置における増幅率登録方法であって、前記会議端末装置を用いる会議出席者の画像を撮像するステップと、前記会議出席者の発言内容を含む通話音声を収音するステップと、撮像された前記会議出席者の画像を基に、前記会議出席者の顔画像を抽出するステップと、収音された前記通話音声の音声信号を増幅させるための前記収音部の増幅率を設定するステップと、抽出された前記会議出席者の顔画像と設定された前記収音部の増幅率とを対応付けて登録するステップと、を有する増幅率登録方法である。
この方法によれば、会議端末装置10Aは、撮像部としてのカメラ210により撮像された会議出席者の顔画像と、収音部としてのマイク220により収音された会議出席者が会議(例えば電話会議又はテレビ会議)における発言内容を含む通話音声の音声信号を増幅させるためのマイクゲイン値と、を対応付けて登録することができる。
これにより、会議端末装置10Aは、例えばネットワークNWを介して接続された相手端末装置(例えば会議端末装置10B,10C)との間の電話会議又はテレビ会議において、会議端末装置10Aを用いる会議出席者の発言内容を含む通話音声の音声信号の音量レベルを、会議出席者に応じて増幅又は減衰させることができる。従って、会議端末装置10Aは、会議端末装置10Aを用いる会議出席者の声の声量に合わせてマイクゲイン値を調整できるので、通話音声が割れることがないので電話会議又はテレビ会議を円滑に行うことができる。
以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
本発明は、ネットワークを介して接続された相手端末との間の電話会議又はテレビ会議において、会議出席者の発言内容を含む通話音声の音声信号の音量レベルを会議出席者に応じて増幅又は減衰でき、電話会議又はテレビ会議を円滑に行う会議端末装置又はマイクゲイン登録方法として有用であり、会議端末装置としては例えば携帯電話機、スマートフォン又はタブレット端末が該当する。
10A、10B、10C 会議端末装置
210 カメラ
212 画像入力I/F
213 登録処理部
214 画像エンコーダ
220 マイク
222 音声処理部
224 音声エンコーダ
230 多重化部
240 無線送信部
310 ディスプレイ
312 画像出力I/F
314 画像デコーダ
320 スピーカ
322 音声出力I/F
324 音声デコーダ
330 分離部
340 無線受信部
400 制御部
420 顔画像DBエディタ
500 入力部
600 顔画像切り出し部
610 顔画像正規化部
620、621 顔画像認証/登録部
630 顔画像DB
640 マイクゲイン設定部
650 マイクゲイン登録部
810 測距部
210 カメラ
212 画像入力I/F
213 登録処理部
214 画像エンコーダ
220 マイク
222 音声処理部
224 音声エンコーダ
230 多重化部
240 無線送信部
310 ディスプレイ
312 画像出力I/F
314 画像デコーダ
320 スピーカ
322 音声出力I/F
324 音声デコーダ
330 分離部
340 無線受信部
400 制御部
420 顔画像DBエディタ
500 入力部
600 顔画像切り出し部
610 顔画像正規化部
620、621 顔画像認証/登録部
630 顔画像DB
640 マイクゲイン設定部
650 マイクゲイン登録部
810 測距部
Claims (6)
- ネットワークを介して接続された相手端末装置と通信する会議端末装置であって、
前記会議端末装置を用いる会議出席者の画像を撮像する撮像部と、
前記会議出席者の発言内容を含む通話音声を収音する収音部と、
撮像された前記会議出席者の画像を基に、前記会議出席者の顔画像を抽出する顔画像抽出部と、
収音された前記通話音声の音声信号を増幅させるための前記収音部の増幅率を設定する増幅率設定部と、
抽出された前記会議出席者の顔画像と設定された前記収音部の増幅率とを対応付けて登録する登録部と、を備える、
会議端末装置。 - 請求項1に記載の会議端末装置であって、
前記会議出席者の顔画像と前記収音部の増幅率とを対応付けて記憶する記憶部、を更に備える、
会議端末装置。 - 請求項1に記載の会議端末装置であって、
前記会議出席者毎に登録された前記収音部の増幅率に応じて、収音された前記通話音声の音声信号の音量レベルを調整する音声処理部、を更に備える、
会議端末装置。 - 請求項1に記載の会議端末装置であって、
前記収音部と前記会議出席者との間の距離を測定する測距部、を更に備え、
前記登録部は、
測定された前記距離に応じて、前記会議出席者毎に登録された収音部の増幅率を補正する、
会議端末装置。 - 請求項2に記載の会議端末装置であって、
所定の修正操作に応じて、前記記憶部に記憶された前記収音部の増幅率を修正する修正部、を更に備える、
会議端末装置。 - ネットワークを介して接続された相手端末装置と通信する会議端末装置における増幅率登録方法であって、
前記会議端末装置を用いる会議出席者の画像を撮像するステップと、
前記会議出席者の発言内容を含む通話音声を収音するステップと、
撮像された前記会議出席者の画像を基に、前記会議出席者の顔画像を抽出するステップと、
収音された前記通話音声の音声信号を増幅させるための収音部の増幅率を設定するステップと、
抽出された前記会議出席者の顔画像と設定された前記収音部の増幅率とを対応付けて登録するステップと、を有する、
増幅率登録方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013091651A JP2014216787A (ja) | 2013-04-24 | 2013-04-24 | 会議端末装置及び増幅率登録方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013091651A JP2014216787A (ja) | 2013-04-24 | 2013-04-24 | 会議端末装置及び増幅率登録方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014216787A true JP2014216787A (ja) | 2014-11-17 |
Family
ID=51942157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013091651A Pending JP2014216787A (ja) | 2013-04-24 | 2013-04-24 | 会議端末装置及び増幅率登録方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014216787A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019012587A1 (ja) * | 2017-07-10 | 2019-01-17 | ヤマハ株式会社 | ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム |
CN110191305A (zh) * | 2019-05-07 | 2019-08-30 | 广州市迪士普音响科技有限公司 | 一种人工智能数字会议系统 |
-
2013
- 2013-04-24 JP JP2013091651A patent/JP2014216787A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019012587A1 (ja) * | 2017-07-10 | 2019-01-17 | ヤマハ株式会社 | ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム |
JPWO2019012587A1 (ja) * | 2017-07-10 | 2020-08-13 | ヤマハ株式会社 | ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム |
US10893358B2 (en) | 2017-07-10 | 2021-01-12 | Yamaha Corporation | Gain adjustment device, remote conversation device, and gain adjustment method |
CN110191305A (zh) * | 2019-05-07 | 2019-08-30 | 广州市迪士普音响科技有限公司 | 一种人工智能数字会议系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9253303B2 (en) | Signal processing apparatus and storage medium | |
KR101884709B1 (ko) | 사용자 단말의 음량 조정 방법, 장치 및 단말 | |
JP5857674B2 (ja) | 画像処理装置、及び画像処理システム | |
US10298742B2 (en) | Transferring information from a sender to a recipient during a telephone call under noisy environment | |
US20170345437A1 (en) | Voice receiving method and device | |
CN110177296A (zh) | 一种视频播放方法及移动终端 | |
JP2011205243A (ja) | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム | |
CN115831155A (zh) | 音频信号的处理方法、装置、电子设备及存储介质 | |
JP2009178783A (ja) | コミュニケーションロボット及びその制御方法 | |
CN111988704B (zh) | 声音信号处理方法、装置以及存储介质 | |
JP5418327B2 (ja) | ビデオ会議装置 | |
JP5609431B2 (ja) | 音量制御装置、音量制御方法およびプログラム | |
JP2014216787A (ja) | 会議端末装置及び増幅率登録方法 | |
JP2017126888A (ja) | 指向性制御システム及び音声出力制御方法 | |
JP5120020B2 (ja) | 画像付音声通信システム、画像付音声通信方法およびプログラム | |
US9843683B2 (en) | Configuration method for sound collection system for meeting using terminals and server apparatus | |
WO2017067319A1 (zh) | 信息传输方法和装置、及终端 | |
JP6569853B2 (ja) | 指向性制御システム及び音声出力制御方法 | |
KR101322081B1 (ko) | 비디오 주밍에 연동한 오디오 출력장치 및 방법 | |
US11134331B2 (en) | Mixing microphones for wireless headsets | |
JP2017163466A (ja) | 情報処理装置および会議システム | |
JP2015115926A (ja) | 携帯端末装置、読唇通信方法、及びプログラム | |
JP2020053882A (ja) | コミュニケーション装置、コミュニケーションプログラム、及びコミュニケーション方法 | |
JP2019140517A (ja) | 情報処理装置及びプログラム | |
EP4075822B1 (en) | Microphone mute notification with voice activity detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150116 |