JP5380777B2 - 音声会議装置 - Google Patents

音声会議装置 Download PDF

Info

Publication number
JP5380777B2
JP5380777B2 JP2007040507A JP2007040507A JP5380777B2 JP 5380777 B2 JP5380777 B2 JP 5380777B2 JP 2007040507 A JP2007040507 A JP 2007040507A JP 2007040507 A JP2007040507 A JP 2007040507A JP 5380777 B2 JP5380777 B2 JP 5380777B2
Authority
JP
Japan
Prior art keywords
sound
directivity
command
control unit
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007040507A
Other languages
English (en)
Other versions
JP2008205896A (ja
Inventor
亮 大内
卓朗 曽根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007040507A priority Critical patent/JP5380777B2/ja
Publication of JP2008205896A publication Critical patent/JP2008205896A/ja
Application granted granted Critical
Publication of JP5380777B2 publication Critical patent/JP5380777B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

この発明は、音声を収音するとともに、特定の方向に強い指向性を有する音声ビームを出力する音声会議装置に関する。
従来、スピーカアレイの各ユニットに供給する音声信号を遅延制御することで、特定の方向に強い指向性を有する音声ビームを出力する放音装置が知られている。
例えば特許文献1では各スピーカユニットの遅延量など、指向性を制御するパラメータを設定するために、マイクアレイを用いて発話者の位置を特定し、発話者の方向に音声ビームを向ける装置が提案されている。
特開2006−270876号公報
しかし、特許文献1の装置は、発話者の方向に音声ビームを向けるため、汎用性が低いものであった。例えば、家庭内で使用する場合、一方では大音量で映画の音声を聴きたいユーザが存在し、他方では電話をするため映画の音声を小さくしたいユーザが存在する等、特定の方向に音声ビームを向けるだけでなく、特定の方向だけ音量を下げたい場合が有る。
そこで、この発明は、特定の方向に音声ビームを向けたり、特定の方向だけ音量を下げたりする設定を容易に行うことができる音声会議装置を提供することを目的とする。
この発明は、音声を収音し、収音信号を出力する収音部と、音源位置を検出する音源位置検出部と、音声に特定の方向へ指向性を持たせて放音する放音部と、前記収音信号を入力し、収音信号に含まれる指向性を指示するコマンドを抽出する音声解析部と、前記音源位置検出部が検出した音源位置、および前記音声解析部の抽出した指向性を指示するコマンドの内容に基づいて、前記放音部の指向性パターンを設定する制御部と、を備え、前記制御部は、前記音声解析部が話者自身の方向を指し示す言語を抽出した場合、前記音源位置の方向へ前記放音部の指向性を向け、前記音声解析部が話者以外の方向を指し示す言語を抽出した場合、前記音源位置以外の方向へ前記放音部の指向性を向け、所定方向にのみ音量が低下するように指向性パターンを設定する、収音した音声を他装置に出力する音声会議装置であることを特徴とする。
この構成では、収音信号から指向性を指示するコマンドを抽出する。例えば、音声認識により「こちらへ」、「音を大きく」等の単語を抽出する。また、収音信号の基となった音源の位置を検出する。音源位置の検出は、例えばマイクアレイの各マイクユニットの出力音声信号から線形予測を行う。これらのコマンド抽出結果、音源位置の検出結果に基づいて指向性を制御する。指向性の設定は種々の態様が考えられるが、例えば、「こちらへ」という単語を抽出した場合、その方向に強い指向性を有する音声ビームを向ける。
また、この発明は、さらに、前記音声解析部は、収音信号に含まれるソースを選択するコマンドをさらに抽出し、前記制御部は、前記音声解析部が抽出したソースを選択するコマンドに基づいて、選択されたソースの音声の指向性パターンを設定し、前記放音部は、前記制御部が設定した指向性パターンに基づいて、異なるソースの音声を同時に複数の方向へ指向性を持たせて放音することを特徴とする。
この構成では、異なるソースの音声を複数の方向へ指向性を持たせて放音する。例えばスピーカアレイの各スピーカユニットに入力する音声信号を個別に遅延処理することで複数の方向に同時に指向性を持たせることが可能となる。更にこの構成では収音信号からソースを選択するコマンドを抽出する。例えば音声が2つのソース「ソースA」、「ソースB」からなる場合、音声認識により「ソースA」や「ソースB」という単語を抽出する。選択されたソースの音声の指向性パターンのみ設定する。これにより、例えば、「ソースA」という発言の後に「こちらへ」という単語を抽出した場合、その方向にソースAの音声のみビームを向ける。
また、この発明は、さらに、前記音声解析部は、収音信号に含まれるトリガとなるコマンドをさらに抽出し、前記制御部は、前記音声解析部がトリガとなるコマンドを抽出した場合のみ、前記指向性を指示するコマンドの内容に基づいてその後指向性パターンを設定することを特徴とする。
この構成では、収音信号からトリガとなるコマンドを抽出する。トリガとなるコマンドとしては、例えば「コマンド入力」という単語である。この単語を認識した場合のみ指向性パターンを設定する。例えば、「コマンド入力」という発言の後に「こちらへ」という単語を抽出した場合、その方向にソースAの音声のみビームを向ける。単に「こちらへ」という単語を抽出した場合はこれを無視する。無意識に発言された内容の音声を無視することで、ユーザの設定意志を反映する。
また、この発明は、さらに、前記音声解析部は、前記収音信号に含まれる特定のリズムパターンをコマンドとして抽出することを特徴とする。
この構成では、特定のリズムパターンをコマンドとして抽出する。例えば、所定レベル以上でかつ短い単発音(例えば手をたたく音声など)をカウントし、所定時間内(例えば3秒)の入力回数によってコマンドを抽出する。例えば、単発音1回で「音を大きく」と判断し、2回で「音を小さく」と判断する。
また、この発明は、さらに、前記制御部は、所定方向にのみ音量が低下するように指向性パターンを設定することを特徴とする。
この構成では、指向性パターンの態様として、所定方向にのみ音量が低下するようにする。スピーカアレイの場合、各スピーカユニットから放音された音声は、位相が異なる領域で弱められる。したがって、各スピーカユニットに入力する音声信号の遅延量をコントロールすることで、所定方向にのみ音量が低下するように指向性を設定することができる。この場合、指向性を指示するコマンドとして「ここだけミュート」等の単語を抽出すればよい。これにより、特定の音声を発言するだけで、静かにしたい特定の領域のみ音量を低下させることができる。
また、この発明は、さらに、前記収音信号のエコー成分を除去するエコーキャンセラをさらに備え、前記音声解析部は、前記エコーキャンセラがエコー成分を除去した収音信号に含まれるコマンドを抽出することを特徴とする。
この構成では、収音信号からエコー成分を除去する。エコー成分を除去した後の収音信号について音声認識等を行うため、コマンド抽出の精度が向上する。
この発明によれば、収音信号に含まれる指向性を指示するコマンドを抽出することにより、ユーザの発言で特定の方向に音声ビームを向けたり、特定の方向だけ音量を下げたりすることができる。
この実施形態の放収音装置は、マイクで収音した音声に基づいて放音指向性を制御する装置であり、他の装置から入力された音声を所定の方向に指向性を制御して放音する。この放収音装置は、テレビやオーディオ装置に接続することで種々のオーディオソースを放音するスピーカ装置として用いることが可能であり、他装置にマイクで収音した音声を出力することで音声会議装置として用いることも可能である。
以下、図面を参照してこの発明の実施形態である放収音装置について説明する。図1は放収音装置の構成を示すブロック図である。
この放収音装置1は、マイクアレイ2、入出力インタフェース(I/F)3、制御部4、スピーカアレイ5、エコーキャンセラ6、ビーム制御部7A、ビーム制御部7B、ミキサ8、D/Aコンバータ11〜18、アンプ(AMP)31〜38、アンプ(AMP)41〜48、A/Dコンバータ51〜58、収音ビーム生成部61、および収音ビーム選択部71を備えている。
マイクアレイ2は、複数の(同図の例では8つの)マイクユニット21〜28を直線状に配列してなり、マイクユニット21〜28が収音した音声(収音信号)をそれぞれ出力する。スピーカアレイ5は、複数の(同図の例では8つの)スピーカユニット51〜58を直線状に配列してなり、それぞれ入力された音声信号を放音する。
マイクユニット21〜28が収音した収音信号はフロントエンドのアンプ41〜48で増幅され、A/Dコンバータ51〜58でデジタル変換される。A/Dコンバータ51〜58でデジタル化された収音信号はエコーキャンセラ6に入力される。
エコーキャンセラ6は、フィルタ処理部60を含み、ミキサ8から入力されるスピーカユニット51〜58に対応する音声信号をフィルタ処理部60に入力する。フィルタ処理部60は、スピーカユニット51〜58に対応する音声信号をそれぞれフィルタ処理して、スピーカアレイ5からマイクアレイ2に回り込む回帰音声信号を擬似した擬似回帰音信号を生成する。フィルタ処理部60は、この擬似回帰音信号を各収音信号から減算することでエコー成分を消去し、収音ビーム生成部61に出力する。エコーキャンセラ6によりエコー成分を消去することで、後述の音源位置検出処理、コマンド解析処理の精度が向上する。
収音ビーム生成部61は、エコーキャンセラ6でエコー成分が除去された収音信号をそれぞれ遅延して合成することによりマイクアレイ2全体としての収音指向性をビーム化する。このビーム化された収音指向性により、特定の領域で発生した音声を高いゲインで収音する。なお、ビーム化された収音指向性を収音ビームと呼ぶ。本実施形態では、マイクアレイ2の周囲4つの領域に対応する収音ビームMB11〜MB14を生成する。
図2は、収音ビームの一例を示す図である。同図において、収音ビーム生成部61は、収音したい位置に焦点を結ぶような収音ビームを形成し、狭い範囲の音声を高ゲインで収音する。ここで、収音領域P1〜P4は、例えばマイクアレイの正面に設定される。収音ビーム生成部61は、各マイクユニット21〜28が収音した音声信号を、焦点(同図においてはF3)から等距離になるように遅延したのち合成することにより、焦点周辺(収音領域P3)で発生した音声を高ゲインで取り出すことができる。
図1において、収音ビーム生成部61が生成した4つの収音ビームMB11〜MB14は、収音ビーム選択部71に入力される。収音ビーム選択部71は、4つの収音ビームMB11〜MB14のうち最もレベルの高い信号を選択し、その収音ビームをメイン収音ビームとして入出力I/F3に出力する。
図3は、収音ビーム選択部71の主要構成を示すブロック図である。
収音ビーム選択部71は、BPF(バンドパスフィルタ)171、全波整流回路172、ピーク検出回路173、レベル比較器174、および信号選択回路175を備えている。
BPF171は、人の音声の主成分帯域を通過帯域とするバンドパスフィルタであり、収音ビームMB11〜MB14を帯域通過フィルタ処理して、全波整流回路172に出力する。全波整流回路172は、収音ビームMB11〜MB14を全波整流(絶対値化)する。ピーク検出回路173は、全波整流された収音ビームMB11〜MB14のピーク検出を行い、ピーク値データPs11〜Ps14を出力する。レベル比較器174は、ピーク値データPs11〜Ps14を比較して、最も高いレベルのピーク値データに対応する収音ビームを選択する選択指示データを信号選択回路175に与える。また、レベル比較器174は、選択指示データを制御部4にも与える。制御部4は、選択指示データを後述の音源位置検出処理に用いる。信号選択回路175は、選択指示データが示す収音ビームを選択し、メイン収音ビームとして入出力I/F3に出力する。また、信号選択回路175は、選択指示データが示す収音ビームを選択し、メイン収音ビームとして制御部4にも出力する。制御部4は、メイン収音ビームを後述のコマンド解析処理に用いる。
これは、音源が存在する収音領域に対応する収音ビームの信号レベルが他の領域に対応する収音ビームの信号レベルよりも高いことを利用している。
入出力I/F3(出力I/F30C)に入力されたメイン収音ビームは、この放収音装置1を音声会議装置として用いる場合、他の装置に出力される。ネットワークを経由して出力される場合は、所定のプロトコルの音声情報として出力される。
入出力I/F3は、機能的に入力I/F30A,入力I/F30B,および出力I/F30Cからなり、他の装置と音声信号(または音声情報)を入出力する。入力I/F30Aに入力された音声信号はビーム制御部7Aに出力され、入力I/F30Bに入力された音声信号はビーム制御部7Bに出力される。なお、音声情報が入力された場合、音声信号に変換されて出力される。
ビーム制御部7A、7Bは、スピーカアレイ5のスピーカユニット51〜58に入力する音声信号に遅延処理、ゲインコントロールを行うことで、所定方向に強い指向性を有する音声ビームを形成することができる。また、逆に所定方向にのみ音量が低下するような音声ビーム(以下、音声ディップと言う。)を形成することもできる。各スピーカユニット51〜58に対応する音声信号の遅延量、ゲインは制御部4により設定される。各スピーカユニット51〜58で放音された音声は、位相が共通する領域で強められ、逆に位相が異なる領域では弱められる。したがって、各スピーカユニットに入力する音声信号の遅延量をコントロールすることで特定の方向に音声ビームを向けたり、音声ディップを向けたりすることができる。
ビーム制御部7A、7Bが出力した音声信号はミキサ8に入力される。ミキサ8は、ビーム制御部7A、7Bがそれぞれ出力したスピーカユニット51〜58に対応する音声信号をミキシングし、エコーキャンセラ6に出力する。エコーキャンセラ6は、上記のように、スピーカユニット51〜58に対応する音声信号から擬似回帰音信号を生成する。また、エコーキャンセラ6は、スピーカユニット51〜58に対応する音声信号をD/Aコンバータ11〜18に出力する。スピーカユニット51〜58に対応する音声信号は、それぞれD/Aコンバータ11〜18でアナログ音声信号に変換され、アンプ31〜38で増幅された後スピーカユニット51〜58で放音される。
ここで、ビーム制御部7A、7Bがそれぞれ違う領域に音声ビームを出力するように遅延処理を行うことで、ユーザは、各場所で異なるソースの音声を聴くことができる。例えば図4に示すように、リビングのソファーの位置に居るユーザh1は、映画音声(ソースA)を聴き、ダイニングテーブルの位置に居るユーザh2は音楽(ソースB)を聴くことができる。また、同じ映画音声であっても、ユーザh1は日本語の音声を聴き、ユーザh2は英語の音声を聴く、といったこともできる。各音声ビーム(音声ディップ)のソース、方向は制御部4により設定される。
制御部4は、CPUを含み、レベル比較器174から入力した選択指示データに基づいて、音源の位置を検出する音源位置検出処理を行う。最も単純には、選択指示データが示す音声ビームの収音領域に音源が存在すると判断し、この収音領域を音源位置とする。なお、図示はしないが、マイクユニット21〜28が収音した収音信号(エコーキャンセラ6の出力した収音信号)をそれぞれ入力し、線形予測法や最小分散法等、その他一般的な手法を用いて音源位置を検出してもよい。
また、制御部4は、信号選択回路175から入力したメイン収音ビームを解析するコマンド解析処理を行う。コマンド解析処理は、音声認識を行い、メイン収音ビームの音声内容からコマンドを抽出する処理である。具体的には、制御部4は、入力した音声信号と予めメモリ(図示せず)等に記憶してある音声信号のパターンとを比較する。比較方法は、例えば隠れマルコフモデル等の確率モデルを利用する。制御部4は、入力した音声信号の内容から特定の音声内容を認識した場合、これをコマンドとして抽出する。コマンドの内容は、トリガ、ソースの選択、およびビームの設定に分類される。
制御部4は、トリガのコマンドとして抽出される音声(例えば「コマンド入力」という音声)を予め定めておき、このトリガ音声を認識した後に入力される音声信号をソースの選択、およびビームの設定のコマンドとして抽出するコマンド抽出処理を行い、トリガ音声が認識されていなければコマンド抽出処理を実行しない。
同様に、制御部4は、ソースの選択のコマンドとして抽出される音声内容を予め定めておく。ソースの選択のコマンドとして抽出される音声内容は、例えば「ソースA」、「ソースB」等である。
また、制御部4は、ビームの設定のコマンドとして抽出される音声内容も予め定めておく。ビームの設定のコマンドとして抽出される音声内容は、例えば「音を大きく」、「音を小さく」等である。
なお、ソースの選択、およびビームの設定のコマンドの抽出は、本発明において必須ではない。
また、音声認識に限らず、例えば特定のリズムパターンをコマンドとして抽出することもできる。制御部4は、所定レベル以上の音声でかつ所定レベル以上の時間が短い単発音(例えば手をたたく音声など)をカウントし、所定時間内(例えば3秒)の入力回数によってコマンドを抽出する。例えば、単発音1回で「音を大きく」と判断し、2回で「音を小さく」と判断する。
制御部4は、音源位置検出処理で検出した音源位置、およびコマンド解析処理で解析したコマンド内容に基づいて、ビーム制御部7A、7Bの遅延量やゲインを設定する指向性設定処理を行う。以下、図面を参照して指向性設定処理の具体的な例について説明する。なお、いずれの例においても、ユーザは最初に「コマンド入力」等のトリガ音声を発しているものとする。
図5は、指向性設定処理の例として、音声ビームをコントロールする例を示す図である。同図(A)は、ユーザの方向に音声ビームを向ける場合の例を示した図である。同図において、ユーザh1が「ソースAこちらへ」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「こちらへ」を抽出する。また、制御部4は、ユーザh1の位置を検出する。そして、制御部4は、ソースAの音声(同図の例では映画音声)がユーザh1の位置に向けられるように、ビーム制御部7Aの遅延量を設定する。これにより、ユーザh1は、各場所で「ソースAこちらへ」と発言するだけで、音声ビームを自身の方向に向けることができる。
次に、同図(B)は、ユーザの方向に向けられている音声ビームの音量を変更する場合の例を示した図である。同図において、ユーザh1が「ソースA音を大きく」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「音を大きく」を抽出する。また、制御部4は、ユーザh1の位置を検出する。そして、制御部4は、ソースAの音声ビームの音量が大きくなるように、ビーム制御部7Aのゲインを設定する。なお、このときに検出したユーザh1の位置が音声ビームの方向からずれていれば、ユーザh1の位置に音声ビームを向けるようにビーム制御部7Aの遅延量を設定してもよい。これにより、ユーザh1は、各場所で「ソースA音を大きく」と発言するだけで、自身の位置だけソースAの音量を大きくすることができる。
図5(A)、および図5(B)に示した指向性設定の例は、夜間にテレビや音楽を楽しんでいる場合、家庭内の他の音が大きく、映画の音声を聞き取り難い場合、等に好適である。
次に、図6は、ユーザの方向に音声ディップを向ける場合の例を示した図である。同図において、ユーザh1が「ソースAここだけミュート」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「ここだけミュート」を抽出する。また、制御部4は、ユーザh1の位置を検出する。そして、制御部4は、ソースAの音声がユーザh1の位置だけ音量が低下するように(図中2点破線で示す音声ディップが向けられるように)、ビーム制御部7Aの遅延量を設定する。これにより、ユーザh1は、各場所で「ソースAここだけミュート」と発言するだけで、音声ディップを自身の方向に向けることができる。
同図の例は、ユーザがテレビや音楽を楽しんでいるとき、電話がかかってきて一時的に音量を下げたい場合等に好適である。
次に、図7は、ユーザ以外の方向(特定の方向)に音声ビームを向ける場合の例を示した図である。同図(A)において、ユーザh1が「ソースA反対方向」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「反対方向」を抽出する。また、制御部4は、ユーザh1の位置を検出する。そして、制御部4は、ソースAの音声ビームがユーザと反対の方向に向けられるように、ビーム制御部7Aの遅延量を設定する。なお、反対の方向とは、スピーカアレイ5の中心位置Oからアレイ長軸方向に直交する方向軸Yを挟んで対称となる位置を言う。同図の例では、ユーザh1の位置の反対の方向にユーザh2が存在する。したがって、ソースAの音声ビームがユーザh2に向けられることとなる。
以上のように、ユーザh1は、各場所で「ソースA反対方向」と発言するだけで、音声ビームを自身と異なる方向に向けることができる。なお、予め音声ビームを向ける方向を複数設定しておき、その方向に音声ビームを向けることもできる。
同図(B)において、制御部4は、音声ビームを向ける方向として方向1〜3までの複数の方向を予め設定している。なお、設定する方向の数はこの例に限らない。ここで、ユーザh1が「ソースA方向1」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「方向1」を抽出する。そして、制御部4は、ソースAの音声ビームが予め設定した方向1に向けられるように、ビーム制御部7Aの遅延量を設定する。
図7の例は、ユーザが音楽を楽しんでいるとき、これを他の人に聴かせたい場合等に好適である。また、上記のようにユーザがテレビや音楽を楽しんでいるとき、電話がかかってきて一時的に他の方向に音声ビームを向けたい場合等にも好適である。
次に、図8は、ユーザ以外の方向(特定の方向)に音声ディップを向ける場合の例を示した図である。同図(A)において、ユーザh1が「ソースA反対方向だけミュート」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「反対方向だけミュート」を抽出する。また、制御部4は、ユーザh1の位置を検出する。そして、制御部4は、ソースAの音声がユーザと反対の方向だけ音量が低下するように(図中2点破線で示す音声ディップが向けられるように)、ビーム制御部7Aの遅延量を設定する。同図の例では、ユーザh1の位置の反対の方向にユーザh2が存在する。したがって、ソースAの音声について、ユーザh2の位置だけ音量が低下する。
以上のように、ユーザh1は、各場所で「ソースA反対方向だけミュート」と発言するだけで、音声ディップを自身と異なる方向に向けることができる。なお、予め音声ディップを向ける方向を複数設定しておき、その方向に音声ディップを向けることもできる。
同図(B)において、制御部4は、音声ディップを向ける方向として方向1〜3までの複数の方向を設定している。なお、この例においても、設定する方向の数はこの例に限らない。ここで、ユーザh1が「ソースA方向1だけミュート」と発言すると、制御部4は、ソースの選択のコマンドとして「ソースA」を抽出し、ビームの設定のコマンドとして「方向1だけミュート」を抽出する。そして、制御部4は、ソースAの音声ディップが予め設定した方向1に向けられるように、ビーム制御部7Aの遅延量を設定する。
図8の例は、赤ちゃんが寝ている方向だけ音量を下げたい場合等に好適である。また、家庭内の電話機の方向を予め設定しておけば、電話がかかってきた場合に、電話機の方向だけ音量を下げることも可能である。
以上のように、本発明の放収音装置によれば、ユーザが本体やリモコンを操作して複雑な設定を行う必要なく、音声を発するだけで、音声ビーム、音声ディップを容易にコントロールすることができる。
放収音装置の構成を示すブロック図である。 収音ビームの形成概念を示す図である。 収音ビーム選択部71の主要構成を示すブロック図である。 各場所で異なるソースの音声を聴く場合の一例を示した図である。 指向性設定処理の例として、音声ビームをコントロールする例を示す図である。 ユーザの方向に音声ディップを向ける場合の例を示した図である。 ユーザ以外の方向(特定の方向)に音声ビームを向ける場合の例を示した図である。 ユーザ以外の方向(特定の方向)に音声ディップを向ける場合の例を示した図である。
符号の説明
1−放収音装置
2−マイクアレイ
3−入出力インタフェース
4−制御部
5−スピーカアレイ
6−エコーキャンセラ
7A,7B−ビーム制御部
8−ミキサ

Claims (5)

  1. 音声を収音し、収音信号を出力する収音部と、
    音源位置を検出する音源位置検出部と、
    音声に特定の方向へ指向性を持たせて放音する放音部と、
    前記収音信号を入力し、収音信号に含まれる指向性を指示するコマンドを抽出する音声解析部と、
    前記音源位置検出部が検出した音源位置、および前記音声解析部の抽出した指向性を指示するコマンドの内容に基づいて、前記放音部の指向性パターンを設定する制御部と、
    を備え、
    前記制御部は、前記音声解析部が話者自身の方向を指し示す言語を抽出した場合、前記音源位置の方向へ前記放音部の指向性を向け、
    前記音声解析部が話者以外の方向を指し示す言語を抽出した場合、前記音源位置以外の方向へ前記放音部の指向性を向け、
    所定方向にのみ音量が低下するように指向性パターンを設定する、
    収音した音声を他装置に出力する音声会議装置
  2. 前記音声解析部は、収音信号に含まれるソースを選択するコマンドをさらに抽出し、
    前記制御部は、前記音声解析部が抽出したソースを選択するコマンドに基づいて、選択されたソースの音声の指向性パターンを設定し、
    前記放音部は、前記制御部が設定した指向性パターンに基づいて、異なるソースの音声を同時に複数の方向へ指向性を持たせて放音する請求項1に記載の音声会議装置
  3. 前記音声解析部は、収音信号に含まれるトリガとなるコマンドをさらに抽出し、
    前記制御部は、前記音声解析部がトリガとなるコマンドを抽出した場合のみ、前記指向性を指示するコマンドの内容に基づいてその後指向性パターンを設定する請求項1、または請求項2に記載の音声会議装置
  4. 前記音声解析部は、前記収音信号に含まれる特定のリズムパターンをコマンドとして抽出する請求項1、請求項2、または請求項3に記載の音声会議装置
  5. 前記収音信号のエコー成分を除去するエコーキャンセラをさらに備え、
    前記音声解析部は、前記エコーキャンセラがエコー成分を除去した収音信号に含まれるコマンドを抽出する請求項1乃至請求項のいずれかに記載の音声会議装置
JP2007040507A 2007-02-21 2007-02-21 音声会議装置 Expired - Fee Related JP5380777B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007040507A JP5380777B2 (ja) 2007-02-21 2007-02-21 音声会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007040507A JP5380777B2 (ja) 2007-02-21 2007-02-21 音声会議装置

Publications (2)

Publication Number Publication Date
JP2008205896A JP2008205896A (ja) 2008-09-04
JP5380777B2 true JP5380777B2 (ja) 2014-01-08

Family

ID=39782887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007040507A Expired - Fee Related JP5380777B2 (ja) 2007-02-21 2007-02-21 音声会議装置

Country Status (1)

Country Link
JP (1) JP5380777B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4725643B2 (ja) * 2008-12-22 2011-07-13 ソニー株式会社 音波出力装置、通話装置、音波出力方法、及びプログラム
US9973848B2 (en) 2011-06-21 2018-05-15 Amazon Technologies, Inc. Signal-enhancing beamforming in an augmented reality environment
JP5725088B2 (ja) * 2013-06-10 2015-05-27 ヤマハ株式会社 収音装置及び放収音システム
JP6087762B2 (ja) * 2013-08-13 2017-03-01 日本電信電話株式会社 残響抑圧装置とその方法と、プログラムとその記録媒体
CN105793923A (zh) * 2013-09-20 2016-07-20 亚马逊技术股份有限公司 本地和远程语音处理
JP6430506B2 (ja) * 2013-11-22 2018-11-28 アップル インコーポレイテッドApple Inc. ハンズフリー・ビームパターン構成
JP6642424B2 (ja) * 2014-06-03 2020-02-05 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US10318016B2 (en) 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
JP6653687B2 (ja) * 2017-07-31 2020-02-26 日本電信電話株式会社 音響信号処理装置、方法及びプログラム
US10515637B1 (en) 2017-09-19 2019-12-24 Amazon Technologies, Inc. Dynamic speech processing

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816184A (ja) * 1994-06-28 1996-01-19 Matsushita Electric Works Ltd 音声認識型制御装置
JP3370194B2 (ja) * 1994-11-22 2003-01-27 沖電気工業株式会社 音声入力リモートコントロール装置
JP3270403B2 (ja) * 1998-09-08 2002-04-02 エヌイーシーモバイリング株式会社 装置角度制御方式
JP2001078276A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 遠隔制御装置
DE19943872A1 (de) * 1999-09-14 2001-03-15 Thomson Brandt Gmbh Vorrichtung zur Anpassung der Richtcharakteristik von Mikrofonen für die Sprachsteuerung
DE10058786A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
JP2003131695A (ja) * 2001-10-25 2003-05-09 Hitachi Ltd 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法
JP2004120459A (ja) * 2002-09-27 2004-04-15 Mitsubishi Electric Corp 音声出力装置
JP2005197896A (ja) * 2004-01-05 2005-07-21 Yamaha Corp スピーカアレイ用のオーディオ信号供給装置
JP4872241B2 (ja) * 2005-05-31 2012-02-08 船井電機株式会社 テレビ受像機

Also Published As

Publication number Publication date
JP2008205896A (ja) 2008-09-04

Similar Documents

Publication Publication Date Title
JP5380777B2 (ja) 音声会議装置
US10079017B1 (en) Speech-responsive portable speaker
EP3474557B1 (en) Image processing device, operation method of image processing device, and computer-readable recording medium
US11624800B1 (en) Beam rejection in multi-beam microphone systems
JP4837917B2 (ja) 音声に基づく装置制御
US10149049B2 (en) Processing speech from distributed microphones
CN107454508B (zh) 麦克风阵列的电视机及电视系统
US9293134B1 (en) Source-specific speech interactions
US9392353B2 (en) Headset interview mode
US9792901B1 (en) Multiple-source speech dialog input
JP2009021764A (ja) 音声通信装置及び音声通信方法並びにプログラム
US11301208B2 (en) Control method, control device, and control system
US10325591B1 (en) Identifying and suppressing interfering audio content
US10510361B2 (en) Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user
CN107452398B (zh) 回声获取方法、电子设备及计算机可读存储介质
WO2003107327A1 (en) Controlling an apparatus based on speech
JP5130298B2 (ja) 補聴器の動作方法、および補聴器
JP2011066668A (ja) エコー除去装置、エコー除去方法、およびエコー除去装置のプログラム
JP6678315B2 (ja) 音声再生方法、音声対話装置及び音声対話プログラム
CN112130801A (zh) 音响装置及音响处理方法
JP2007329753A (ja) 音声通信装置および音声通信システム
JP2007298876A (ja) 音声データ記録再生装置
JP2008249893A (ja) 音声応答装置及びその方法
JP2007086592A (ja) 音声出力装置および音声出力方法
JP2005229422A (ja) 音声処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120123

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130916

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees