JP2009302804A - 音声処理装置および音声処理方法 - Google Patents
音声処理装置および音声処理方法 Download PDFInfo
- Publication number
- JP2009302804A JP2009302804A JP2008153759A JP2008153759A JP2009302804A JP 2009302804 A JP2009302804 A JP 2009302804A JP 2008153759 A JP2008153759 A JP 2008153759A JP 2008153759 A JP2008153759 A JP 2008153759A JP 2009302804 A JP2009302804 A JP 2009302804A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- waveform
- microphone
- input unit
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】テレビ会議システム等における音響系の接続状態を自動で検出して、誤接続を的確に知らせることができる技術を提供すること。
【解決手段】本発明は、音声を取り込むマイク入力端子T1と、相手方から送られてきた音声を出力するスピーカ出力端子T2と、マイク入力端子T1で取り込んだ音声および相手方から送られてきた音声の合成を出力する録音用出力端子T3と、スピーカ出力端子T2に第1の波形から成る音声を送り、録音用出力端子T3に第1の波形とは異なる第2の波形から成る音声を送り、マイク入力端子T1で取り込んだ音声の波形から、マイク入力端子T1およびスピーカ出力端子T2ならびに録音用出力端子T3に対する機器の接続状態を判断する信号処理部10とを有する音声処理装置である。
【選択図】図1
【解決手段】本発明は、音声を取り込むマイク入力端子T1と、相手方から送られてきた音声を出力するスピーカ出力端子T2と、マイク入力端子T1で取り込んだ音声および相手方から送られてきた音声の合成を出力する録音用出力端子T3と、スピーカ出力端子T2に第1の波形から成る音声を送り、録音用出力端子T3に第1の波形とは異なる第2の波形から成る音声を送り、マイク入力端子T1で取り込んだ音声の波形から、マイク入力端子T1およびスピーカ出力端子T2ならびに録音用出力端子T3に対する機器の接続状態を判断する信号処理部10とを有する音声処理装置である。
【選択図】図1
Description
本発明は、テレビ会議やハンズフリー電話などの拡声通話系で、音声関係の機器の接続状態を自動で検出する音声処理装置および音声処理方法に関する。
テレビ会議システムなどの拡声通話系では、遠端装置のマイクで収音された音声が、近端装置に送られ、近端装置のスピーカから放音される。近端装置にもマイクが装備されており、近端話者の音声を遠端装置へ送るように構成されている。テレビ会議システムには、複数のマイク入力端子や音声出力端子がある(例えば、特許文献1参照。)。
ここで、音声出力端子には、遠端装置のマイクで収音された音声を出力するためのスピーカを接続する出力端子や、遠端装置のマイクで収音された音声と遠端装置へ送る音声(近端話者の音声)とをミックスして録音(録画)するための録音用の出力端子とがある。
また、テレビ会議システムでは、GUI(Graphical User Interface)によって利用する入力を選択できるものが多い。利用者は、GUIによってマイクが挿されている端子を選択するといった設定が必要となっている。
しかしながら、従来の機器では、音声入力端子や音声出力端子に正確に対応する機器が接続されているか否かを容易に判断することができず、誤接続を的確に知らせることができないという問題が生じている。
本発明は、テレビ会議システム等における音響系の接続状態を自動で検出して、誤接続を的確に知らせることができる技術を提供することを目的とする。
本発明は、音声を取り込む音声入力部と、相手方から送られてきた音声を出力する第1音声出力部と、音声入力部で取り込んだ音声および前記相手方から送られてきた音声の合成を出力する第2音声出力部と、第1音声出力部に第1の波形から成る音声を送り、第2音声出力部に第1の波形とは異なる第2の波形から成る音声を送り、音声入力部で取り込んだ音声の波形から音声入力部および第1音声出力部ならびに第2音声出力部に対する機器の接続状態を判断する信号処理部とを有する音声処理装置である。
ここで、信号処理部は、音声入力部で取り込んだ音声から第1の波形から成る音声を認識し、第2の波形から音声を認識しなかった場合、音声入力部および第1音声出力部ならびに第2音声出力部に対する機器の接続状態が全て正常であると判断する。また、信号処理部は、音声入力部で取り込んだ音声が無信号であった場合、音声入力部に対する機器の接続状態が不良であると判断する。また、信号処理部は、音声入力部で取り込んだ音声が雑音のみであった場合、音声入力部に対する機器の接続状態は正常であるが、第1音声出力部に対する機器の接続が不良であると判断する。また、信号処理部は、音声入力部で取り込んだ音声から第2の波形から成る音声を認識した場合、音声入力部に対する機器の接続状態は正常であるが、第2音声出力部に対する機器の接続状態が不良であると判断する。
このような本発明では、第1音声出力部に送った第1の波形から成る音声と、第2音声出力部に送った第1の波形とは異なる第2の波形から成る音声との戻り、すなわち、これらの音声の音声入力部での取り込み状態によって機器の接続状態を自動判別できるようになる。
また、本発明は、相手方から送られてきた音声を出力する第1音声出力部に第1の波形から成る音声を送り、音声入力部で取り込んだ音声および前記相手方から送られてきた音声の合成を出力する第2音声出力部に第1の波形とは異なる第2の波形から成る音声を送る工程と、音声入力部で取り込んだ音声の波形から音声入力部および第1音声出力部ならびに第2音声出力部に対する機器の接続状態を判断する工程とを有する音声処理方法である。
ここで、機器の接続状態の判断としては、音声入力部で取り込んだ音声から第1の波形から成る音声を認識し、第2の波形から音声を認識しなかった場合、音声入力部および第1音声出力部ならびに第2音声出力部に対する機器の接続状態が全て正常であると判断する。また、音声入力部で取り込んだ音声が無信号であった場合、音声入力部に対する機器の接続状態が不良であると判断する。また、音声入力部で取り込んだ音声が雑音のみであった場合、音声入力部に対する機器の接続状態は正常であるが、第1音声出力部に対する機器の接続が不良であると判断する。また、音声入力部で取り込んだ音声から第2の波形から成る音声を認識した場合、音声入力部に対する機器の接続状態は正常であるが、第2音声出力部に対する機器の接続状態が不良であると判断する。
このような本発明では、第1音声出力部に送った第1の波形から成る音声と、第2音声出力部に送った第1の波形とは異なる第2の波形から成る音声との戻り、すなわち、これらの音声の音声入力部での取り込み状態によって機器の接続状態を自動判別できるようになる。
本発明によれば、音声入力部や音声出力部に対して接続する機器の接続状態を自動的に検出でき、誤接続があった場合には利用者に的確に通知することが可能となる。
以下、本発明の実施の形態を図に基づき説明する。
<音声処理装置の構成>
図1は、本実施形態に係る音声処理装置の構成を説明するブロック図である。なお、図1に示す音声処理装置は、テレビ会議システムで適用される近端装置や遠端装置に用いられている。
図1は、本実施形態に係る音声処理装置の構成を説明するブロック図である。なお、図1に示す音声処理装置は、テレビ会議システムで適用される近端装置や遠端装置に用いられている。
本実施形態に係る音声処理装置は、音声を取り込むマイクMを接続するマイク入力端子(音声入力部)T1と、相手方(遠端装置)から送られてきた音声を出力するスピーカSPを接続するスピーカ出力端子(第1音声出力部)T2と、録音(録画)機器Rを接続するための録音用出力端子T3と、音声信号に対する各種処理を行う信号処理部10とを備えている。
また、近端装置は、上記構成のほか、相手方に送る音声を符号化する処理および相手方から送られてきた音声を復号化する処理を行う音声コーデック部11と、通信回線Nを介して遠端装置と信号の入出力を行う通信部12とを備えている。
本実施形態では、マイク入力端子T1が複数設けられている。図1に示す例では2つのマイク入力端子T1が設けられているが、1つのマイク入力端子T1だけでも、また、さらに多くのマイク入力端子T1を備えていてもよい。
マイク入力端子T1にマイクMを接続した場合、利用者はどのマイク入力端子T1にマイクMを接続したかをGUI(Graphical User Interface)によって設定する。どのマイク入力端子T1が有効になっているかを信号処理部10に伝えるためである。
マイク入力端子T1の後段には、A/D変換器21が設けられている。A/D変換器21は、マイクMで取り込み、アンプ(図示せず)で増幅された音声のアナログ信号を所定のサンプリングレートによってデジタル信号に変換する処理を行う。A/D変換器21で変換された音声のデジタル信号は信号処理部10に送られる。
スピーカ出力端子T2は、相手方(遠端装置)から通信回線Nを介して送られてきた音声をスピーカSPに出力する部分である。スピーカ端子T2としてはモノラル、ステレオいずれであってもよい。
スピーカ出力端子T2の前段には、D/A変換器22が設けられている。D/A変換器22は、信号処理部10から出力された相手方からの音声のデジタル信号をアナログ信号に変換する処理を行う。D/A変換器22で変換された音声のアナログ信号はスピーカ出力端子T2へ送られ、ここに接続されるスピーカSPから音声として出力されることになる。
録音用出力端子T3は、近端装置および遠端装置での会話の音声を録音するための音声を出力する部分である。すなわち、録音用出力端子T3は、近端装置側のマイクMで取り込んだ音声と、遠端装置から送られてきた相手方の音声(スピーカSPから出力する音声)との合成を出力する。
録音用出力端子T3に接続された録音(録画)機器RDは、録音用出力端子T3から出力される音声を所定の記録媒体に記録する。これにより、マイクMで取り込んだ近端装置側の音声と、送られてきた相手方の音声とを録音でき、会話(会議)の内容を記録することができる。
録音用出力端子T3の前段には、D/A変換器23が設けられている。D/A変換器23は、信号処理部10から出力された音声(マイクで取り込んだ音声と、相手方から送られてきた音声との合成音声)のデジタル信号をアナログ信号に変換する処理を行う。D/A変換器23で変換された音声のアナログ信号は録音用出力端子T3へ送られ、ここに接続される録音(録画)機器RDで記録されることになる。
音声コーデック部11は、相手方に送る音声のデジタル信号を符号化する処理および相手方から送られてきた音声のデジタル信号を復号化する処理を行う。
通信部12は、インターネットやLAN(Local Area Network)等の通信回線Nを介して遠端装置との間で信号入出力を行う部分であり、符号化された音声のデジタル信号の送受信を行う。
信号処理部10は、デジタルシグナルプロセッサ(DSP)で構成され、入力および出力の音声データを所望のデータへ変換する処理を行う。
特に、本実施形態における信号処理部10は、スピーカ出力端子T2に第1の波形から成る音声を送り、録音用出力端子RDに第1の波形とは異なる第2の波形から成る音声を送り、マイク入力端子T1を介して取り込んだ音声の波形から、マイク入力端子T1およびスピーカ出力端子T2ならびに録音用出力端子T3に対する各機器の接続状態を判断する処理を行う。
ここで、第1の波形と第2の波形とは、マイク入力端子T1を介して取り込んだ音声の両波形を信号処理部10で分離して処理できる相違となっている。具体的には、第1の波形と第2の波形とで各々周波数の異なる正弦波となっている。例えば、数倍から数百倍(好ましくは数10倍)の周波数差となる正弦波を用いる。本実施形態では、第1の波形として100Hzの正弦波、第2の波形として1000Hz(1kHz)の正弦波を用いることとする。
信号処理部10は、第1の波形として100Hzの正弦波をスピーカ出力端子T2に送り、スピーカSPから100Hzの正弦波による音を出力させる。また、信号処理部10は、第2の波形として1kHzの正弦波を録音用出力端子T3に送る。
信号処理部10は、上記のように第1の波形の音声および第2の波形の音声の信号を出力した状態で、マイクMからマイク入力端子T1を介して取り込んだ音声の波形から第1の波形と第2の波形との認識を行う。そして、この認識結果に基づいてスピーカ出力端子T2にスピーカSPが正しく接続されているか、録音用出力端子T3に誤ってスピーカSPが接続されていないか、マイク入力端子T1にマイクMが正しく接続されているかを判断する。
ここで、判断の基準について説明する。先ず、マイク入力端子T1にマイクMが正確に接続され、スピーカ出力端子T2にスピーカSPが正確に接続され、録音用出力端子T3に録音(録画)機器RDが正確に接続されている場合、判断は次のようになる。
この場合には、スピーカSPから100Hzの正弦波による音声が出力され、これがマイクMを介して取り込まれて信号処理部10に送られる。録音用出力端子T3に送った1kHzの正弦波による音声は録音(録画)機器RDに入力されることから、外部に音声として放出されない。したがって、1kHzの正弦波による音声がマイクMから取り込まれることはない。このことから、信号処理部10では、マイクMで取り込んだ音声の信号成分から100Hzの正弦波を抽出し、1kHzの正弦波を抽出しなかった場合、全ての機器が正常に接続されていると判断する。
次に、マイク入力端子T1にマイクMが接続されていない場合、または接続不良の場合、または接続されているがGUIによる設定がされていない場合、判断は次のようになる。
この場合には、マイク入力端子T1から信号処理部10に送られる信号が無い状態(無信号)となる。したがって、信号処理部10では、マイク入力端子T1から送られる信号が無信号であると認識した場合、マイク入力端子T1にマイクが接続されていないか、接続不良であるか、設定不良であると判断する。
次に、マイク入力端子T1にマイクMが正確に接続されており、スピーカ出力端子T2にスピーカSPが接続されていないか、接続不良であるか、設定不良である場合、判断は次のようになる。
この場合には、スピーカ出力端子T2に100Hzの正弦波による音声信号が送られているものの、スピーカSPから出力されないため、マイクMによって取り込む音声信号は雑音のみとなる。したがって、信号処理部10では、マイク入力端子T1から送られる信号が雑音のみであると認識した場合、マイク入力端子T1にマイクMは正確に接続されているものの、スピーカ出力端子T2にスピーカSPが接続されていないか、接続不良であるか、設定不良であると判断する。
次に、マイク入力端子T1にマイクMが正確に接続されており、スピーカ出力端子T2にスピーカSPが接続されていないか、接続不良であるか、設定不良であり、録音用出力端子T3にスピーカSPが誤って接続されている場合、判断は次のようになる。
この場合には、スピーカ出力端子T2に送った100Hzの正弦波から成る音声はスピーカSPから出力されず、録音用出力端子T3に送った1kHzの正弦波から成る音声が誤接続されたスピーカSPから出力される。このため、マイクMは、誤接続されたスピーカSPから出力される1kHzの正弦波から成る音声を取り込むことになる。信号処理部10では、マイクMで取り込んだ音声の信号成分から1kHzの正弦波を抽出し、100Hzの正弦波を抽出しなかった場合、マイク入力端子T1にマイクMは正確に接続されていると判断する。さらに、信号処理部10は、スピーカ出力端子T2にスピーカSPが接続されていないか、接続不良であるか、設定不良であるとともに、録音用出力端子T3にスピーカSPが誤接続されていると判断する。
次に、マイク入力端子T1にマイクMが正確に接続され、スピーカ出力端子T2にスピーカSPが正確に接続されており、録音用出力端子T2にスピーカSPが誤って接続されている場合、判断は次のようになる。
この場合、スピーカ出力端子T2に送った100Hzの正弦波から成る音声がスピーカSPから出力され、録音用出力端子T3に送った1kHzの正弦波から成る音声も誤接続されたスピーカSPから出力される。このため、マイクMは、スピーカSPから出力される100Hzの正弦波から成る音声と、誤接続されたスピーカSPから出力される1kHzの正弦波から成る音声との両方を取り込むことになる。信号処理部10では、マイクMで取り込んだ音声の信号成分から100Hzの正弦波と1kHzの正弦波との両方を抽出した場合、マイク入力端子T1にマイクMは正確に接続され、スピーカ出力端子T2にスピーカSPが正確に接続されていると判断する。さらに、信号処理部10は、録音用出力端子T3にスピーカSPが誤接続されていると判断する。
なお、上記の判断において、複数のマイクMが各マイク入力端子T1に接続されている場合には、マイク1つに対して上記の判断を行い、これを複数のマイクMについて繰り返し行うようにする。これにより、複数のマイクMについてどのマイクMが正常に接続されているか、接続、設定不良であるかを検出できることになる。
<音声処理方法>
図2は、本実施形態に係る音声処理方法の流れを説明するフローチャートである。なお、以下の説明で図2に示されない符号は図1を参照するものとする。
図2は、本実施形態に係る音声処理方法の流れを説明するフローチャートである。なお、以下の説明で図2に示されない符号は図1を参照するものとする。
ここで、通常の音声処理は次のようになる。先ず、入力としてあるマイク入力端子T1を選択した場合、信号処理部10では、音声コーデック部11から送られてきた音と、A/D変換器21から送られてきた信号を用いてエコーキャンセル処理を行う。
次に、本実施形態の音声処理方法の特徴部分である接続確認の動作について説明する。先ず、接続を確認するモードに移行する。これは、例えば利用者がGUIで接続確認モードを選択することで行う。
接続確認モードでは、スピーカ出力端子T2と録音用出力端子T3とにそれぞれ異なる音(第1の波形から成る音声と第2の波形から成る音声)を出力する(ステップS1)。異なる音としては、マイク入力端子T1を介してこれらの音を取り込んだ際、音声の波形から信号処理部10によってこれらを分離して処理できる程度の相違となっている。具体的には、各々周波数の異なる正弦波となっている。本実施形態では、例えば、スピーカ出力端子T2に100Hzの正弦波を、録音用出力端子T3に1kHzの正弦波を出力する。
次に、選択したマイクMの入力パワー値を計算する(ステップS2)。マイクMが正しく接続されていれば、わずかな雑音を収音し、0より十分大きな値を取る。そのため、パワー値が0に近い場合(無信号の状態)は、マイクが正しく接続されていないと判断し(ステップS3)、警告メッセージを出して終了する。
図3は、マイクで取り込んだ信号の波形の例を示す図である。各図とも、横軸が時間、縦軸がマイクの入力パワー値である。無信号の状態は図3(a)に示すようにパワー値がほぼ0となる。パワー値がほぼ0であるか否かの判断は、後述する雑音のパワー値未満の閾値を設定し、この閾値を超えなければパワー値がほぼ0であると判断する。
マイクMの入力パワー値が上記閾値以上である場合は、スピーカ出力がマイクMに入力されているかを計算で求める(ステップS4)。ここで、スピーカ出力とは、正規にスピーカ出力端子T2に接続されたスピーカSPから出力される100Hzの正弦波による音声と、誤って録音用出力端子T3に接続されたスピーカSPから出力される1kHzの正弦波による音声とのいずれか、または両方をいう。さらに、スピーカ出力には雑音が含まれている場合もある。
マイクMに入力された音声の成分における周波数の計算には、例えばスピーカ出力とマイク入力との相互相関の値を用いる。相互相関の値は、スピーカ出力がマイクMに全く入力されない場合(相関がない場合)は0に近く、スピーカ出力がマイクMに入力される場合は1に近くなる性質を持つ。具体的には、スピーカ出力として100Hzの正弦波を音声、1kHzの正弦波の音声、もしくはこれらを合成した音声が考えられることから、これらの波形のパターンとマイクMで取り込んだ音声の波形のパターンとの相互相関を各々求めることになる。この相互相関の値によってスピーカ出力がマイクMに入力されているか否かを区別することができる。
実際には、残響やノイズの影響で中間的な値をとることがあるため、閾値Tを用いて以下のように実現する。
相互相関の値>Tの場合、スピーカ出力がマイクに入力されている。
相互相関の値<Tの場合、スピーカ出力がマイクに入力されていない。
相互相関の値<Tの場合、スピーカ出力がマイクに入力されていない。
この閾値Tには、例えば0.3を用いる。スピーカSPの音がマイクMに入力されているかの判定には、相互相関の他に、コヒーレンスを用いる手法や、マイク入力のパワースペクトルのピークを推定する手法などがあるが、どの手法を用いてもかまわない。
ここで、スピーカ出力端子T2に送った100Hzの信号とマイク入力の信号とに相関があれば、100Hzの音がマイクに入力されていると判断できる。同様に、録音用出力端子T3に送った1kHzの信号とマイク入力の信号とに相関があれば、1kHzの音がマイクに入力されていると判断できる。
相互相関の値を計算した後は、この計算結果に基づきマイク入力に含まれる信号の周波数について判断する(ステップS5)。そして、計算したマイク入力の有意な周波数成分が雑音のみ(100Hzの音も1kHzの音も入力されていない)であれば、スピーカが接続されていないと判断し(ステップS6)、警告メッセージを出して終了する。このマイク入力の有意な周波数成分が雑音のみであるとの判断は、マイクMの入力パワー値がほぼ0ではないが、相互相関の値が閾値Tより小さい場合である。
図3(b)は、マイクMの入力パワー値が雑音のみの場合を示している。なお、雑音であるか否かの判断は、上記のほか、例えば一定時間の入力パワー値の平均を計算し、この平均がほぼ0ではなく、所定の閾値に収まっていれば雑音であると判断してもよい。
また、計算したマイク入力の有意な周波数成分が100Hzの音のみであれば、マイクMもスピーカSPも正しく接続されていると判断し(ステップS7)、正常に接続されている旨のメッセージを出力して終了する。このマイク入力の有意な周波数成分が100Hzの音のみであるとの判断は、マイクMの入力パワー値がほぼ0ではなく、100Hzの正弦波に対するマイク入力の波形パターンの相互相関の値が閾値Tより大きい場合である。図3(c)は、マイクの入力パワー値に100Hzの音が含まれている場合を示している。
また、計算したマイク入力の有意な周波数成分が1kHzの音のみ、もしくは100Hzと1kHzの音両方であれば、スピーカSPが録音用出力端子T3に誤接続されていると判断し(ステップS8)、警告メッセージを出して終了する。このマイク入力の有意な周波数成分が1kHzの音のみであるとの判断は、マイクMの入力パワー値がほぼ0ではなく、1kHzの正弦波に対するマイク入力の波形パターンの相互相関の値が閾値Tより大きい場合である。
また、マイク入力の有意な周波数成分が100Hzと1kHzの音両方であるとの判断は、マイクMの入力パワー値がほぼ0ではなく、100Hzの正弦波と1kHzの正弦波の合成パターンに対するマイク入力の波形パターンの相互相関の値が閾値Tより大きい場合である。図3(d)は、マイクの入力パワー値に1kHzの音が含まれている場合を示している。
図2に示すフローチャートは、予め選択された1つのマイクについての接続検査となっているが、複数のマイクが接続されている場合には、図2に示すステップの処理の各マイクについて各々選択した状態で行えばよい。
図4は、マイクに含まれる周波数成分と、接続の正誤についてまとめた図である。図4に示すように、マイクで取り込んだ信号に含まれる周波数成分がほぼ0である場合、スピーカ接続は不明であるが、マイク接続が不良(接続されていない場合、接続不良の場合、設定不良の場合を含む。以下、同様。)であると判断できる。
また、マイクで取り込んだ信号に含まれる周波数成分が雑音のみの場合、マイク接続は良好であるが、スピーカ接続が不良であると判断できる。
また、マイクで取り込んだ信号に含まれる周波数成分が100Hzの音を含み、1kHzの音を含まない場合、マイクおよびスピーカとも接続が良好であると判断できる。
また、マイクで取り込んだ信号に含まれる周波数成分が1kHzの音を含み、100Hzの音を含まない場合、マイク接続は良好であるが、スピーカが録音用出力端子に誤接続されていると判断できる。
また、マイクで取り込んだ信号に含まれる周波数成分が100Hzの音と1kHzの音との両方を含む場合、マイク接続は良好であるが、スピーカが録音用出力端子に誤接続されていると判断できる。
上記説明した音声処理方法の接続確認は、例えば利用者がGUIで接続確認モードを選択することで開始されたが、このような接続確認モードでの開始のほか、近端装置を起動する際に自動的に行うようにしてもよい。
また、近端装置の起動時に接続確認を行う際、近端装置のシステム起動で出力される音(いわゆる起動音)を接続確認用の音として兼用してもよい。すなわち、いわゆる起動音の周波数成分に、スピーカ出力端子に送る第1の波形から成る音声の成分と、録音用出力端子に送る第2の波形から成る音声の成分とを含ませるようにする。これにより、システム起動でスピーカ出力されるいわゆる起動音をマイクで取り込み、先に説明したマイク入力の周波数成分の計算結果に基づき、スピーカやマイクの接続確認を自動的に行うようにする。
<実施形態の効果>
本実施形態によれば、マイクやスピーカが正しく接続されていないことを自動的に検出でき、接続不良や誤接続があった場合に迅速に通知することが可能となる。これにより、例えば録音用出力端子にスピーカが誤接続されることで発生するエコーやハウリングの問題を解消できる。
本実施形態によれば、マイクやスピーカが正しく接続されていないことを自動的に検出でき、接続不良や誤接続があった場合に迅速に通知することが可能となる。これにより、例えば録音用出力端子にスピーカが誤接続されることで発生するエコーやハウリングの問題を解消できる。
テレビ会議システムでは、複数のマイク入力端子が設けられていることから、GUIを用いて利用する入力を選択できるものがほとんどである。しかし、マイクが挿されていない入力をGUIで選択してしまうと、近端話者の音声を遠端装置に送ることができない。本実施形態の接続確認を用いれば、選択されたマイク入力端子にマイクが正確に接続されているかを迅速に検査でき、配線や設定の確認に多くの時間を費やすことがなくなる。
なお、本実施形態では、主としてテレビ会議システムにおいて本発明の音声処理装置および音声処理方法が適用される例を説明したが、ハンズフリーマイク、ネットワークを介したパーソナルコンピュータ間で行う音声通信システムなど、自装置側の音声を送信し、相手方の音声を出力するシステムであれば適用可能である。
10…信号処理部、11…音声コーデック部、12…通信部、21…A/D変換器、22…D/A変換器、23…D/A変換器、N…通信回線、M…マイク、RD…録音(録画)機器、SP…スピーカ、T1…マイク入力端子、T2…スピーカ出力端子、T3…録音用出力端子
Claims (7)
- 音声を取り込む音声入力部と、
相手方から送られてきた音声を出力する第1音声出力部と、
前記音声入力部で取り込んだ音声および前記相手方から送られてきた音声の合成を出力する第2音声出力部と、
前記第1音声出力部に第1の波形から成る音声を送り、前記第2音声出力部に前記第1の波形とは異なる第2の波形から成る音声を送り、前記音声入力部で取り込んだ音声の波形から、前記音声入力部および前記第1音声出力部ならびに前記第2音声出力部に対する機器の接続状態を判断する信号処理部と
を有する音声処理装置。 - 前記信号処理部は、前記音声入力部で取り込んだ音声から前記第1の波形から成る音声を認識し、前記第2の波形から音声を認識しなかった場合、前記音声入力部および前記第1音声出力部ならびに前記第2音声出力部に対する機器の接続状態が全て正常であると判断し、
前記音声入力部で取り込んだ音声が無信号であった場合、前記音声入力部に対する機器の接続状態が不良であると判断し、
前記音声入力部で取り込んだ音声が雑音のみであった場合、前記音声入力部に対する機器の接続状態は正常であるが、前記第1音声出力部に対する機器の接続が不良であると判断し、
前記音声入力部で取り込んだ音声から前記第2の波形から成る音声を認識した場合、前記音声入力部に対する機器の接続状態は正常であるが、前記第2音声出力部に対する機器の接続状態が不良であると判断する
請求項1記載の音声処理装置。 - 前記第1の波形と前記第2の波形とは、前記音声入力部で取り込んだ音声の両波形を分離して処理できる相違となっている
請求項1または2記載の音声処理装置。 - 前記第1の波形と前記第2の波形とは、各々周波数の異なる正弦波となっている
請求項1から3のうちいずれか1項に記載の音声処理装置。 - 相手方から送られてきた音声を出力する第1音声出力部に第1の波形から成る音声を送り、音声入力部で取り込んだ音声および前記相手方から送られてきた音声の合成を出力する第2音声出力部に前記第1の波形とは異なる第2の波形から成る音声を送る工程と、
前記音声入力部で取り込んだ音声の波形から、前記音声入力部および前記第1音声出力部ならびに前記第2音声出力部に対する機器の接続状態を判断する工程と
を有する音声処理方法。 - 前記機器の接続状態の判断では、
前記音声入力部で取り込んだ音声から前記第1の波形から成る音声を認識し、前記第2の波形から音声を認識しなかった場合、前記音声入力部および前記第1音声出力部ならびに前記第2音声出力部に対する機器の接続状態が全て正常であると判断し、
前記音声入力部で取り込んだ音声が無信号であった場合、前記音声入力部に対する機器の接続状態が不良であると判断し、
前記音声入力部で取り込んだ音声が雑音のみであった場合、前記音声入力部に対する機器の接続状態は正常であるが、前記第1音声出力部に対する機器の接続が不良であると判断し、
前記音声入力部で取り込んだ音声から前記第2の波形から成る音声を認識した場合、前記音声入力部に対する機器の接続状態は正常であるが、前記第2音声出力部に対する機器の接続状態が不良であると判断する
請求項5記載の音声処理方法。 - 前記第1の波形から成る音声および前記第2の波形から成る音声として、前記音声入力部および前記第1音声出力部ならびに前記第2音声出力部を備える装置の起動時の音声と兼用する
請求項5または6記載の音声処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008153759A JP2009302804A (ja) | 2008-06-12 | 2008-06-12 | 音声処理装置および音声処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008153759A JP2009302804A (ja) | 2008-06-12 | 2008-06-12 | 音声処理装置および音声処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009302804A true JP2009302804A (ja) | 2009-12-24 |
Family
ID=41549260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008153759A Pending JP2009302804A (ja) | 2008-06-12 | 2008-06-12 | 音声処理装置および音声処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009302804A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015008373A (ja) * | 2013-06-25 | 2015-01-15 | 富士通株式会社 | 被試験体の音声出力検査装置及びその方法 |
JP2018036964A (ja) * | 2016-09-01 | 2018-03-08 | セコム株式会社 | 行動記録システム、端末装置及び行動記録方法 |
-
2008
- 2008-06-12 JP JP2008153759A patent/JP2009302804A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015008373A (ja) * | 2013-06-25 | 2015-01-15 | 富士通株式会社 | 被試験体の音声出力検査装置及びその方法 |
JP2018036964A (ja) * | 2016-09-01 | 2018-03-08 | セコム株式会社 | 行動記録システム、端末装置及び行動記録方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101255404B1 (ko) | 컴퓨터 시스템에서 에코 소거를 적용할지를 판정하는 방법,컴퓨터 시스템에서 에코 소거 알고리즘을 구성하는 방법및 에코 소거 알고리즘을 구성하는 컴퓨터 시스템 | |
JP5533854B2 (ja) | 音声認識処理システム、および音声認識処理方法 | |
EP2973559B1 (en) | Audio transmission channel quality assessment | |
DK1745637T3 (da) | Konferenceterminal med ekkoreduktion til et talekonferencesystem | |
USRE49462E1 (en) | Adaptive noise cancellation for multiple audio endpoints in a shared space | |
US9769567B2 (en) | Audio system and method | |
JP4438720B2 (ja) | エコーキャンセラ及びマイク装置 | |
US20180350378A1 (en) | Detecting and reducing feedback | |
US20180035223A1 (en) | Detecting Signal Processing Component Failure Using One or More Delay Estimators | |
JP2014053890A (ja) | 望ましくないノイズに対する自動的マイクロホンミューティング | |
JP5288148B2 (ja) | 背景雑音キャンセリング装置および方法 | |
JP2007053748A (ja) | 音響入出力拡張方法及び音響入出力拡張システム | |
JPH09233198A (ja) | 全二重音声会議電話のためのソフトウエアベースのブリッジ方法及び装置 | |
JP2009302804A (ja) | 音声処理装置および音声処理方法 | |
JP2010199741A (ja) | 携帯電話端末装置 | |
JP2005338454A (ja) | 音声対話装置 | |
JP2019176386A (ja) | 通信端末及び会議システム | |
JP2009171197A (ja) | 情報通信装置、通信状態検査方法、通信状態検査プログラムおよび双方向通信システム | |
JP2010164992A (ja) | 音声対話装置 | |
US7912196B2 (en) | Voice conference apparatus, method for confirming voice in voice conference system and program product | |
JP2010010856A (ja) | ノイズキャンセル装置、ノイズキャンセル方法、ノイズキャンセルプログラム、ノイズキャンセルシステム、及び、基地局 | |
JP2007086592A (ja) | 音声出力装置および音声出力方法 | |
JP2005086363A (ja) | 通話装置 | |
TWI790694B (zh) | 聲音浮水印的處理方法及聲音浮水印產生裝置 | |
TWI736122B (zh) | 用於聲學回聲消除的時間延遲校準方法及電視裝置 |