JP6396829B2 - 情報処理装置、判定方法及びコンピュータプログラム - Google Patents

情報処理装置、判定方法及びコンピュータプログラム Download PDF

Info

Publication number
JP6396829B2
JP6396829B2 JP2015052501A JP2015052501A JP6396829B2 JP 6396829 B2 JP6396829 B2 JP 6396829B2 JP 2015052501 A JP2015052501 A JP 2015052501A JP 2015052501 A JP2015052501 A JP 2015052501A JP 6396829 B2 JP6396829 B2 JP 6396829B2
Authority
JP
Japan
Prior art keywords
signal
voice
band
far
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015052501A
Other languages
English (en)
Other versions
JP2016174233A (ja
Inventor
桂右 井本
桂右 井本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2015052501A priority Critical patent/JP6396829B2/ja
Publication of JP2016174233A publication Critical patent/JP2016174233A/ja
Application granted granted Critical
Publication of JP6396829B2 publication Critical patent/JP6396829B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

本発明は、エコーキャンセラによって既にエコー成分が除去されているか否か判定する技術に関する。
従来、アコースティックエコー又はハウリング(以下、まとめて「エコー」という。)の発生を防止する技術としてエコーキャンセラが提案されている(例えば特許文献1参照)。エコーキャンセラは、発話者が使用するマイク(以下、「遠端マイク」という。)によって取得された音声信号(以下、「遠端音声信号」という。)と、受話者が使用するマイク(以下、「近端マイク」という。)によって取得された音声信号と、に基づいて、近端マイクによって取得された音声信号に含まれるエコー成分を推定する。エコーキャンセラは、近端マイクによって取得された音声信号から、推定されたエコー成分を削除することによって、エコーの発生を抑制する。
特開2014−36291号公報
近年提供されている端末装置やアプリケーションには、独自にエコーキャンセラが搭載されていることが多い。そのため、複数のエコーキャンセラが重複して動作してしまう場合がある。このような場合、すでにエコー成分が削除された音声信号を取得するエコーキャンセラは、正しくエコー成分を推定できない。そのため、本来除去されるべきではない音声信号が除去されてしまう等の不具合が生じるという問題があった。従来は、このような問題に対し、人手で調査することによってエコーキャンセラが動作しているか否か判断していた。
上記事情に鑑み、本発明は、エコーキャンセラが動作しているか否かをより容易に判定することを可能とする技術の提供を目的としている。
本発明の一態様は、発話者が使用するマイクによって取得された音声信号である遠端音声信号と、受話者が使用するマイクによって取得された音声信号であってエコーキャンセラによってエコー成分が除去されている可能性がある音声信号である近端音声信号と、のパワー値の差に関する情報に基づいて、前記近端音声信号において前記エコー成分が除去されているか否か判定する判定部、を備える情報処理装置である。
本発明の一態様は、上記の情報処理装置であって、前記判定部は、遠端音声信号と、前記遠端音声信号に由来するエコー成分が含まれている可能性のある近端音声信号と、のパワー値の差を表す第一特徴量を、複数の遠端音声信号について取得し、前記判定部は、前記第一特徴量の時間変化に基づいて前記エコー成分が除去されているか否か判定する。
本発明の一態様は、上記の情報処理装置であって、前記判定部は、前記発話者と前記受話者との間の通話が開始されてから所定の時間が経過するまでの間に判定する。
本発明の一態様は、上記の情報処理装置であって、前記判定部は、前記遠端音声信号及び前記近端音声信号を、人間の声が含まれる周波数帯域である音声帯域と人間の声が含まれない周波数帯域である非音声帯域とに分離し、前記遠端音声信号の前記音声帯域の信号と、前記近端音声信号の前記音声帯域の信号とのパワー値の差を表す音声帯域特徴量と、前記遠端音声信号の前記非音声帯域の信号と、前記近端音声信号の前記非音声帯域の信号とのパワー値の差を表す非音声帯域特徴量と、を取得し、前記音声帯域特徴量と前記非音声帯域特徴量とのパワー値の差を表す情報に基づいて前記エコー成分が除去されてるか否か判定する。
本発明の一態様は、上記の情報処理装置であって、前記判定部は、前記発話者と前記受話者との間の通話が開始されてから所定の時間が経過してから判定する。
本発明の一態様は、発話者が使用するマイクによって取得された音声信号である遠端音声信号と、受話者が使用するマイクによって取得された音声信号であってエコーキャンセラによってエコー成分が除去されている可能性がある音声信号である近端音声信号と、のパワー値の差に関する情報を取得するステップと、前記近端音声信号において前記エコー成分が除去されているか否か判定するステップと、を有する判定方法である。
本発明の一態様は、発話者が使用するマイクによって取得された音声信号である遠端音声信号と、受話者が使用するマイクによって取得された音声信号であってエコーキャンセラによってエコー成分が除去されている可能性がある音声信号である近端音声信号と、のパワー値の差に関する情報を取得するステップと、前記近端音声信号において前記エコー成分が除去されているか否か判定するステップと、をコンピュータに実行させるためのコンピュータプログラムである。
本発明により、エコーキャンセラが動作しているか否かをより容易に判定することを可能となる。
第一実施形態の通話システム100の概念を示すシステム概念図である。 検出部200の動作の流れの例を示すフローチャートである。 第二実施形態の通話システム100aの概念を示すシステム概念図である。 第二実施形態の検出部200aの動作の原理を示す図である。 検出部200aの動作の流れの例を示すフローチャートである。 第三実施形態の通話システム100bの概念を示すシステム概念図である。 上述した本発明における検出部200が適用された通話システム900の例を示す図である。 通話サーバ500の機能構成例を示す概略ブロック図である。 通話サーバ500の動作の流れを示す図である。 検出部200に相当する機能を備えた通話端末700の機能構成を示す概略ブロック図である。
[第一実施形態]
図1は、第一実施形態の通話システム100の概念を示すシステム概念図である。通話システム100は、遠端マイク10、発話者に対して音声を出力するスピーカー(以下、「遠端スピーカー」という。)20、受話者に対して音声を出力するスピーカー(以下、「近端スピーカー」という。)30、近端マイク40、検出部200を備える。図1に示す概念図では、通話システム100にはエコーキャンセラ300が具備されている。図1に示されるように、発話者の位置を遠端と呼び、受話者の位置を近端と呼ぶ。また、発話者とは、自身が発話した音声が、スピーカーからエコーとして聞こえる者を指す。受話者とは、発話者の通話相手の者を指す。検出部200は、エコーキャンセラ300よりも遠端側に設けられる。検出部200は、自装置よりも近端側にエコーキャンセラが設けられているか否かを判定する。なお、第一実施形態における検出部200の処理は、発話者と受話者との間における通話が開始された直後から所定の時間内に実行されることが望ましい。言い換えると、第一実施形態における検出部200の処理は、発話者と受話者との間で動作する可能性のあるエコーキャンセラによるエコーの除去が安定する前に実行されることが望ましい。
検出部200の具体的な処理について説明する。検出部200は、遠端マイク10によって取得された音声信号を含む音声フレーム(以下、「遠端音声フレーム」という。)を、ネットワーク400を介して取得する。検出部200は、近端マイク40によって取得された音声信号であって既にエコーキャンセラによってエコー成分が除去されている可能性がある音声信号(以下、「近端音声信号」という。)を含む音声フレーム(以下、「近端音声フレーム」という。)を取得する。検出部200は、取得された遠端音声フレームと近端音声フレームとを記憶する。検出部200は、遠端音声フレームと、この遠端音声フレームに由来するエコーが含まれる可能性のある近端音声フレーム(以下、「対応フレーム」という。)と、に基づいて第一特徴量を取得する。ある遠端音声フレームに由来するエコーがどの近端音声フレームに含まれる可能性があるかについては、検出部200が設けられる位置に応じて予め検出部200に設定されている。例えば、検出部200がある遠端音声フレームを取得してから、この遠端音声フレームの音声信号が近端スピーカー30から出力され、その時点で近端マイク40によって取得された音声信号を含む近端音声フレームが検出部200によって取得されるまでに要する時間に基づいて、上記設定がなされる。
第一特徴量は、遠端音声フレームの音声信号と、対応フレームの音声信号とのパワー値の差が現れる量であれば、どのような量であってもよい。パワー値とは、音声信号の振幅に基づく値である。パワー値は、例えば音声信号の振幅の二乗として定義されてもよい。検出部200は、例えば遠端音声フレームに含まれる音声信号のパワー値の平均値と、対応フレームに含まれる音声信号のパワー値の平均値との比を第一特徴量として取得してもよい。検出部200は、遠端音声フレーム及び対応フレームの複数の組み合わせについて第一特徴量を取得する。
検出部200は、複数の第一特徴量に基づいて第二特徴量を取得する。第二特徴量は、第一特徴量の時間変化が表れる量であれば、どのような量であってもよい。検出部200は、例えば時刻tに取得された遠端音声フレームに関する第一特徴量と、時刻t+nに取得された遠端音声フレームに関する第一特徴量との比を第二特徴量として取得する。検出部200は、第二特徴量が所定の閾値以上である場合、自装置よりも近端側でエコーキャンセラが動作していると判定する。検出部200は、第二特徴量が所定の閾値未満である場合、自装置よりも近端側でエコーキャンセラが動作していないと判定する。
一般的に、エコーキャンセラは、通話が開始されてからある程度の時間が経過するまでは、適切にエコー成分を削除することができない。その理由は、エコーキャンセラがエコー成分を適切に推定することができないためである。エコー成分の推定精度は、時間の経過と共に向上していく。そのため、ある程度の時間が経過するまでは、近端音声フレームの音声信号に含まれるエコー成分の量が時間に応じて変化(減少)する。第一実施形態における検出部200は、この時間変化に基づいてエコーキャンセラの動作を検出する。
なお、ある程度の時間が経過すると、エコー成分の推定精度が充分に高くなり、安定してエコー成分を削除することが可能となる。そのため、第一実施形態における検出部200は、エコー成分の削除が安定する前に動作することによってエコーキャンセラの動作を検出する。
図1の場合、検出部200は、エコーキャンセラ300が動作しているか否かについて判定することができる。なお、検出部200は、エコーキャンセラ300が実装されている装置と同じ装置に実装されてもよいし、異なる装置に実装されてもよい。例えば、検出部200が通話サーバに実装され、エコーキャンセラ300が端末装置に実装されてもよい。
図2は、検出部200の動作の流れの例を示すフローチャートである。検出部200は、遠端音声フレームを取得する(ステップS101)。検出部200は、取得された遠端音声フレームを記憶する(ステップS102)。検出部200は、近端音声フレームを取得する(ステップS103)。検出部200は、取得された近端音声フレームを記憶する(ステップS104)。検出部200は、記憶されている遠端音声フレーム及び対応フレームの複数の組み合わせに基づいて複数の第一特徴量を取得する(ステップS105)。検出部200は、複数の第一特徴量(例えば2つの第一特徴量)に基づいて、第二特徴量を取得する(ステップS106)。検出部200は、予め記憶している閾値と第二特徴量とを比較する(ステップS107)。第二特徴量が所定の閾値以上である場合(ステップS107−YES)、検出部200は自装置よりも近端側でエコーキャンセラが動作していると判定する(ステップS108)。第二特徴量が所定の閾値未満である場合(ステップS107−NO)、検出部200は自装置よりも近端側でエコーキャンセラが動作していないと判定する(ステップS109)。
[第二実施形態]
図3は、第二実施形態の通話システム100aの概念を示すシステム概念図である。通話システム100aは、検出部200に代えて検出部200aを備える点で第一実施形態と相違する。第二実施形態の通話システム100aの検出部200aを除く構成は、第一実施形態の通話システム100と同様である。第二実施形態における検出部200aの処理は、発話者と受話者との間における通話が開始されてから所定の時間が経過した後に実行されることが望ましい。言い換えると、第二実施形態における検出部200aの処理は、発話者と受話者との間で動作する可能性のあるエコーキャンセラによるエコーの除去が安定した後に実行されることが望ましい。
検出部200aの具体的な処理について説明する。検出部200aは、遠端音声フレームを、ネットワーク400を介して取得する。検出部200aは、近端音声フレームを取得する。検出部200aは、取得された遠端音声フレームと近端音声フレームとを記憶する。検出部200aは、遠端音声フレームの音声信号を、音声帯域の信号と非音声帯域の信号とに分離する。また、検出部200aは、対応フレームの音声信号を、音声帯域の信号と非音声帯域の信号とに分離する。音声帯域とは、一般的な人間の声が含まれる周波数帯域を表す。非音声帯域とは、一般的な人間の声が含まれない周波数帯域を表す。
検出部200aは、遠端音声フレームの音声帯域の信号と、対応フレームの音声帯域の信号とに基づいて第一特徴量を取得する。さらに、検出部200aは、遠端音声フレームの非音声帯域の信号と、対応フレームの非音声帯域の信号とに基づいて第一特徴量を取得する。
検出部200aは、一組の遠端音声フレーム及び対応フレームから取得された音声帯域の第一特徴量と非音声帯域の第一特徴量とに基づいて第三特徴量を取得する。第三特徴量は、音声帯域の第一特徴量と非音声帯域の第一特徴量とのパワー値の差が表れる量であれば、どのような量であってもよい。検出部200aは、音声帯域の第一特徴量と、非音声帯域の第一特徴量との比を第三特徴量として取得する。検出部200aは、第三特徴量が所定の閾値以上である場合、自装置よりも近端側でエコーキャンセラが動作していると判定する。検出部200aは、第三特徴量が所定の閾値未満である場合、自装置よりも近端側でエコーキャンセラが動作していないと判定する。
図4は、第二実施形態の検出部200aの動作の原理を示す図である。図4(A)〜(C)において、横軸は音声信号の周波数を示し、縦軸は各周波数における信号成分のパワー値を示す。図4(A)は、遠端マイクにおいてホワイトノイズが入力された場合の遠端音声信号の例を示す。図4(B)及び図4(C)は、図4(A)に示される遠端音声信号が近端スピーカー30から出力されて近端マイクによって入力された場合の近端音声信号の例を示す。ただし、図4(B)ではエコーキャンセラが動作しておらず、図4(C)ではエコーキャンセラが動作している。一般的に、エコーキャンセラは音声帯域において機能する。そのため、以下のような現象が生じる。
エコーキャンセラが動作していない場合、音声帯域と非音声帯域とで信号のパワー値に大きな差は生じない(図4(B)参照)。一方、エコーキャンセラが動作している場合、音声帯域においてのみ、信号のパワー値が減衰している。そのため、音声帯域と非音声帯域とで信号のパワー値に差が生じる(図4(C)参照)。このような性質があるため、エコーキャンセラが動作している場合、第三特徴量の値が大きくなる。したがって、第三特徴量の値を閾値と比較することによって、エコーキャンセラが動作しているか否か判定することが可能となる。
第二実施形態における検出部200aは、このような原理に基づいてエコーキャンセラの動作を検出する。
図3の場合、検出部200aは、エコーキャンセラ300が動作しているか否かについて判定することができる。なお、検出部200aは、エコーキャンセラ300が実装されている装置と同じ装置に実装されてもよいし、異なる装置に実装されてもよい。例えば、検出部200aが通話サーバに実装され、エコーキャンセラ300が端末装置に実装されてもよい。
図5は、検出部200aの動作の流れの例を示すフローチャートである。検出部200aは、遠端音声フレームを取得する(ステップS101)。検出部200aは、取得された遠端音声フレームを記憶する(ステップS102)。検出部200aは、近端音声フレームを取得する(ステップS103)。検出部200aは、取得された近端音声フレームを記憶する(ステップS104)。検出部200aは、記憶されている遠端音声フレーム及び対応フレームの音声信号をそれぞれ音声帯域と非音声帯域とに分割する。検出部200aは、音声帯域の第一特徴量と非音声帯域の第一特徴量とを取得する(ステップS202)。検出部200aは、音声帯域の第一特徴量と非音声帯域の第一特徴量とに基づいて、第三特徴量を取得する(ステップS203)。検出部200aは、予め記憶している閾値と第三特徴量とを比較する(ステップS204)。第三特徴量が所定の閾値以上である場合(ステップS204−YES)、検出部200aは自装置よりも近端側でエコーキャンセラが動作していると判定する(ステップS108)。第三特徴量が所定の閾値未満である場合(ステップS204−NO)、検出部200aは自装置よりも近端側でエコーキャンセラが動作していないと判定する(ステップS109)。
[第三実施形態]
図6は、第三実施形態の通話システム100bの概念を示すシステム概念図である。通話システム100bは、検出部200aに代えて検出部200bを備える点で第二実施形態と相違する。第三実施形態の通話システム100bの検出部200bを除く構成は、第二実施形態の通話システム100aと同様である。第三実施形態における検出部200bは、自装置において生成した所定の音声信号を、遠端音声信号に追加する。所定の音声信号は、例えばホワイトノイズであってもよい。検出部200bがエコーキャンセラの動作の有無を判定する処理は、第一実施形態における検出部200と同じであってもよいし、第二実施形態における検出部200aと同じであっても良い。第三実施形態では、検出部200bが遠端音声信号に所定の音声信号を追加するため、発話者が無言であってもエコーキャンセラの動作の有無を判定することが可能となる。
[変形例]
検出部200は、第一実施形態における検出部200と第二実施形態における検出部200aとの動作を実行可能に構成されてもよい。この場合、たとえば検出部200は、通話が開始された直後から所定の時間が経過するまでは第一実施形態における検出部200の動作によってエコーキャンセラの動作の有無を判定する。検出部200は、通話が開始されてから所定の時間が経過した後は、第二実施形態における検出部200aの動作によってエコーキャンセラの動作の有無を判定する。
第一特徴量を取得する際には、必ずしも音声信号のパワー値を用いる必要は無い。例えば、音声信号のパワー値に代えて、音圧の絶対値、対数パワー、絶対値のパワーなどが用いられてもよい。
[適用例]
図7は、上述した本発明における検出部200が適用された通話システム900の例を示す図である。通話システム900は、通話サーバ500、通話端末600及び通話端末700を備える。以下の説明では、通話端末600のユーザが発話した際に生じるエコーを除去するエコーキャンセラの動作の有無の判定について説明する。
図8は、通話サーバ500の機能構成例を示す概略ブロック図である。通話サーバ500は、通信部501、通話制御部502、エコーキャンセラ503及び検出部504を備える。通信部501は、ネットワークを介して通話端末600及び通話端末700と通信する。通話制御部502は、通話端末600及び通話端末700との間で行われる通話を実現するための処理を実行する。エコーキャンセラ503は、通話端末600及び通話端末700との間で行われる通話で生じるエコーを除去する。検出部504は、上述した第一実施形態から第三実施形態のいずれかにおける検出部200として機能する。
図9は、通話サーバ500の動作の流れを示す図である。図9の例では、検出部504に第一実施形態の検出部200が適用されている。図1のステップS101〜ステップS109に関しては、図2に示される処理と同じである。通話サーバ500では、検出部504がエコーキャンセラの動作が無いと判定した場合に、エコーキャンセラ503が起動する。一方、検出部504がエコーキャンセラの動作が有ると判定した場合、エコーキャンセラ503は起動されない。このように通話サーバ500が動作することによって、重複してエコーキャンセラが動作してしまうことを防止することができる。
上述した説明では、検出部200に相当する機能が通話サーバ500に具備されている。検出部200に相当する機能は、通話端末700に具備されてもよい。図10は、検出部200に相当する機能を備えた通話端末700の機能構成を示す概略ブロック図である。
通話端末700は、通信部701、通話制御部702、音声出力部703、音声入力部704及びエコーキャンセラ制御部710を備える。通信部701は、ネットワークを介して通話サーバ500及び通話端末600と通信する。通話制御部702は、通話端末600と自装置との間で行われる通話を実現するための処理を実行する。音声出力部703は、スピーカーである。音声出力部703は、通話により生じる音声(遠端音声信号により表される音声)を出力する。音声入力部はマイクである。音声入力部704は、通話端末700のユーザの発話音声等の音声を入力する。音声入力部704から入力される音声には、音声出力部703によって出力された音声も含まれる。エコーキャンセラ制御部710は、通話端末600及び通話端末700との間で行われる通話で生じるエコーを除去するための処理を行う。
以下、エコーキャンセラ制御部710について詳細に説明する。エコーキャンセラ制御部710は、検出部711及びエコーキャンセラ712を備える。検出部711は、上述した第一実施形態から第三実施形態のいずれかにおける検出部200として機能する。検出部711は、検出結果をエコーキャンセラ712に通知する。検出部711が、他のエコーキャンセラの動作が無いと判定した場合、エコーキャンセラ712は起動する。一方、検出部711が、他のエコーキャンセラの動作が有ると判定した場合、エコーキャンセラ712は起動しない。このように通話端末700におけるエコーキャンセラ制御部710が動作することによって、重複してエコーキャンセラが動作してしまうことを防止することができる。
通話端末700において、エコーキャンセラ制御部710は、どのような形で実装されてもよい。例えば、通話端末700のOS(Operating System)にエコーキャンセラ制御部710が組み込まれていてもよい。例えば、通話端末700にアプリケーションとしてエコーキャンセラ制御部710が組み込まれていてもよい。例えば、通話端末700にハードウェアとしてエコーキャンセラ制御部710が組み込まれていてもよい。また、エコーキャンセラ制御部710に相当する機能が、通話サーバ500に設けられてもよい。
上述した実施形態における検出部200、200a、200b及びエコーキャンセラ制御部710の機能をコンピュータで実現するようにしても良い。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
100,100a,100b…通話システム, 10…遠端マイク, 20…遠端スピーカ, 30…近端スピーカ, 40…近端マイク, 200,200a,200b…検出部, 300…エコーキャンセラ, 500…通話サーバ, 600…通話端末, 700…通話端末, 501…通信部, 502…通話制御部, 503…エコーキャンセラ, 504…検出部, 701…通信部, 702…通話制御部, 703…音声出力部, 704…音声入力部, 710…エコーキャンセラ制御部, 711…検出部, 712…エコーキャンセラ, 900…通話システム

Claims (4)

  1. 発話者が使用するマイクによって取得された音声信号である遠端音声信号と、受話者が使用するマイクによって取得された音声信号であってエコーキャンセラによってエコー成分が除去されている可能性がある音声信号である近端音声信号と、のパワー値の差に関する情報に基づいて、前記近端音声信号において前記エコー成分が除去されているか否か判定する判定部、を備え
    前記判定部は、
    前記遠端音声信号及び前記近端音声信号を、人間の声が含まれる周波数帯域である音声帯域と人間の声が含まれない周波数帯域である非音声帯域とに分離し、
    前記遠端音声信号の前記音声帯域の信号と、前記近端音声信号の前記音声帯域の信号とのパワー値の差を表す音声帯域特徴量と、前記遠端音声信号の前記非音声帯域の信号と、前記近端音声信号の前記非音声帯域の信号とのパワー値の差を表す非音声帯域特徴量と、を取得し、
    前記音声帯域特徴量と前記非音声帯域特徴量とのパワー値の差を表す情報に基づいて前記エコー成分が除去されているか否か判定する、情報処理装置。
  2. 前記判定部は、前記発話者と前記受話者との間の通話が開始されてから所定の時間が経過してから判定する、請求項に記載の情報処理装置。
  3. 発話者が使用するマイクによって取得された音声信号である遠端音声信号と、受話者が使用するマイクによって取得された音声信号であってエコーキャンセラによってエコー成分が除去されている可能性がある音声信号である近端音声信号と、のパワー値の差に関する情報を取得するステップと、
    前記近端音声信号において前記エコー成分が除去されているか否か判定するステップと、を有し、
    前記パワー値の差に関する情報を取得するステップでは、
    前記遠端音声信号及び前記近端音声信号を、人間の声が含まれる周波数帯域である音声帯域と人間の声が含まれない周波数帯域である非音声帯域とに分離し、
    前記遠端音声信号の前記音声帯域の信号と、前記近端音声信号の前記音声帯域の信号とのパワー値の差を表す音声帯域特徴量と、前記遠端音声信号の前記非音声帯域の信号と、前記近端音声信号の前記非音声帯域の信号とのパワー値の差を表す非音声帯域特徴量と、を取得し、
    前記判定するステップでは、前記音声帯域特徴量と前記非音声帯域特徴量とのパワー値の差を表す情報に基づいて前記エコー成分が除去されているか否か判定する、
    判定方法。
  4. 発話者が使用するマイクによって取得された音声信号である遠端音声信号と、受話者が使用するマイクによって取得された音声信号であってエコーキャンセラによってエコー成分が除去されている可能性がある音声信号である近端音声信号と、のパワー値の差に関する情報に基づいて、前記近端音声信号において前記エコー成分が除去されているか否か判定する判定部、を備え、
    前記判定部は、
    前記遠端音声信号及び前記近端音声信号を、人間の声が含まれる周波数帯域である音声帯域と人間の声が含まれない周波数帯域である非音声帯域とに分離し、
    前記遠端音声信号の前記音声帯域の信号と、前記近端音声信号の前記音声帯域の信号とのパワー値の差を表す音声帯域特徴量と、前記遠端音声信号の前記非音声帯域の信号と、前記近端音声信号の前記非音声帯域の信号とのパワー値の差を表す非音声帯域特徴量と、を取得し、
    前記音声帯域特徴量と前記非音声帯域特徴量とのパワー値の差を表す情報に基づいて前記エコー成分が除去されているか否か判定する情報処理装置、としてコンピュータを機能させるためのコンピュータプログラム。
JP2015052501A 2015-03-16 2015-03-16 情報処理装置、判定方法及びコンピュータプログラム Active JP6396829B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015052501A JP6396829B2 (ja) 2015-03-16 2015-03-16 情報処理装置、判定方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015052501A JP6396829B2 (ja) 2015-03-16 2015-03-16 情報処理装置、判定方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2016174233A JP2016174233A (ja) 2016-09-29
JP6396829B2 true JP6396829B2 (ja) 2018-09-26

Family

ID=57009776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015052501A Active JP6396829B2 (ja) 2015-03-16 2015-03-16 情報処理装置、判定方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6396829B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018163328A1 (ja) * 2017-03-08 2018-09-13 三菱電機株式会社 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
JP2020202448A (ja) * 2019-06-07 2020-12-17 ヤマハ株式会社 音響装置および音響処理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2629569B2 (ja) * 1993-08-03 1997-07-09 日本電気株式会社 通話信号増幅方式
JP3611493B2 (ja) * 1999-11-17 2005-01-19 沖電気工業株式会社 エコーキャンセラ装置
JP2005184256A (ja) * 2003-12-17 2005-07-07 Oki Electric Ind Co Ltd 通信システム
WO2006130970A1 (en) * 2005-06-10 2006-12-14 Sangoma Technologies Corporation Echo canceller controller
JP5887535B2 (ja) * 2012-02-17 2016-03-16 パナソニックIpマネジメント株式会社 エコー消去装置、エコー消去方法、及び、通話装置

Also Published As

Publication number Publication date
JP2016174233A (ja) 2016-09-29

Similar Documents

Publication Publication Date Title
US10205830B2 (en) Echo cancellation data synchronization control method, terminal, and storage medium
JP6773403B2 (ja) ゲイン制御システムおよびゲイン制御方法
EP2988301B1 (en) Echo suppression device and echo suppression method
US8903721B1 (en) Smart auto mute
JP5332733B2 (ja) エコーキャンセラ
US9100756B2 (en) Microphone occlusion detector
CN110896509A (zh) 耳机佩戴状态确定方法、电子设备控制方法及电子设备
KR101961998B1 (ko) 즉각적인 바람 잡음을 감소시키는 것
JPWO2010035308A1 (ja) エコー消去装置
JP6959917B2 (ja) 音響装置における再生管理のためのイベント検出
JP2007003702A (ja) 雑音除去装置、通信端末、及び、雑音除去方法
JP2003158476A (ja) エコーキャンセラ
KR20150043858A (ko) 하울링 제거 장치 및 방법
WO2014161334A1 (zh) 一种语音通话方法及装置
US9888330B1 (en) Detecting signal processing component failure using one or more delay estimators
RU2725017C1 (ru) Устройство и способ для обработки аудиосигнала
KR102112018B1 (ko) 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법
JP6396829B2 (ja) 情報処理装置、判定方法及びコンピュータプログラム
JPWO2018167960A1 (ja) 会話装置、音声処理システム、音声処理方法、および音声処理プログラム
US8406430B2 (en) Simulated background noise enabled echo canceller
JP6878776B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
KR101824648B1 (ko) 음성 신호 처리 방법 및 장치
US9392365B1 (en) Psychoacoustic hearing and masking thresholds-based noise compensator system
WO2020023856A1 (en) Forced gap insertion for pervasive listening
JP6369192B2 (ja) エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180830

R150 Certificate of patent or registration of utility model

Ref document number: 6396829

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250