JP2019504537A - エコー除去方法、デバイス、およびコンピュータストレージ媒体 - Google Patents

エコー除去方法、デバイス、およびコンピュータストレージ媒体 Download PDF

Info

Publication number
JP2019504537A
JP2019504537A JP2018528248A JP2018528248A JP2019504537A JP 2019504537 A JP2019504537 A JP 2019504537A JP 2018528248 A JP2018528248 A JP 2018528248A JP 2018528248 A JP2018528248 A JP 2018528248A JP 2019504537 A JP2019504537 A JP 2019504537A
Authority
JP
Japan
Prior art keywords
signal
end signal
correlation coefficient
threshold
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018528248A
Other languages
English (en)
Other versions
JP6671477B2 (ja
Inventor
佳▲慶▼ 周
佳▲慶▼ 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2019504537A publication Critical patent/JP2019504537A/ja
Application granted granted Critical
Publication of JP6671477B2 publication Critical patent/JP6671477B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本開示は、エコーキャンセル方法および装置を開示する。方法は、近端信号内に発話信号が存在するかどうかを検出するステップと、NLMS適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得するステップと、検出結果が近端信号内に発話信号が存在するということであるとき、残差信号が予め設定された出力条件を満たすかどうかを検出するステップと、残差信号が予め設定された出力条件を満たさないとき、残差信号に第1の減衰係数を掛けて出力信号を取得するステップとを含む。本発明の実施形態は、コンピュータストレージ媒体をさらに提供する。

Description

本開示は、信号処理テクノロジーの分野に関し、特に、エコーキャンセル方法および装置ならびにコンピュータストレージ媒体に関する。
通話プロセスの間に、第1の電子デバイスが第2の電子デバイスによって送信された発話信号を再生するとき、第1の電子デバイス内のマイクロフォンが、発話信号を集め、発話信号を第2の電子デバイスに送信する。結果として、第2の電子デバイスのユーザは、通話品質に影響を与える、ユーザからの発話信号のエコーを聞く。したがって、通話プロセス中にエコーをキャンセルする必要がある。
関連するテクノロジーにおいて、エコーキャンセル方法が提供される。まず、第1の電子デバイスが、第1の電子デバイスの両端(double-end)検出モジュールに遠端(far end)信号および近端(near end)信号を入力する。遠端信号は、第2の電子デバイスによって送信された発話信号であり、近端信号は、第1の電子デバイスが遠端信号を再生するときに生成されたエコー信号と第1の電子デバイスのユーザからの発話信号とを含む混合信号である。両端検出モジュールは、近端信号内に発話信号が存在するかどうかを検出し、検出結果および遠端信号を正規化最小2乗平均適応フィルタリング(NLMS: normalized least mean square adaptive filtering)モジュールに入力し、遠端信号に従って遠端信号の推定された信号を取得し、推定された信号を出力し、それから、近端信号から推定された信号を差し引いて残差信号を取得する。残差信号は、エコーキャンセルの効果を改善するために、NLMSモジュールによって受信された検出結果が近端信号内に発話信号が存在するということであるときはエコー信号を削減するために非線形処理(NLP)モジュールに入力される。残差信号は、NLMSモジュールによって受信された検出結果が近端信号内に発話信号が存在しないということであるときはNLMSモジュールに入力され、次回の遠端信号の推定のために使用される。
NLMSモジュールが遠端信号を推定するときに誤差(error)が存在するので、エコー信号の一部は、近端信号から推定された信号を差し引くことによって取得される残差信号内に残り、通話品質に影響を与える。
本発明の実施形態は、エコーキャンセル方法および装置を提供する。技術的な解決策は、以下のようなものである。第1の態様によれば、エコーキャンセル方法が提供され、方法は、
近端信号内に発話信号が存在するかどうかを検出するステップと、
正規化最小2乗平均(NLMS: normalized least mean square)適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得するステップと、
検出結果が近端信号内に発話信号が存在するということであるとき、残差信号が予め設定された出力条件を満たすかどうかを検出するステップと、
残差信号が予め設定された出力条件を満たさないとき、残差信号に第1の減衰係数を掛けて出力信号を取得するステップとを含む。
第2の態様によれば、エコーキャンセル装置は提供され、装置は、
近端信号内に発話信号が存在するかどうかを検出するように構成された第1の検出モジュールと、
NLMS適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得するように構成された第1の計算モジュールと、
第1の検出モジュールの検出結果が近端信号内に発話信号が存在するということであるとき、第1の計算モジュールによって取得された残差信号が予め設定された出力条件を満たすかどうかを検出するように構成された第2の検出モジュールと、
第2の検出モジュールの検出結果が残差信号が予め設定された出力条件を満たさないということであるとき、残差信号に第1の減衰係数を掛けて出力信号を取得するように構成された第1の出力モジュールとを含む。
本発明の実施形態において提供される技術的な解決策によって、残差信号が予め設定された出力条件を満たすかどうかが検出され、残差信号が予め設定された出力条件を満たさないとき、出力信号を取得するために、残差信号は第1の減衰係数を掛けられ、その結果、残差信号が比較的強いエコー信号をまだ含むことを検出するとき、電子デバイスは、NLMSアルゴリズムを使用することによって遠端信号を推定することにより取得された推定された信号が不正確であるために近端信号から推定された信号を差し引くことによって取得される残差信号が通話品質に影響を与える比較的強いエコー信号をまだ含むという問題を解決するために、減衰をさらに実行した後に残差信号を出力する可能性があり、それによって、通話品質を改善する。
本発明の実施形態の技術的な解決策をより明瞭に説明するために、以下で、実施形態を説明するために必要とされる添付の図面を簡単に紹介する。明らかに、以下の説明における添付の図面は、本発明の一部の実施形態を示すに過ぎず、当業者は、創造的な努力なしにこれらの添付の図面からその他の図面を導き出すことがやはり可能である。
本発明の実施形態によるエコーキャンセル方法の概略的な流れ図である。 本発明の実施形態による別のエコーキャンセル方法の概略的な流れ図である。 本発明の実施形態による近端信号内にエコー信号が存在するかどうかを検出するためのさらに別の方法の概略的な流れ図である。 本発明の実施形態による残差信号が予め設定された出力条件を満たすかどうかを検出するためのさらに別の方法の流れ図である。 本発明の実施形態によるエコーキャンセル装置の概略的な構造図である。 本発明の実施形態による別のエコーキャンセル装置の概略的な構造図である。 本発明の実施形態によるエコーキャンセル装置を含む端末の概略的な構造図である。
本明細書において、例示的な実施形態が、詳細に説明され、例示的な実施形態の例が、添付の図面に示される。以下の説明が添付の図面に関連するとき、そうでないことが明記されない限り、異なる添付の図面内の同じ番号は、同じまたは同様の要素を表す。以下の例示的な実施形態において説明される実装は、本開示に合致するすべての実装を表すわけではない。反対に、以下の実装は、本開示のいくつかの態様に一致し、添付の請求項に詳細に記載される装置および方法の例であるに過ぎない。以下で説明される好ましい実施形態は、単に本開示を示し、説明するために使用され、本開示を限定するために使用されないことを理解されたい。
図1を参照すると、図1は、本発明の実施形態において提供されるエコーキャンセル方法の流れ図である。この実施形態においては、エコーキャンセル方法が電子デバイスに適用されることが、説明のための例として使用される。電子デバイスは、音声による会話のために使用され得るデバイスである可能性がある。エコーキャンセル方法は、以下のステップを含む可能性があるがそれらに限定されない。
ステップ101: 近端信号内に発話信号が存在するかどうかを検出する。
ステップ102: NLMSアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得する。
ステップ101はステップ102の前に実行される可能性があり、またはステップ102の後に実行される可能性があり、またはステップ101およびステップ102は同時に実行される可能性があることに留意されたい。これは、この実施形態において限定されない。
ステップ103: 検出結果が近端信号内に発話信号が存在するということであるとき、残差信号が予め設定された出力条件を満たすかどうかを検出する。
ステップ104: 残差信号が予め設定された出力条件を満たさないとき、残差信号に第1の減衰係数を掛けて出力信号を取得する。
結論として、本発明のこの実施形態において提供されるエコーキャンセル方法によれば、残差信号が予め設定された出力条件を満たすかどうかが検出され、残差信号が予め設定された出力条件を満たさないとき、出力信号を取得するために、残差信号は第1の減衰係数を掛けられ、その結果、残差信号が比較的強いエコー信号をまだ含むことを検出するとき、電子デバイスは、NLMSアルゴリズムを使用することによって遠端信号を推定することにより取得された推定された信号が不正確であるために近端信号から推定された信号を差し引くことによって取得される残差信号が通話品質に影響を与える比較的強いエコー信号をまだ含むという問題を解決するために、減衰をさらに実行した後に残差信号を出力する可能性があり、それによって、通話品質を改善する。
図2Aを参照すると、図2Aは、本発明の実施形態において提供されるエコーキャンセル方法の流れ図である。この実施形態においては、エコーキャンセル方法が電子デバイスに適用されることが、説明のための例として使用される。エコーキャンセル方法は、以下のステップを含む可能性があるがそれらに限定されない。
ステップ201: 近端信号内にエコー信号が存在するかどうかを検出する。
この実施形態においては、近端信号内にエコー信号が存在するかどうかが前もって検出され、近端信号内にエコー信号が存在しないときは電子デバイスがNLMSアルゴリズムに従って遠端信号を引き続き推定し、NLMSアルゴリズムの複雑性が極めて高いためにプロセッサリソースの無駄が引き起こされるという問題を解決するために、エコー信号が存在するときはエコーキャンセルがその後実行され、それによって、プロセッサリソースの消費を減らす。
遠端信号は、ピアエンド(peer end)電子デバイスによって送信され、ローカルエンド(local end)によって受信される発話信号であり、エコー信号は、再生された発話信号を集めることによってローカルエンド電子デバイスによって取得される。したがって、遠端信号は、エコー信号に近似する。近端信号内にエコー信号が存在する場合、近端信号と遠端信号との間の相関が極めて高く、近端信号と遠端信号との間の一致の度合いが極めて高い。したがって、この実施形態においては、近端信号と遠端信号との間の相関および一致の度合いに従って近端信号内にエコー信号が存在するかどうかを検出するための方法が、提供される。図2Bに示されるように、検出方法は、少なくとも以下のステップを含む。
ステップ201A: 遠端信号の第1のエネルギー値E1および近端信号の第2のエネルギー値E2を計算する。
電子デバイスは、次のエネルギー値計算式に従って遠端信号および近端信号のエネルギー値を別々に計算する。
Figure 2019504537
Eは、エネルギー値を表し、x(k)は、n個の時点のうちの第kの時点における長さnの信号の信号振幅値を表す。
ステップ201B: 第1のエネルギー値E1を第2のエネルギー値E2で割ってERLを得る。
ステップ201C: 遠端信号と近端信号との間の第3の相関係数R3を計算し、第3の相関係数R3は、遠端信号と近端信号との間の相関を表すために使用される。
電子デバイスは、次の相関係数計算式に従って遠端信号と近端信号との間の相関係数を計算する。
Figure 2019504537
Rは、信号x(k)と信号y(k)との間の相関係数を表し、x(k)およびy(k)は、それぞれ、n個の時点のうちの第kの時点における長さnの信号の信号振幅値を表し、Exは、信号x(k)のエネルギー値を表し、Eyは、信号y(k)のエネルギー値を表す。
ステップ201Aおよびステップ201Bは、ステップ201Cの前に実行される可能性があり、またはステップ201Cの後に実行される可能性があることに留意されたい。これは、この実施形態において限定されない。
ステップ201D: 第3の相関係数R3が第3の閾値未満であるかどうか、およびERLが第4の閾値よりも大きいかどうかを判定する。
この実施形態においては、近端信号内にエコー信号が存在するかどうかが2つの見地、すなわち、相関および一致の度合いに従って判定され、それによって、判定の正確さを高める。
実際の実施中に、第3の相関係数R3およびERLは、決定関数に入力される可能性がある。決定関数によって、第3の相関係数R3が、第3の閾値と比較され、ERLが、第4の閾値と比較される。
たとえば、第3の相関係数R3およびERLは、決定関数fun(a,b;R3,ERL)に入力され、ここで、aは、第3の閾値を表し、bは、第4の閾値を表す。
第3の閾値および第4の閾値は、電子デバイスにおいて予め設定される。第3の相関係数R3が第3の閾値未満であり、ERLが第4の閾値よりも大きいとき、ステップ201Eが実行され、第3の相関係数R3が第3の閾値以上であるか、またはERLが第4の閾値以上であるとき、ステップ201Fが実行される。
この実施形態においては、近端信号と遠端信号との間の相関のみが比較によって取得される可能性があり、または近端信号と遠端信号との間の一致の度合いのみが比較によって取得される可能性があることに留意されたい。これは、この実施形態において限定されない。
ステップ201E: 第3の相関係数R3が第3の閾値未満であり、ERLが第4の閾値よりも大きいとき、近端信号内にエコー信号が存在しないと判定し、プロセスを終了する。
第3の相関係数R3が第3の閾値未満である場合、そのことは、近端信号および遠端信号が相関関係にないことを示し、そのことは、近端信号内にエコー信号がないことをさらに示す。
加えて、ERLが第4の閾値よりも大きい場合、そのことは、近端信号が遠端信号と一致しないことを示し、そのことは、近端信号内にエコー信号がないことをさらに示す。
ステップ201F: 第3の相関係数R3が第3の閾値以上であるか、またはERLが第4の閾値以上であるとき、近端信号内にエコー信号が存在すると判定する。
第3の相関係数R3が第3の閾値以上である場合、そのことは、近端信号および遠端信号が相関関係にあることを示し、ERLが第4の閾値以上である場合、そのことは、近端信号が遠端信号と一致することを示す。この場合、近端信号内にエコー信号が存在する。
近端信号内にエコー信号が存在するかどうかを検出するための上述の方法によって、近端信号内にエコー信号が存在しないことが検出されるとき、ステップ202が実行され、近端信号内にエコー信号が存在することが検出されるとき、ステップ203が実行される。
ステップ202: 近端信号内にエコー信号が存在しないとき、近端信号に第2の減衰係数を掛けて出力信号を取得し、プロセスを終了する。
ステップ201において近端信号内にエコー信号が存在するかどうかを検出することが不正確である可能性があるために、近端信号内に極めて小さなエコー信号が実際には存在するときに、検出結果は、近端信号内にエコー信号が存在しないということになる可能性がある。この場合、近端信号がそのまま出力されると、通話品質が引き続き影響を受ける。したがって、近端信号は、第2の減衰係数を掛けられる。第2の減衰係数は0よりも大きく、1未満であるので、近端信号の振幅値が小さくされ得る。そして、電子デバイスは、第2の減衰係数を掛けられた近端信号を出力信号として使用する。
ステップ203: 近端信号内にエコー信号が存在するとき、近端信号内に発話信号が存在するかどうかを検出する。
発話信号は、近端信号内にいつも存在するわけではない可能性がある。たとえば、ローカルエンド電子デバイスに対応するユーザは話さない。近端信号内に発話信号が存在しないときは、送信リソースの消費を減らすために、電子デバイスは、近端信号を出力しなくてよい。この場合、電子デバイスは、近端信号内に発話信号が存在するかどうかをまず判定する可能性がある。
ステップ204: NLMSアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得する。
NLMSアルゴリズムは、反復アルゴリズムである。遠端信号が長さnの配列p(n)であり、近端信号が長さnの配列q(n)であり、推定された信号が長さnの配列r(n)であり、残差信号が長さnの配列e(n)であると仮定すると、NLMSアルゴリズムの特定の式は、以下の通りである。
r(n) = w(n)・p(n)
e(n) = q(n) - r(n)
w(n + 1) = w(n) + e(n)・x(n)
nが0に等しいとき、w(n)は、すべて0であるn個の要素を有するかまたは非常に小さな要素を有する配列として初期化され、w'(n)は、配列w(n)の転置行列である。
ステップ203において、検出結果が近端信号内に発話信号が存在しないということであるとき、残差信号が、次回、NLMSアルゴリズムのための係数として使用され、検出結果が近端信号内に発話信号が存在するということであるとき、ステップ205が実行される。
ステップ203およびステップ204を実行する順序はこの実施形態において限定されないことに留意されたい。
ステップ205: 検出結果が近端信号内に発話信号が存在するということであるとき、残差信号が予め設定された出力条件を満たすかどうかを検出する。
このステップにおいては、まず、NLP処理が、取得された残差信号e(n)に対して実行され得る。NLP処理の式は、以下の通りである。
Figure 2019504537
Pr(n)は、推定された信号の電力スペクトルであり、Pq(n)は、近端信号の電力スペクトルであり、H(n)は、伝達関数を表す。
残差信号は、残差信号内に残っているエコー信号を除去するために上述の伝達関数H(n)を掛けられ、それによって、エコー信号を減らす。説明を容易にするために、下に述べる残差信号は、NLP処理の後に得られたすべての信号である。
電子デバイスが近端信号内に発話信号が存在するかどうかを検出するとき、誤差が存在する。したがって、近端信号内に非常に小さな発話信号が実際には存在するが、電子デバイスの検出結果が近端信号内に発話信号が存在しないということである場合、残差信号は、次回、NLMSアルゴリズムのための係数として使用される。結果として、NLMS波形は収束せず、得られた推定された信号はエコー信号に近似せず、近端信号から推定された信号を差し引くことによってエコー信号が完全にキャンセルされ得ない。あるいは、近端信号内に発話信号が実際には存在しないが、電子デバイスの検出結果が近端信号内に発話信号が存在するということである場合、電子デバイスが発話信号の変化を間に合って発見することができないので、エコー信号が完全にキャンセルされ得ない。この実施形態において、残差信号が出力条件を満たすかどうかが検出される。残差信号が出力条件を満たさないとき、エコー信号をより上手く削減するために、エコー削減処理が実行される。
残差信号内に比較的強いエコー信号が存在する場合、残差信号と遠端信号との間の相関は極めて高く、残差信号と遠端信号との間の相関は、比較的低い。したがって、この実施形態においては、残差信号と遠端信号との間の相関および残差信号と近端信号との間の相関に従って、残差信号が出力条件を満たすかどうかを検出するための方法が提供される。図2Cに示されるように、検出方法は、以下を含む。
ステップ205A: 残差信号と遠端信号との間の第1の相関係数R1を計算し、第1の相関係数R1は、残差信号と遠端信号との間の相関を表すために使用される。
第1の相関係数R1の値が、ステップ201Cの相関係数の計算式に従って計算される。
ステップ205B: 残差信号と近端信号との間の第2の相関係数R2を計算し、第2の相関係数R2は、残差信号と近端信号との間の相関を表すために使用される。
第2の相関係数R2の値が、ステップ201Cの相関係数の計算式に従って計算される。
ステップ205Aは、ステップ205Bの前に実行される可能性があり、またはステップ205Bの後に実行される可能性があることに留意されたい。これは、この実施形態において限定されない。
ステップ205C: 第1の相関係数R1が第1の閾値未満であるかどうか、および第2の相関係数R2が第2の閾値よりも大きいかどうかを判定する。
この実施形態においては、残差信号が予め設定された出力条件を満たすかどうかが2つの見地、すなわち、残差信号と遠端信号との間の相関および残差信号と近端信号との間の相関に従って判定され、それによって、判定の正確さを高める。
実際の実施中に、第1の相関係数R1および第2の相関係数R2の値は、決定関数に入力される可能性がある。決定関数によって、第1の相関係数R1が、第1の閾値と比較され、第2の相関係数R2が、第2の閾値と比較される。
たとえば、第1の相関係数R1および第2の相関係数R2は、決定関数fun(c,d;R1,R2)に入力され、cは、第1の閾値を表し、dは、第2の閾値を表す。
第1の閾値および第2の閾値は、電子デバイスにおいて予め設定される。第1の相関係数R1が第1の閾値未満であり、第2の相関係数R2が第2の閾値よりも大きいとき、ステップ205Dが実行され、第1の相関係数R1が第1の閾値以上であるか、または第2の相関係数R2が第2の閾値以下であるとき、ステップ205Eが実行される。
この実施形態においては、残差信号と遠端信号との間の相関のみが比較によって取得される可能性があり、または残差信号と近端信号との間の相関のみが比較によって取得される可能性があることに留意されたい。これは、この実施形態において限定されない。
ステップ205D: 第1の相関係数R1が第1の閾値未満であり、第2の相関係数R2が第2の閾値よりも大きいとき、残差信号が予め設定された出力条件を満たすと判定する。
第1の相関係数R1が第1の閾値未満であり、第2の相関係数R2が第2の閾値よりも大きいとき、そのことは残差信号が弱いエコー信号を含むことを示し、残差信号が出力され得る。
ステップ205E: 第1の相関係数R1が第1の閾値以上であるか、または第2の相関係数R2が第2の閾値以下であるとき、残差信号が予め設定された出力条件を満たさないと判定する。
第1の相関係数R1が第1の閾値以上であるか、または第2の相関係数R2が第2の閾値以下であるとき、そのことは残差信号が強いエコー信号を含むことを示し、残差信号はさらに処理される必要がある。
残差信号が出力条件を満たすかどうかを検出するための上述の方法を使用することによって残差信号が予め設定された出力条件を満たさないことが検出されるとき、ステップ206が実行され、上述の方法を使用することによって残差信号が予め設定された出力条件を満たすことが検出されるとき、ステップ207が実行される。
ステップ206: 残差信号が予め設定された出力条件を満たさないとき、残差信号に第1の減衰係数を掛けて出力信号を取得し、プロセスを終了する。
この実施形態において、予め設定された出力条件を満たさない残差信号は、第1の減衰係数を掛けられる。第1の減衰係数は0よりも大きく、1未満であるので、残差信号の振幅値が小さくされる可能性があり、それによって、通話品質を改善する。
ステップ207: 残差信号が予め設定された出力条件を満たすとき、残差信号を出力信号として使用する。
この実施形態において、ステップ201からステップ204は電子デバイスにおいて独立した実施形態として実装される可能性があり、ステップ203からステップ206は電子デバイスにおいて別の独立した実施形態として実装される可能性があることに留意されたい。
結論として、本発明のこの実施形態において提供されるエコーキャンセル方法によれば、残差信号が予め設定された出力条件を満たすかどうかが検出され、残差信号が予め設定された出力条件を満たさないとき、出力信号を取得するために、残差信号は第1の減衰係数を掛けられ、その結果、残差信号が比較的強いエコー信号をまだ含むことを検出するとき、電子デバイスは、NLMSアルゴリズムを使用することによって遠端信号を推定することにより取得された推定された信号が不正確であるために近端信号から推定された信号を差し引くことによって取得される残差信号が通話品質に影響を与える比較的強いエコー信号をまだ含むという問題を解決するために、減衰をさらに実行した後に残差信号を出力する可能性があり、それによって、通話品質を改善する。
加えて、近端信号内にエコー信号が存在するかどうかが検出され、近端信号内にエコー信号が存在しないとき、出力信号を取得するために、近端信号は第2の減衰係数を掛けられ、その結果、電子デバイスは、近端信号内にエコー信号が存在しないときは電子デバイスがNLMSアルゴリズムに従って遠端信号を引き続き推定し、NLMSアルゴリズムの複雑性が極めて高いためにプロセッサリソースの無駄が引き起こされるという問題を解決するために、通話プロセス中にずっとNLMSアルゴリズムに従って遠端信号を推定する必要がなく、それによって、プロセッサリソースの消費を減らす。
図3を参照すると、図3は、本発明の実施形態において提供されるエコーキャンセル装置のブロック図である。この実施形態においては、エコーキャンセル装置が電子デバイスに適用されることが、説明のための例として使用される。エコーキャンセル装置は、以下のモジュール、すなわち、
近端信号内に発話信号が存在するかどうかを検出するように構成された第1の検出モジュール310と、
NLMS適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得するように構成された第1の計算モジュール320と、
第1の検出モジュール310の検出結果が近端信号内に発話信号が存在するということであるとき、第1の計算モジュール320によって取得された残差信号が予め設定された出力条件を満たすかどうかを検出するように構成された第2の検出モジュール330と、
第2の検出モジュール330の検出結果が残差信号が予め設定された出力条件を満たさないということであるとき、残差信号に第1の減衰係数を掛けて出力信号を取得するように構成された第1の出力モジュール340とを含む可能性があるがそれらに限定されない。
結論として、本発明のこの実施形態において提供されるエコーキャンセル装置によれば、残差信号が予め設定された出力条件を満たすかどうかが検出され、残差信号が予め設定された出力条件を満たさないとき、出力信号を取得するために、残差信号は第1の減衰係数を掛けられ、その結果、残差信号が比較的強いエコー信号をまだ含むことを検出するとき、電子デバイスは、NLMSアルゴリズムを使用することによって遠端信号を推定することにより取得された推定された信号が不正確であるために近端信号から推定された信号を差し引くことによって取得される残差信号が通話品質に影響を与える比較的強いエコー信号をまだ含むという問題を解決するために、減衰をさらに実行した後に残差信号を出力する可能性があり、それによって、通話品質を改善する。
図4を参照すると、図4は、本発明の実施形態において提供されるエコーキャンセル装置のブロック図である。この実施形態においては、エコーキャンセル装置が電子デバイスに適用されることが、説明のための例として使用される。エコーキャンセル装置は、以下のモジュール、すなわち、
近端信号内に発話信号が存在するかどうかを検出するように構成された第1の検出モジュール410と、
NLMS適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、近端信号から推定された信号を差し引いて残差信号を取得するように構成された第1の計算モジュール420と、
第1の検出モジュール410の検出結果が近端信号内に発話信号が存在するということであるとき、第1の計算モジュール420によって取得された残差信号が予め設定された出力条件を満たすかどうかを検出するように構成された第2の検出モジュール430と、
第2の検出モジュール430の検出結果が残差信号が予め設定された出力条件を満たさないということであるとき、残差信号に第1の減衰係数を掛けて出力信号を取得するように構成された第1の出力モジュール440とを含む可能性があるがそれらに限定されない。
任意で、第2の検出モジュール430は、
残差信号と遠端信号との間の第1の相関係数R1を計算するように構成された第1の計算ユニット431であって、第1の相関係数R1が、残差信号と遠端信号との間の相関を表すために使用される、第1の計算ユニット431と、
残差信号と近端信号との間の第2の相関係数R2を計算するように構成された第2の計算ユニット432であって、第2の相関係数R2が、残差信号と近端信号との間の相関を表すために使用される、第2の計算ユニット432と、
第1の計算ユニット431によって計算された第1の相関係数R1が第1の閾値未満であるかどうか、および第2の計算ユニット432によって計算された第2の相関係数R2が第2の閾値よりも大きいかどうかを判定するように構成された第1の判断ユニット433と、
第1の判断ユニット433の判定結果が、第1の相関係数R1が第1の閾値未満であり、第2の相関係数R2が第2の閾値よりも大きいということであるとき、残差信号が予め設定された出力条件を満たすと判定するように構成された第1の判定ユニット434と、
第1の判断ユニット433の判定結果が、第1の相関係数R1が第1の閾値以上であるか、または第2の相関係数R2が第2の閾値以下であるということであるとき、残差信号が予め設定された出力条件を満たさないと判定するように構成された第2の判定ユニット435とを含む。
任意で、装置は、
第2の検出モジュール430の検出結果が残差信号が予め設定された出力条件を満たすということであるとき、残差信号を出力信号として使用するように構成された第2の出力モジュール450をさらに含む。
任意で、装置は、
近端信号内にエコー信号が存在するかどうかを検出するように構成された第3の検出モジュール460であって、
第1の検出モジュール410が、第3の検出モジュール460の検出結果が近端信号内にエコー信号が存在するということであるとき、近端信号内に発話信号が存在するかどうかを検出するステップを実行するようにさらに構成される、第3の検出モジュール460と、
第3の検出モジュール460の検出結果が近端信号内にエコー信号が存在しないということであるとき、近端信号に第2の減衰係数を掛けて出力信号を取得するように構成された第3の出力モジュール470とをさらに含む。
任意で、第3の検出モジュール460は、
遠端信号の第1のエネルギー値E1および近端信号の第2のエネルギー値E2を計算するように構成された第3の計算ユニット461と、
第3の計算ユニット461によって計算された第1のエネルギー値E1を第2のエネルギー値E2で割ってエコーリターンロス(ERL: echo return loss)を取得するように構成された第4の計算ユニット462と、
遠端信号と近端信号との間の第3の相関係数R3を計算するように構成された第5の計算ユニット463であって、第3の相関係数R3が、遠端信号と近端信号との間の相関を表すために使用される、第5の計算ユニット463と、
第5の計算ユニット463によって計算された第3の相関係数R3が第3の閾値未満であるかどうか、および第4の計算ユニット462によって計算されたERLが第4の閾値よりも大きいかどうかを判定するように構成された第2の判断ユニット464と、
第2の判断ユニット464の判定結果が、第3の相関係数R3が第3の閾値未満であり、ERLが第4の閾値よりも大きいということであるとき、近端信号内にエコー信号が存在しないと判定するように構成された第3の判定ユニット465と、
第2の判断ユニット464の判定結果が、第3の相関係数R3が第3の閾値以上であるか、またはERLが第4の閾値以上であるとき、近端信号内にエコー信号が存在すると判定するように構成された第4の判定ユニット466とを含む。
結論として、本発明のこの実施形態において提供されるエコーキャンセル装置によれば、残差信号が予め設定された出力条件を満たすかどうかが検出され、残差信号が予め設定された出力条件を満たさないとき、出力信号を取得するために、残差信号は第1の減衰係数を掛けられ、その結果、残差信号が比較的強いエコー信号をまだ含むことを検出するとき、電子デバイスは、NLMSアルゴリズムを使用することによって遠端信号を推定することにより取得された推定された信号が不正確であるために近端信号から推定された信号を差し引くことによって取得される残差信号が通話品質に影響を与える比較的強いエコー信号をまだ含むという問題を解決するために、減衰をさらに実行した後に残差信号を出力する可能性があり、それによって、通話品質を改善する。
加えて、近端信号内にエコー信号が存在するかどうかが検出され、近端信号内にエコー信号が存在しないとき、出力信号を取得するために、近端信号は第2の減衰係数を掛けられ、その結果、電子デバイスは、近端信号内にエコー信号が存在しないときは電子デバイスがNLMSアルゴリズムに従って遠端信号を引き続き推定し、NLMSアルゴリズムの複雑性が極めて高いためにプロセッサリソースの無駄が引き起こされるという問題を解決するために、通話プロセス中にずっとNLMSアルゴリズムに従って遠端信号を推定する必要がなく、それによって、プロセッサリソースの消費を減らす。
上述の機能モジュールの分割は、上述の実施形態において提供されるエコーキャンセル装置がエコーをキャンセルするときの例示的な目的で説明されているに過ぎないことに留意されたい。実際の応用において、上述の機能は、要件に応じて異なる機能モジュールによって果たされるように割り当てられる可能性があり、つまり、装置の内部構造は、上述の機能のすべてのまたは一部の機能を果たすように異なる機能モジュールに分割される。加えて、上述の実施形態において提供されるエコーキャンセル装置の発明の概念は、エコーキャンセル方法の実施形態の発明の概念と同じである。特定の実施プロセスに関しては、詳細に関して方法の実施形態を参照するものとし、詳細は本明細書において再び説明されない。
図5は、上述の技術的な解決策のいずれか1つによるエコーキャンセル装置を含む通信端末の概略的な構造図である。本発明のこの実施形態の端末500は、以下の1つまたは複数の構成要素、すなわち、様々なプロセスおよび方法を完了するためのコンピュータプログラム命令を実行するように構成されたプロセッサと、情報およびプログラム命令を記憶するように構成されるランダムアクセスメモリ(RAM)および読み出し専用メモリ(ROM)と、データおよび情報を記憶するように構成されたメモリと、I/Oデバイス、インターフェース、アンテナなどを含み得る。特に、
端末500は、無線周波数(RF)回路510、メモリ520、入力ユニット530、ディスプレイユニット540、センサー550、オーディオ回路560、ワイヤレスフィデリティ(WiFi: wireless fidelity)モジュール570、プロセッサ580、電源582、およびカメラ590などの構成要素を含み得る。当業者は、図5に示される端末の構造が端末に対する限定を定めず、端末が図に示される構成要素より多くの構成要素もしくはより少ない構成要素を含む可能性があり、または一部の構成要素が組み合わされる可能性があり、または異なる構成要素の配置が使用される可能性があることを理解するであろう。
以下で、図5を参照して端末500の構成要素を特に紹介する。
RF回路510は、情報の受信および送信プロセスまたは通話プロセス中に信号を受信および送信するように構成され得る。特に、RF回路は、基地局からダウンリンク情報を受信し、それから、処理するためにプロセッサ580にダウンリンク情報を配信し、基地局に関連するアップリンクデータを送信する。概して、RF回路は、アンテナ、少なくとも1つの増幅器、トランシーバ、カプラ、低雑音増幅器(LNA)、デュプレクサなどを含むがそれらに限定されない。加えて、RF回路510は、ワイヤレス通信によってネットワークおよび別のデバイスと通信する可能性もある。ワイヤレス通信は、移動体通信用グローバルシステム(GSM(登録商標): Global System for Mobile Communications)、汎用パケット無線サービス(GPRS: General Packet Radio Service)、符号分割多元接続(CDMA)、広帯域符号分割多元接続(WCDMA(登録商標))、ロングタームエボリューション(LTE)、電子メール、ショートメッセージングサービス(SMS)などを含むがそれらに限定されない任意の通信規格またはプロトコルを使用する可能性がある。
メモリ520は、ソフトウェアプログラムおよびモジュールを記憶するように構成される可能性があり、プロセッサ580は、端末500の様々な機能のアプリケーションおよびデータ処理を実行するために、メモリ520に記憶されるソフトウェアプログラムおよびモジュールを実行する。メモリ520は、主に、プログラムストレージエリアおよびデータストレージエリアを含み得る。プログラムストレージエリアは、オペレーティングシステム、(音声再生機能および画像表示機能などの)少なくとも1つの機能によって必要とされるアプリケーションプログラムなどを記憶する可能性がある。データストレージエリアは、端末500の使用によって生成された(オーディオデータおよびアドレス帳などの)データなどを記憶する可能性がある。加えて、メモリ520は、高速なランダムアクセスメモリを含む可能性があり、少なくとも1つの磁気ディスクストレージデバイスなどの不揮発性メモリ、フラッシュメモリ、または別の揮発性ソリッドステートストレージデバイスも含む可能性がある。
入力ユニット530は、入力された数字または文字情報を受信し、端末500のユーザ設定および機能の制御に関連するキー信号入力を生成するように構成され得る。特に、入力ユニット530は、タッチパネル531および別の入力デバイス532を含み得る。タッチパネル531は、タッチスクリーンとも呼ばれる可能性があり、(指またはタッチペンなどの任意の好適な物体または付属品を使用することによるタッチパネル531の上または近くのユーザの操作などの)タッチパネルの上または近くのユーザのタッチ操作を収集し、予め設定されたプログラムに従って対応する接続装置を駆動する可能性がある。任意で、タッチパネル531は、2つの部分、すなわち、タッチ検出装置およびタッチコントローラを含み得る。タッチ検出装置は、ユーザのタッチ位置を検出し、タッチ操作によって生成された信号を検出し、タッチコントローラに信号を転送する。タッチコントローラは、タッチ検出装置からタッチ情報を受信し、タッチ情報をタッチ点の座標に変換し、タッチ点の座標をプロセッサ580に送信する。さらに、タッチコントローラは、プロセッサ580から送信されたコマンドを受信し、実行することができる。加えて、タッチパネル531は、抵抗式、静電容量式、赤外線式、または表面音波式である可能性がある。タッチパネル531に加えて、入力ユニット530は、別の入力デバイス532をさらに含み得る。特に、別の入力デバイス532は、物理的なキーボード、(音量制御キーまたはスイッチキーなどの)機能キー、トラックボール、マウス、およびジョイスティックのうちの1つまたは複数を含み得るがそれらに限定されない。
ディスプレイユニット540は、ユーザによって入力された情報またはユーザのために与えられた情報および端末500の様々なメニューを表示するように構成され得る。ディスプレイユニット540は、ディスプレイパネル541を含み得る。任意で、ディスプレイパネル541は、液晶ディスプレイ(LCD)、有機発光ダイオード(OLED)などを使用することによって構成される可能性がある。さらに、タッチパネル531が、ディスプレイパネル541を覆う可能性がある。タッチパネル531の上または近くのタッチ操作を検出した後、タッチパネル531は、タッチイベントの種類を判定するためにタッチ操作をプロセッサ580に転送する。そのとき、プロセッサ580は、タッチイベントの種類に応じてディスプレイパネル541上の対応する視覚的な出力を提供する。図5においては、タッチパネル531およびディスプレイパネル541が端末500の入力および出力機能を実装するための2つの別々の部分として使用されるが、一部の実施形態において、タッチパネル531およびディスプレイパネル541は、端末500の入力および出力機能を実装するために統合される可能性がある。
端末500は、ジャイロスコープセンサー、磁気誘導センサー、光センサー、モーションセンサー、および別のセンサーなどの少なくとも1つのセンサー550をさらに含み得る。特に、光センサーは、環境光センサーおよび近接センサーを含み得る。環境光センサーは、環境光の明るさに応じてディスプレイパネル541の輝度を調整し得る。近接センサーは、端末500が耳まで動かされるときにディスプレイパネル541および/またはバックライトをオフにし得る。モーションセンサーの一種として、加速度センサーは、様々な方向の(概して、3軸上の)加速度の大きさを検出する可能性があり、静止しているときの重力の大きさおよび方向を検出する可能性があり、端末の姿勢を認識するアプリケーション(たとえば、景色の向きと顔画像(portrait)の向きとの切り替え、関連するゲーム、および磁力計の姿勢の較正)、(万歩計(登録商標)およびノックなどの)振動認識に関連する機能などに応用される可能性がある。端末500内で構成され得る気圧計、湿度計、温度計、および赤外線センサーなどのその他のセンサーは、本明細書においてさらに説明されない。
オーディオ回路560、スピーカ561、およびマイクロフォン562は、ユーザと端末500との間のオーディオインターフェースを提供し得る。オーディオ回路560は、受信されたオーディオデータを電気信号に変換し、電気信号をスピーカ561に送信し得る。スピーカ561は、電気信号を出力のための音声信号に変換する。一方、マイクロフォン562は、集められた音声信号を電気信号に変換する。オーディオ回路560は、電気信号を受信し、電気信号をオーディオデータに変換し、オーディオデータを処理するためにプロセッサ580に出力する。そのとき、プロセッサ580は、たとえば、RF回路510を使用することによって別の端末にオーディオデータを送信するか、またはオーディオデータをさらに処理するためにメモリ520に出力する。
WiFiは、近距離ワイヤレス送信テクノロジーに基づく。端末500は、WiFiモジュール570を使用することによって、ユーザが電子メールを受信および送信すること、ウェブページを閲覧すること、ストリーミングメディアにアクセスすることなどを助ける可能性があり、ユーザのためにワイヤレスブロードバンドインターネットアクセスを提供する。図5はWiFi回路570を示すが、WiFi回路570は端末500の必須の構成要素ではなく、要求されるとき、WiFi回路570は本開示の本質の範囲が変えられない限り省略される可能性があることが理解され得る。
プロセッサ580は、端末500の制御の中心であり、様々なインターフェースおよび線を使用することによって端末全体の様々な部分に接続される。メモリ520に記憶されたソフトウェアプログラムおよび/またはモジュールを走らせるかまたは実行し、メモリ520に記憶されたデータを呼び出すことによって、プロセッサ580は、端末500の様々な機能およびデータ処理を実行し、それによって、端末に対する全体の監視を実行する。任意で、プロセッサ580は、1つまたは複数の処理ユニットを含み得る。好ましくは、プロセッサ580は、アプリケーションプロセッサおよびモデムプロセッサを組み込む可能性がある。アプリケーションプロセッサは、主として、オペレーティングシステム、ユーザインターフェース、アプリケーションプログラムなどを処理する。モデムプロセッサは、主として、ワイヤレス通信を処理する。上述のモデムプロセッサはプロセッサ580に組み込まれない可能性があることが理解されるであろう。
端末500は、構成要素に電力を供給するための(バッテリーなどの)電源582をさらに含む。好ましくは、電源は、電源管理システムを使用することによってプロセッサ580に論理的に接続され、それによって、電源管理システムを使用することによって充電、放電、および電力消費管理などの機能を実施し得る。
概して、カメラ590は、レンズ、イメージセンサー、インターフェース、デジタル信号プロセッサ、CPU、ディスプレイスクリーンなどによって形成される。そのとき、レンズはイメージセンサーの上に固定され、レンズを手動で調整することによって焦点が変更される可能性がある。イメージセンサーは、通常のカメラの「フィルム」と同等であり、カメラが画像を収集するための核である。インターフェースは、収集された画像をメモリ520に送信するために、フラットケーブル、基板対基板コネクタ、およびスプリングを使用することによってカメラを端末のメインボードに接続するように構成される。デジタル信号プロセッサは、収集されたアナログ画像をデジタル画像に変換し、インターフェースによってデジタル画像をメモリ520に送信するために、収集された画像を数学演算によって処理する。
図に示されていないが、端末500は、本明細書においてさらに説明されないBluetooth(登録商標)モジュールなどをさらに含み得る。
当業者は、上述の実施形態のステップのすべてまたは一部が、ハードウェアを使用することによって実装される可能性があり、または関連するハードウェアに命令するプログラムによって実装される可能性があることを理解するであろう。プログラムは、コンピュータ可読ストレージ媒体に記憶され得る。ストレージ媒体は、読み出し専用メモリ、磁気ディスク、光ディスクなどである可能性がある。
たとえば、本発明のこの実施形態は、コンピュータストレージ媒体をさらに提供する。コンピュータが実行可能な命令が、コンピュータストレージ媒体に記憶され、コンピュータが実行可能な命令は、上述のエコーキャンセル方法のうちの1つまたは複数、たとえば、図1、図2A、図2B、および図2Cに示された方法のうちの1つまたは複数を実行するために使用される。コンピュータストレージ媒体は、ランダムアクセスストレージ媒体RAM、読み出し専用ストレージ媒体ROM、もしくはフラッシュメモリである可能性があり、または任意で非一時的ストレージ媒体である可能性がある。
別の実施形態において、エコーキャンセル装置は、プロセッサおよびストレージ媒体を含み得る。プロセッサおよびストレージ媒体は、内部バスなどの通信インターフェースによって接続される。プロセッサは、ストレージ媒体に記憶されたコードを読むことによって上述の1つまたは複数のエコーキャンセル方法の動作を実行し得る。
上述の実施形態は、本発明の好ましい実施形態であるに過ぎず、本開示を限定するためのものではない。本開示の精神および規定の中で、本開示の原理に従ってなされるすべての修正は本開示の保護範囲内に入ることを理解されたい。
310 第1の検出モジュール
320 第1の計算モジュール
330 第2の検出モジュール
340 第1の出力モジュール
410 第1の検出モジュール
420 第1の計算モジュール
430 第2の検出モジュール
431 第1の計算ユニット
432 第2の計算ユニット
433 第1の判断ユニット
434 第1の判定ユニット
435 第2の判定ユニット
440 第1の出力モジュール
450 第2の出力モジュール
460 第3の検出モジュール
461 第3の計算ユニット
462 第4の計算ユニット
463 第5の計算ユニット
464 第2の判断ユニット
465 第3の判定ユニット
466 第4の判定ユニット
470 第3の出力モジュール
500 端末
510 無線周波数(RF)回路
520 メモリ
530 入力ユニット
531 タッチパネル
532 別の入力デバイス
540 ディスプレイユニット
541 ディスプレイパネル
550 センサー
560 オーディオ回路
561 スピーカ
562 マイクロフォン
570 ワイヤレスフィデリティ(WiFi)モジュール
580 プロセッサ
582 電源
590 カメラ

Claims (11)

  1. エコーキャンセル方法であって、
    近端信号内に発話信号が存在するかどうかを検出するステップと、
    正規化最小2乗平均(NLMS)適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、前記近端信号から前記推定された信号を差し引いて残差信号を取得するステップと、
    検出結果が前記近端信号内に前記発話信号が存在するということであるとき、前記残差信号が予め設定された出力条件を満たすかどうかを検出するステップと、
    前記残差信号が前記予め設定された出力条件を満たさないとき、前記残差信号に第1の減衰係数を掛けて出力信号を取得するステップとを含む、方法。
  2. 前記残差信号が予め設定された出力条件を満たすかどうかを検出する前記ステップが、
    前記残差信号と前記遠端信号との間の第1の相関係数R1を計算することであって、前記第1の相関係数R1が、前記残差信号と前記遠端信号との間の相関を表すために使用される、計算することと、
    前記残差信号と前記近端信号との間の第2の相関係数R2を計算することであって、前記第2の相関係数R2が、前記残差信号と前記近端信号との間の相関を表すために使用される、計算することと、
    前記第1の相関係数R1が第1の閾値未満であるかどうか、および前記第2の相関係数R2が第2の閾値よりも大きいかどうかを判定することと、
    前記第1の相関係数R1が前記第1の閾値未満であり、前記第2の相関係数R2が前記第2の閾値よりも大きいとき、前記残差信号が前記予め設定された出力条件を満たすと判定することと、
    前記第1の相関係数R1が前記第1の閾値以上であるか、または前記第2の相関係数R2が前記第2の閾値以下であるとき、前記残差信号が前記予め設定された出力条件を満たさないと判定することとを含む請求項1に記載の方法。
  3. 前記残差信号が前記予め設定された出力条件を満たすとき、前記残差信号を出力信号として使用するステップをさらに含む請求項1に記載の方法。
  4. 近端信号内に発話信号が存在するかどうかを検出する前記ステップの前に、
    前記近端信号内にエコー信号が存在するかどうかを検出するステップと、
    前記近端信号内に前記エコー信号が存在するとき、前記近端信号内に発話信号が存在するかどうかを検出する前記ステップを実行することをトリガするステップと、
    前記近端信号内にエコー信号が存在しないとき、前記近端信号に第2の減衰係数を掛けて出力信号を取得するステップとをさらに含む請求項1から3のいずれか一項に記載の方法。
  5. 前記近端信号内にエコー信号が存在するかどうかを検出する前記ステップが、
    前記遠端信号の第1のエネルギー値E1および前記近端信号の第2のエネルギー値E2を計算することと、
    前記第1のエネルギー値E1を前記第2のエネルギー値E2で割ってエコーリターンロス(ERL)を取得すること、および前記遠端信号と前記近端信号との間の第3の相関係数R3を計算することであって、前記第3の相関係数R3が、前記遠端信号と前記近端信号との間の相関を表すために使用される、計算することと、
    前記第3の相関係数R3が第3の閾値未満であるかどうか、および前記ERLが第4の閾値よりも大きいかどうかを判定することと、
    前記第3の相関係数R3が前記第3の閾値未満であり、前記ERLが前記第4の閾値よりも大きいとき、前記近端信号内にエコー信号が存在しないと判定することと、
    前記第3の相関係数R3が前記第3の閾値以上であるか、または前記ERLが前記第4の閾値以上であるとき、前記近端信号内に前記エコー信号が存在すると判定することとを含む請求項4に記載の方法。
  6. エコーキャンセル装置であって、
    近端信号内に発話信号が存在するかどうかを検出するように構成された第1の検出モジュールと、
    NLMS適応フィルタリングアルゴリズムに従って遠端信号を処理して推定された信号を取得し、前記近端信号から前記推定された信号を差し引いて残差信号を取得するように構成された第1の計算モジュールと、
    前記第1の検出モジュールの検出結果が前記近端信号内に前記発話信号が存在するということであるとき、前記第1の計算モジュールによって取得された前記残差信号が予め設定された出力条件を満たすかどうかを検出するように構成された第2の検出モジュールと、
    前記第2の検出モジュールの検出結果が前記残差信号が前記予め設定された出力条件を満たさないということであるとき、前記残差信号に第1の減衰係数を掛けて出力信号を取得するように構成された第1の出力モジュールとを含む、装置。
  7. 前記第2の検出モジュールが、
    前記残差信号と前記遠端信号との間の第1の相関係数R1を計算するように構成された第1の計算ユニットであって、前記第1の相関係数R1が、前記残差信号と前記遠端信号との間の相関を表すために使用される、第1の計算ユニットと、
    前記残差信号と前記近端信号との間の第2の相関係数R2を計算するように構成された第2の計算ユニットであって、前記第2の相関係数R2が、前記残差信号と前記近端信号との間の相関を表すために使用される、第2の計算ユニットと、
    前記第1の計算ユニットによって計算された前記第1の相関係数R1が第1の閾値未満であるかどうか、および前記第2の計算ユニットによって計算された前記第2の相関係数R2が第2の閾値よりも大きいかどうかを判定するように構成された第1の判断ユニットと、
    前記第1の判断ユニットの判定結果が、前記第1の相関係数R1が前記第1の閾値未満であり、前記第2の相関係数R2が前記第2の閾値よりも大きいということであるとき、前記残差信号が前記予め設定された出力条件を満たすと判定するように構成された第1の判定ユニットと、
    前記第1の判断ユニットの前記判定結果が、前記第1の相関係数R1が前記第1の閾値以上であるか、または前記第2の相関係数R2が前記第2の閾値以下であるということであるとき、前記残差信号が前記予め設定された出力条件を満たさないと判定するように構成された第2の判定ユニットとを含む請求項6に記載の装置。
  8. 前記第2の検出モジュールの前記検出結果が前記残差信号が前記予め設定された出力条件を満たすということであるとき、前記残差信号を出力信号として使用するように構成された第2の出力モジュールをさらに含む請求項6に記載の装置。
  9. 前記近端信号内にエコー信号が存在するかどうかを検出するように構成された第3の検出モジュールであって、
    前記第1の検出モジュールが、第3の検出モジュールの検出結果が前記近端信号内に前記エコー信号が存在するということであるとき、前記近端信号内に発話信号が存在するかどうかを検出する前記ステップを実行するようにさらに構成される、第3の検出モジュールと、
    前記第3の検出モジュールの前記検出結果が前記近端信号内にエコー信号が存在しないということであるとき、前記近端信号に第2の減衰係数を掛けて出力信号を取得するように構成された第3の出力モジュールとをさらに含む請求項6から8のいずれか一項に記載の装置。
  10. 前記第3の検出モジュールが、
    前記遠端信号の第1のエネルギー値E1および前記近端信号の第2のエネルギー値E2を計算するように構成された第3の計算ユニットと、
    前記第3の計算ユニットによって計算された前記第1のエネルギー値E1を前記第2のエネルギー値E2で割ってエコーリターンロス(ERL)を取得するように構成された第4の計算ユニットと、
    前記遠端信号と前記近端信号との間の第3の相関係数R3を計算するように構成された第5の計算ユニットであって、前記第3の相関係数R3が、前記遠端信号と前記近端信号との間の相関を表すために使用される、第5の計算ユニットと、
    前記第5の計算ユニットによって計算された前記第3の相関係数R3が第3の閾値未満であるかどうか、および前記第4の計算ユニットによって計算された前記ERLが第4の閾値よりも大きいかどうかを判定するように構成された第2の判断ユニットと、
    前記第2の判断ユニットの判定結果が、前記第3の相関係数R3が前記第3の閾値未満であり、前記ERLが前記第4の閾値よりも大きいということであるとき、前記近端信号内にエコー信号が存在しないと判定するように構成された第3の判定ユニットと、
    前記第2の判断ユニットの前記判定結果が、前記第3の相関係数R3が前記第3の閾値以上であるか、または前記ERLが前記第4の閾値以上であるとき、前記近端信号内に前記エコー信号が存在すると判定するように構成された第4の判定ユニットとを含む請求項9に記載の装置。
  11. コンピュータストレージ媒体であって、コンピュータが実行可能な命令がコンピュータストレージ媒体に記憶され、前記コンピュータが実行可能な命令が請求項1から5のいずれか一項に記載のエコーキャンセル方法を実行するために使用される、コンピュータストレージ媒体。
JP2018528248A 2016-02-22 2016-11-10 エコー除去方法、デバイス、およびコンピュータストレージ媒体 Active JP6671477B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610096504.7A CN105791611B (zh) 2016-02-22 2016-02-22 回声消除方法、装置、终端以及存储介质
CN201610096504.7 2016-02-22
PCT/CN2016/105370 WO2017143805A1 (zh) 2016-02-22 2016-11-10 回声消除方法、装置和计算机存储介质

Publications (2)

Publication Number Publication Date
JP2019504537A true JP2019504537A (ja) 2019-02-14
JP6671477B2 JP6671477B2 (ja) 2020-03-25

Family

ID=56402327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018528248A Active JP6671477B2 (ja) 2016-02-22 2016-11-10 エコー除去方法、デバイス、およびコンピュータストレージ媒体

Country Status (5)

Country Link
US (1) US10264135B2 (ja)
JP (1) JP6671477B2 (ja)
KR (1) KR102056993B1 (ja)
CN (1) CN105791611B (ja)
WO (1) WO2017143805A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791611B (zh) * 2016-02-22 2020-07-07 腾讯科技(深圳)有限公司 回声消除方法、装置、终端以及存储介质
CN106571147B (zh) * 2016-11-13 2021-05-28 南京汉隆科技有限公司 用于网络话机声学回声抑制的方法
CN107040832B (zh) * 2017-04-22 2019-06-11 广州市比丽普电子有限公司 一种基于蓝牙技术的手持终端式麦克风系统
CN107360530B (zh) * 2017-07-03 2020-12-01 苏州科达科技股份有限公司 一种回声消除的测试方法和装置
CN109215672B (zh) * 2017-07-05 2021-11-16 苏州谦问万答吧教育科技有限公司 一种声音信息的处理方法、装置及设备
CN109256145B (zh) * 2017-07-14 2021-11-02 北京搜狗科技发展有限公司 基于终端的音频处理方法、装置、终端和可读存储介质
CN109286730A (zh) * 2017-07-20 2019-01-29 阿里巴巴集团控股有限公司 一种回声检测的方法、装置及系统
CN109524018B (zh) * 2017-09-19 2022-06-10 华为技术有限公司 一种回声处理方法及设备
CN107888792B (zh) 2017-10-19 2019-09-17 浙江大华技术股份有限公司 一种回声消除方法、装置及系统
CN107819964B (zh) * 2017-11-10 2021-04-06 Oppo广东移动通信有限公司 提高通话质量的方法、装置、终端和计算机可读存储介质
CN108831497B (zh) * 2018-05-22 2020-06-09 出门问问信息科技有限公司 一种回声压缩方法及装置、存储介质、电子设备
CN108806713B (zh) * 2018-05-22 2020-06-16 出门问问信息科技有限公司 一种双讲状态检测方法及装置
JP7187183B2 (ja) * 2018-06-14 2022-12-12 株式会社トランストロン エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム
CN109599104B (zh) * 2018-11-20 2022-04-01 北京小米智能科技有限公司 多波束选取方法及装置
CN109994104B (zh) * 2019-01-14 2021-05-14 珠海慧联科技有限公司 一种自适应通话音量控制方法及装置
US10867615B2 (en) * 2019-01-25 2020-12-15 Comcast Cable Communications, Llc Voice recognition with timing information for noise cancellation
CN109862200B (zh) * 2019-02-22 2021-02-12 北京达佳互联信息技术有限公司 语音处理方法、装置、电子设备及存储介质
CN109767780B (zh) 2019-03-14 2021-01-01 苏州科达科技股份有限公司 一种语音信号处理方法、装置、设备及可读存储介质
CN111917926B (zh) * 2019-05-09 2021-08-06 上海触乐信息科技有限公司 一种通信终端中的回声消除方法、装置及终端设备
CN110431624B (zh) * 2019-06-17 2023-04-21 深圳市汇顶科技股份有限公司 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备
CN110246516B (zh) * 2019-07-25 2022-06-17 福建师范大学福清分校 一种语音通信中小空间回声信号的处理方法
CN110971769B (zh) * 2019-11-19 2022-05-03 百度在线网络技术(北京)有限公司 通话信号的处理方法、装置、电子设备及存储介质
CN111091846B (zh) * 2019-12-26 2022-07-26 江亨湖 一种降噪方法及应用该方法的回声消除系统
CN111370015B (zh) * 2020-02-28 2021-03-19 北京字节跳动网络技术有限公司 回声消除方法、装置、电子设备及存储介质
CN112750449B (zh) * 2020-09-14 2024-02-20 腾讯科技(深圳)有限公司 回声消除方法、装置、终端、服务器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1023172A (ja) * 1996-07-08 1998-01-23 Matsushita Electric Ind Co Ltd エコー除去装置
JP2003324370A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Works Ltd エコーキャンセラ
US20110124380A1 (en) * 2009-11-26 2011-05-26 Via Telecom, Inc. Method and system for double-end talk detection, and method and system for echo elimination
JP2012510779A (ja) * 2008-12-02 2012-05-10 クゥアルコム・インコーポレイテッド 音響的に過酷な環境におけるダブルトーク検出のためのシステム及び方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6035034A (en) * 1996-12-20 2000-03-07 Telefonaktiebolaget L M Ericsson (Publ) Double talk and echo path change detection in a telephony system
US6563803B1 (en) * 1997-11-26 2003-05-13 Qualcomm Incorporated Acoustic echo canceller
US20020041678A1 (en) * 2000-08-18 2002-04-11 Filiz Basburg-Ertem Method and apparatus for integrated echo cancellation and noise reduction for fixed subscriber terminals
CN100508031C (zh) * 2005-08-19 2009-07-01 北京信威通信技术股份有限公司 一种在scdma手机中识别并消除远端语音产生的回声的方法
US8275139B2 (en) * 2008-03-26 2012-09-25 Ittiam Systems (P) Ltd. Linear full duplex system and method for acoustic echo cancellation
CN102185991A (zh) * 2011-03-01 2011-09-14 杭州华三通信技术有限公司 回声消除方法、系统和装置
CN103067628B (zh) * 2011-10-20 2015-01-07 联芯科技有限公司 残留回声抑制方法及其装置
US8934622B2 (en) * 2012-10-01 2015-01-13 Via Telecom Co., Ltd. Method for detecting double-talk condition and system using the same
CN105791611B (zh) * 2016-02-22 2020-07-07 腾讯科技(深圳)有限公司 回声消除方法、装置、终端以及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1023172A (ja) * 1996-07-08 1998-01-23 Matsushita Electric Ind Co Ltd エコー除去装置
JP2003324370A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Works Ltd エコーキャンセラ
JP2012510779A (ja) * 2008-12-02 2012-05-10 クゥアルコム・インコーポレイテッド 音響的に過酷な環境におけるダブルトーク検出のためのシステム及び方法
US20110124380A1 (en) * 2009-11-26 2011-05-26 Via Telecom, Inc. Method and system for double-end talk detection, and method and system for echo elimination

Also Published As

Publication number Publication date
CN105791611A (zh) 2016-07-20
KR102056993B1 (ko) 2019-12-17
CN105791611B (zh) 2020-07-07
WO2017143805A1 (zh) 2017-08-31
US10264135B2 (en) 2019-04-16
KR20180077242A (ko) 2018-07-06
US20180255183A1 (en) 2018-09-06
JP6671477B2 (ja) 2020-03-25

Similar Documents

Publication Publication Date Title
JP6671477B2 (ja) エコー除去方法、デバイス、およびコンピュータストレージ媒体
US9280983B2 (en) Acoustic echo cancellation (AEC) for a close-coupled speaker and microphone system
EP3001654B1 (en) Sound effect control method and device
WO2017075979A1 (zh) 语音信号的处理方法及装置
CN107393548B (zh) 多个语音助手设备采集的语音信息的处理方法及装置
CN111524498B (zh) 滤波方法、装置及电子设备
KR102169993B1 (ko) 에코 억제 기법
CN107785027B (zh) 一种音频处理方法及电子设备
CN109739394B (zh) 一种sar值的处理方法、移动终端
WO2019047862A1 (zh) 一种指纹采集方法及终端设备、存储介质
CN111083297A (zh) 一种回声消除方法及电子设备
KR102170341B1 (ko) 에코 억제 기법
CN108492837B (zh) 音频突发白噪声的检测方法、装置及存储介质
CN111182118B (zh) 一种音量调节方法及电子设备
CN106297818B (zh) 一种获取去噪语音信号的方法和装置
CN110764520B (zh) 飞行器控制方法、装置、飞行器和存储介质
CN112822001B (zh) 电子设备的控制方法和电子设备
CN110992973A (zh) 一种信号时延的确定方法和电子设备
CN106782614B (zh) 音质检测方法及装置
CN111355892B (zh) 图片拍摄方法、装置、存储介质及电子终端
CN110365842B (zh) 一种终端控制方法及终端设备
CN113160790A (zh) 回声消除方法、装置、电子设备及存储介质
CN107589424B (zh) 超声波采样方法、装置及计算机可读存储介质
CN115691524A (zh) 音频信号的处理方法、装置、设备及存储介质
CN109995441B (zh) 通讯信息处理的方法、装置及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200303

R150 Certificate of patent or registration of utility model

Ref document number: 6671477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250