JP6954370B2 - 音声コミュニケーション装置、音声コミュニケーション方法、プログラム - Google Patents

音声コミュニケーション装置、音声コミュニケーション方法、プログラム Download PDF

Info

Publication number
JP6954370B2
JP6954370B2 JP2019554218A JP2019554218A JP6954370B2 JP 6954370 B2 JP6954370 B2 JP 6954370B2 JP 2019554218 A JP2019554218 A JP 2019554218A JP 2019554218 A JP2019554218 A JP 2019554218A JP 6954370 B2 JP6954370 B2 JP 6954370B2
Authority
JP
Japan
Prior art keywords
signal
sound
speaker
pick
voice communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019554218A
Other languages
English (en)
Other versions
JPWO2019098178A1 (ja
Inventor
小林 和則
和則 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2019098178A1 publication Critical patent/JPWO2019098178A1/ja
Application granted granted Critical
Publication of JP6954370B2 publication Critical patent/JP6954370B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • G10K11/17854Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/10Applications
    • G10K2210/108Communication systems, e.g. where useful sound is kept and noise is cancelled
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/50Miscellaneous
    • G10K2210/505Echo cancellation, e.g. multipath-, ghost- or reverberation-cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Description

本発明は、ハンズフリー通話においてスピーカからマイクロホンへ回り込んだ音であるエコーを消去するエコー消去技術に関する。
TV会議や音声会議などのハンズフリー通話においてスピーカからマイクロホンへ回り込んだ音であるエコー(音響エコー)を消去する装置はエコー消去装置と呼ばれる。図16は、特許文献1で開示されている従来技術のエコー消去装置805を含む音声コミュニケーション装置800の構成を示す。図16に示すようにエコー消去装置805は、減算部820と、加算部830と、第1適応フィルタ840と、第2適応フィルタ850を含む。また、エコー消去装置800に、スピーカ890とメインマイク892とサブマイク894を加えた構成が音声コミュニケーション装置800である。エコー消去装置805は、近端話者10の音声をなるべく大きく拾いスピーカ890からの音をなるべく拾わないように配置されたメインマイク892と、スピーカ890からの音をなるべく大きく拾い近端話者10の音声をなるべく拾わないように配置されたサブマイク894に接続する。メインマイク892、サブマイク894は、話者方向を向いた指向性マイク、スピーカ方向を向いた指向性マイクによりそれぞれ実現される。エコー消去装置805は、サブマイク894による収音信号を処理する第1適応フィルタ840とスピーカから出力される前の受話信号(つまり、ネットワーク900を介して伝達された、遠端話者(図示しない)の音声信号)を処理する第2適応フィルタ850の2つの適応フィルタを用いて、エコーを消去する。これにより、スピーカ音の歪成分も含めエコーを消去することが可能となり、音声コミュニケーション装置800の筐体が小型であっても、高性能なハンズフリー通話を実現することが可能となる。
特開2011−160429号公報
しかし、音声コミュニケーション装置800の構成に用いる指向性マイクは無指向性マイクと比べコストが高い。また、指向性マイクを音声コミュニケーション装置800の筐体に組み込む際に多数の音孔が必要であり、デザイン上の制約が大きい。
そこで本発明では、無指向性マイクを用いても高いエコー消去を実現することができる音声コミュニケーション技術を提供することを目的とする。
本発明の一態様は、遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む。
本発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。
音声コミュニケーション装置100の構成の一例を示すブロック図である。 音声コミュニケーション装置100の動作の一例を示すフローチャートである。 スピーカとマイクの位置関係の例を示す図である。 スピーカとマイクの位置関係の例を示す図である。 スピーカとマイクの位置関係の例を示す図である。 スピーカとマイクの位置関係の例を示す図である。 音声コミュニケーション装置200の構成の一例を示すブロック図である。 音声コミュニケーション装置200の動作の一例を示すフローチャートである。 音声コミュニケーション装置300の構成の一例を示すブロック図である。 音声コミュニケーション装置300の動作の一例を示すフローチャートである。 音声コミュニケーション装置400の構成の一例を示すブロック図である。 音声コミュニケーション装置400の動作の一例を示すフローチャートである。 音声コミュニケーション装置500の構成の一例を示すブロック図である。 音声コミュニケーション装置500の動作の一例を示すフローチャートである。 音声コミュニケーション装置600の構成の一例を示すブロック図である。 音声コミュニケーション装置600の動作の一例を示すフローチャートである。 音声コミュニケーション装置601の構成の一例を示すブロック図である。 音声コミュニケーション装置601の動作の一例を示すフローチャートである。 音声コミュニケーション装置800の構成の一例を示すブロック図である。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<第一実施形態>
以下、図1〜図2を参照して音声コミュニケーション装置100を説明する。図1は、音声コミュニケーション装置100の構成を示すブロック図である。図2は、音声コミュニケーション装置100の動作を示すフローチャートである。図1に示すように音声コミュニケーション装置100は、スピーカ102と、第1マイク104と、第2マイク106と、乗算部110と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。
スピーカ102は、ネットワーク900を介して伝達された、遠端話者(図示しない)の音声信号(以下、受話信号という)を放声する。また、近端話者10は、適宜発話する。近端話者10が発した音声を話者音声という。
第1マイク104は、第2マイク106よりもスピーカ102から遠い位置に配置される。つまり、第2マイク106は、第1マイク104よりもスピーカ102に近い位置に配置される。第1マイク104、第2マイク106は、無指向性マイクでよい。スピーカ102、第1マイク104、第2マイク106は音声コミュニケーション装置100の筐体に収容されている。例えば、スピーカ102と第1マイク104の距離は30mm程度、スピーカ102と第2マイク106の距離は10mm程度であり、音声コミュニケーション装置100の筐体の大きさは80mm×40mm程度と比較的小型のものでよい。
音声コミュニケーション装置100は遠端話者に送信する送話信号を出力する。送話信号はネットワーク900を介して遠端話者に伝達される。
以下、図2を参照し、音声コミュニケーション装置100の動作について説明する。乗算部110は、第2マイク106で収音した収音信号(以下、第2収音信号という)に所定の固定係数を乗じた信号(以下、ゲイン済第2収音信号という)を生成する(S110)。第2収音信号は、話者音声や受話信号を放声した再生音などを収音した信号である。固定係数の決定方法については後述する。
第1減算部120は、第1マイク104で収音した収音信号(以下、第1収音信号という)からゲイン済第2収音信号を減じた信号(以下、第1減算済第1収音信号という)を生成する(S120)。第1収音信号も、第2収音信号同様、話者音声や再生音などを収音した信号である。S120により、第1収音信号に含まれるエコー成分が消去され、エコー成分が小さくなった信号(つまり、第1減算済第1収音信号)が得られる。
適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。換言すると、適応フィルタ140は、第2収音信号を入力として、送話信号からエコーを消去した適応フィルタリング済第2収音信号を生成する。エコー成分には、マイク特性のばらつき、音声コミュニケーション装置100の筐体特性や音声コミュニケーション装置100を利用する部屋の反響特性などの影響により残留した再生音成分が含まれる。つまり、適応フィルタ140は、事前に考慮できていない部屋の反響特性などの影響によるエコーを消去するために用いられるものである。経時的に変化するエコーに対応するため、適応フィルタ140に設定されるフィルタ係数は逐次更新される。フィルタ係数の更新方法(適応アルゴリズム)については、後述する。
スピーカ102で発生する歪成分も含め消去するために、スピーカ102により近い位置にある第2マイク106でこの歪みを含む再生音を収音した第2収音信号を用いて、S140の処理は実行される。
第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号を減じた信号を送話信号として生成する(S130)。
[固定係数]
ここでは、固定係数について説明する。自由空間に均等に放射される音声信号は、距離に反比例して振幅が小さくなる。スピーカ102から第2マイク106までの距離をd2、スピーカ102から第1マイク104までの距離をd1とする(ただし、d2≦d1)と、第1マイク104で観測される音の振幅P1と第2マイク106で観測される音の振幅P2の間には以下の関係が成立する。
Figure 0006954370
この関係を利用して、スピーカ102から直接第1マイク104に到達する音を推定して減算する。具体的には、マイク配置から算出される値、すなわち、スピーカ102と第2マイク106の距離d2とスピーカ102と第1マイク104の距離d1の比d2/d1を固定係数とし、第2収音信号に固定係数d2/d1を乗じた信号(ゲイン済第2収音信号)を第1収音信号から減算する。
ここで、第2マイク106が収音する第2収音信号は、スピーカ102による再生音を主たる成分として含んでいることを期待している。
なお、単純に2つの距離の比d2/d1を用いる代わりに、第1減算部120が出力するエコーが最小となる値を実験的に求め、その値を固定係数としてもよい。
[スピーカと2つのマイクの位置関係]
上記説明では、第2マイク106が第1マイク104よりスピーカ102に近い位置にあることのみを要求した。図3A、図3B、図3C、図3Dにスピーカとマイクの位置関係の例を示す。図3Aはスピーカに対してマイクが片側にしかないような位置関係であるが、図3Bのようにスピーカを挟み込むように2つのマイクを配置してもよい。また、図3Cのようにスピーカが2つのマイクからほぼ等しい距離にあるように配置してもよい。さらに、図3Dのように(当該図上)左右方向に偏りがあるように配置してもよい。
[適応アルゴリズム]
適応フィルタではフィルタ係数を逐次更新する適応アルゴリズムが用いられる。この適応アルゴリズムの代表的なものとして、NLMS(Normalized Least Mean Squares)アルゴリズムやLMS(Least Mean Squares)アルゴリズムなどがある。フィルタ係数は、遠端話者からの受話信号x(t)と遠端話者への送話信号e(t)等を用いて更新される。以下、NLMSアルゴリズムとLMSアルゴリズムについて、簡単に説明する(特許文献1参照)。
(NLMSアルゴリズム)
NLMSアルゴリズムは、観測された最新の1サンプルの送話信号e(t)のみを用いてフィルタ係数を更新するアルゴリズムであり、演算量が少ない特徴を持つ。フィルタ係数の更新式は、以下の2つ式で表される。
Figure 0006954370
ただし、H1(t)、Hm(t)(m=2, …, M、Mは2以上の整数であり、マイクロホンの数を表す)は、時刻tにおける受話信号x(t)に対するフィルタ係数のベクトルであり、Hm(t)=(hm(t, 0), …, hm(t, L-1))T(m=1, …, M)で表され、Lはタップ数である。a1とam(m=2, …, M)は事前に設定されたNLMSアルゴリズムのステップサイズであり、0<a1<2, 0<am<2を満たす。また、X(t)は時刻tにおける受話信号x(t)のLサンプル分のベクトルであり、X(t)=(x(t-0), …, x(t-L+1))Tで表す。Y(t)は時刻tにおける受音信号y(t)のLサンプル分のベクトルであり、Ym(t)=(ym(t-0), …, ym(t-L+1))Tで表す(受音信号ym(t)は、マイクロホンmで収音した音声信号である)。
(LMSアルゴリズム)
LMSアルゴリズムも、NLMSアルゴリズムと同様、観測された最新の1サンプルの送話信号e(t)のみを用いてフィルタ係数を更新するアルゴリズムであり、演算量が少ない特徴を持つ。LMSアルゴリズムの更新式は、以下の2つの式で表すことができる。
Figure 0006954370
ただし、b1とbm(m=2, …, M)は事前に設定されたLMSアルゴリズムのステップサイズである。
スピーカから遠端話者の音声信号(受話信号)が出力されるのと同時に近端話者の音声(話者音声)が発せられているダブルトーク状態において、フィルタ係数更新のための適応フィルタの学習を行うと近端話者の音声(話者音声)も消去するようフィルタ係数を更新してしまう可能性がある。これを防ぐために、第2減算部130の出力信号(送話信号)において、スピーカからの遠端話者の音声信号(受話信号)が減衰していることに着目する。第2マイク106の出力信号(第2収音信号)のパワーと第2減算部130の出力信号(送話信号)のパワーを比較し、第2減算部130の出力信号(送話信号)のパワーが第2マイク106の出力信号(第2収音信号)のパワーよりも十分に小さい場合に適応フィルタを学習する(つまり、適応フィルタのフィルタ係数を更新する)。十分に小さいとは、例えば0.5〜0.1倍程度である。つまり、閾値を所定の実数(例えば、0.1以上0.5以下のある実数)とし、第2減算部130の出力信号(送話信号)のパワーPow1と第2マイク106の出力信号(第2収音信号)のパワーPow2の比Pow1/Pow2が閾値以下となるか、閾値より小さくなることである。なお、比Pow1/Pow2が閾値以下となるか、閾値より小さくなることを比Pow1/Pow2が小さいことを示す所定の範囲にあるという。
また、参考特許文献1に記載の適応アルゴリズム(以下、修正アフィン射影アルゴリズムという)を用いてもよい。
(参考特許文献1:特開2006−135886号公報)
エコー消去装置は、スピーカとマイクロホンの間の反響路のインパルス応答を要素として持つ長さLのベクトルh*(以下、**はベクトルを表わす)の模擬特性h'*(k)(kは所定間隔の離散時間を指すステップ数)を保持する模擬反響路を有するものとする。ここで、模擬特性h'*(k)がフィルタ係数に対応するものである。模擬特性h'*(k)の更新式は以下の式で表される。
Figure 0006954370
ただし、x(k)は遠端話者からの受話信号、x*(k)=(x(k), x(k-1), …, x(k-L+1))T、X*(k)=(x*(k), x*(k-1), …, x*(k-p+1))T、μ(k)は固定または時変の更新調整係数(0<μ(k)<2)、e(k)は遠端話者への送話信号であり、e*(k)は次式で表される誤差信号ベクトルである。
Figure 0006954370
また、リミッタ関数ψ(a)は、入力値aが大きくなるほどその値を抑圧する特性を持つ任意の関数である。
修正アフィン射影アルゴリズムにおいて、リミッタ関数ψ(a)の上限値を1未満の値に設定し、近端話者の音声成分が多く含まれる区間では適応フィルタの学習を遅くする。つまり、閾値を所定の実数(例えば、0.1以上0.5以下のある実数)とし、リミッタ関数ψ(a)の上限値が閾値以下となるか、閾値より小さくなることである。なお、リミッタ関数ψ(a)の上限値が閾値以下となるか、閾値より小さくなることをリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にあるという。
リミッタ関数ψ(a)の上限値を所定の値より小さい値に設定して、修正アフィン射影アルゴリズムによりフィルタ係数を更新することにより、近端話者の音声(話者音声)を消去することを防止することができる。
本実施形態の発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。特に、スピーカ音の歪が大きい小型の音声コミュニケーション装置であっても、安価な無指向性マイクを用いて高いエコー消去を実現することが可能となる。
本実施形態の発明では、あらかじめ既知の情報(比d2/d1)で固定係数を設定しているため、初期状態からエコー消去が可能となる。さらに、適応フィルタを用いることにより、マイク特性のばらつき、音声コミュニケーション装置の筐体特性や音声コミュニケーション装置を利用する部屋の反響特性などの影響により残留した再生音成分をさらに消去することができる。これにより、マイク特性のばらつきや筐体への組み付け誤差が大きくても安定したエコー消去が可能となる。
<第二実施形態>
スピーカ102と第2マイク106の距離d2がスピーカ102と第1マイク104の距離d1より小さいことから、受音信号がスピーカ102から放声された再生音は、第2マイク106、第1マイク104の順に収音される。この収音のタイミングのずれを考慮することにより、エコー消去性能をさらに高めることが可能となる。以下、収音タイミングのずれを考慮した第二実施形態について説明する。
以下、図4〜図5を参照して音声コミュニケーション装置200を説明する。図4は、音声コミュニケーション装置200の構成を示すブロック図である。図5は、音声コミュニケーション装置200の動作を示すフローチャートである。図4に示すように音声コミュニケーション装置200は、スピーカ102と、第1マイク104と、第2マイク106と、遅延部210と、乗算部110と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。つまり、音声コミュニケーション装置200は、遅延部210をさらに含む点において音声コミュニケーション装置100と異なる。
以下、図5を参照し、音声コミュニケーション装置200の動作について説明する。遅延部210は、第2収音信号に所定の遅延を加えた信号(以下、遅延済第2収音信号という)を生成する(S210)。遅延時間の決定方法については後述する。
乗算部110は、遅延済第2収音信号に所定の固定係数を乗じることにより、ゲイン済第2収音信号を生成する(S110)。第1減算部120は、第1収音信号からゲイン済第2収音信号を減じることにより、第1減算済第1収音信号を生成する(S120)。適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号を減じることにより、送話信号を生成する(S130)。
[遅延時間]
ここでは、遅延部210で加える遅延時間について説明する。スピーカ102と第1マイク104の距離d1とスピーカ102と第2マイク106の距離d2の差に相当する距離d1-d2を音が進むのにかかる時間τを遅延時間とすればよい。
Figure 0006954370
ただし、vは音速を表す。
本実施形態の発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。特に、スピーカ音の歪が大きい小型の音声コミュニケーション装置であっても、安価な無指向性マイクを用いて高いエコー消去を実現することが可能となる。
本実施形態の発明では、スピーカとマイクの位置関係に起因する収音タイミングのずれを考慮するため、エコー消去性能をさらに高めることが可能となる。
<第三実施形態>
第二実施形態の遅延部210と乗算部110では、第1マイク104と第2マイク106の間の収音タイミングのずれ(遅延時間差)や収音信号の振幅の差については考慮することができるが、第1マイク104と第2マイク106の間の周波数特性の差については考慮することができない。そこで、第三実施形態では、第1マイク104と第2マイク106の間の周波数特性の差についても扱える固定フィルタを用いた構成について説明する。
以下、図6〜図7を参照して音声コミュニケーション装置300を説明する。図6は、音声コミュニケーション装置300の構成を示すブロック図である。図7は、音声コミュニケーション装置300の動作を示すフローチャートである。図6に示すように音声コミュニケーション装置300は、スピーカ102と、第1マイク104と、第2マイク106と、固定フィルタ310と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。つまり、音声コミュニケーション装置300は、遅延部210と乗算部110の代わりに固定フィルタ310を含む点において音声コミュニケーション装置200と異なる。
以下、図7を参照し、音声コミュニケーション装置300の動作について説明する。固定フィルタ310は、第2収音信号に所定のフィルタリングを行うことにより、フィルタリング済第2収音信号を生成する(S310)。固定フィルタ310には、例えば、FIR(Finite Impulse Response)フィルタを用いることができる。以下、固定フィルタ310の設定について説明する。スピーカ102の音の放射特性やマイク特性のばらつきにより、第1マイク104と第2マイク106に到達するエコーの直接音成分の周波数特性に差が出ることがあると考えられる。そこで、第1マイク104と第2マイク106の間の遅延時間差、振幅差、周波数特性差を実験やシミュレーションで求め、これらの差を固定フィルタ310に設定する。
第1減算部120は、第1収音信号からフィルタリング済第2収音信号を減じることにより、第1減算済第1収音信号を生成する(S120)。適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号を減じることにより、送話信号を生成する(S130)。
本実施形態の発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。特に、スピーカ音の歪が大きい小型の音声コミュニケーション装置であっても、安価な無指向性マイクを用いて高いエコー消去を実現することが可能となる。
本実施形態の発明では、マイクの周波数特性差についても固定フィルタで考慮するため、第一実施形態や第二実施形態よりもエコー直接音成分の推定精度が上がり、エコー消去性能が向上する。
<第四実施形態>
第三実施形態では、第1収音信号からフィルタリング済第2収音信号を減算しているが、これにより、目的音である近端話者の音声に対する周波数特性の劣化が生じてしまうことがある。この劣化は、スピーカ102と第1マイク104の距離d1とスピーカ102と第2マイク106の距離d2が近い場合ほど大きくなる。そこで、この周波数特性の劣化を補正する固定フィルタを加えた構成について第四実施形態では説明する。
以下、図8〜図9を参照して音声コミュニケーション装置400を説明する。図8は、音声コミュニケーション装置400の構成を示すブロック図である。図9は、音声コミュニケーション装置400の動作を示すフローチャートである。図8に示すように音声コミュニケーション装置400は、スピーカ102と、第1マイク104と、第2マイク106と、固定フィルタ310と、第2固定フィルタ410と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。つまり、音声コミュニケーション装置400は、第2固定フィルタ410をさらに含む点において音声コミュニケーション装置300と異なる。
以下、図9を参照し、音声コミュニケーション装置400の動作について説明する。第2固定フィルタ410は、第1収音信号に所定のフィルタリングを行うことにより、フィルタリング済第1収音信号を生成する(S410)。第2固定フィルタ410には、例えば、FIR(Finite Impulse Response)フィルタを用いることができる。
固定フィルタ310は、第2収音信号に所定のフィルタリングを行うことにより、フィルタリング済第2収音信号を生成する(S310)。第1減算部120は、フィルタリング済第1収音信号からフィルタリング済第2収音信号を減じることにより、第1減算済第1収音信号を生成する(S120)。適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号を減じることにより、送話信号を生成する(S130)。
本実施形態の発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。特に、スピーカ音の歪が大きい小型の音声コミュニケーション装置であっても、安価な無指向性マイクを用いて高いエコー消去を実現することが可能となる。
本実施形態の発明では、第1収音信号に所定のフィルタリングを加え補正することにより、目的音である近端話者の音声の周波数特性の劣化を抑えることが可能となる。
<第五実施形態>
これまで説明してきた各実施形態では、第2収音信号を入力とする適応フィルタ140を用いてエコー消去を行った。ここでは、受話信号を入力とする第2の適応フィルタを追加した構成を第五実施形態として説明する。なお、ここでは、第四実施形態に第2の適応フィルタを追加した構成について説明するが、第四実施形態の代わりに第一実施形態〜第三実施形態のいずれかに当該適応フィルタを追加する構成としてもよい。
以下、図10〜図11を参照して音声コミュニケーション装置500を説明する。図10は、音声コミュニケーション装置500の構成を示すブロック図である。図11は、音声コミュニケーション装置500の動作を示すフローチャートである。図10に示すように音声コミュニケーション装置500は、スピーカ102と、第1マイク104と、第2マイク106と、固定フィルタ310と、第2固定フィルタ410と、第1減算部120と、第2減算部130と、適応フィルタ140と、第2適応フィルタ540を含む。つまり、音声コミュニケーション装置500は、第2適応フィルタ540をさらに含む点において音声コミュニケーション装置400と異なる。
以下、図11を参照し、音声コミュニケーション装置500の動作について説明する。第2固定フィルタ410は、第1収音信号に所定のフィルタリングを行うことにより、フィルタリング済第1収音信号を生成する(S410)。固定フィルタ310は、第2収音信号に所定のフィルタリングを行うことにより、フィルタリング済第2収音信号を生成する(S310)。第1減算部120は、フィルタリング済第1収音信号からフィルタリング済第2収音信号を減じることにより、第1減算済第1収音信号を生成する(S120)。適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。
第2適応フィルタ540は、受話信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済受話信号を生成する(S540)。換言すると、第2適応フィルタ540は、受話信号を入力として、送話信号からエコーを消去した適応フィルタリング済受話信号を生成する。
第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号と適応フィルタリング済受話信号を減じた信号を送話信号として生成する(S130)。
本実施形態の発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。特に、スピーカ音の歪が大きい小型の音声コミュニケーション装置であっても、安価な無指向性マイクを用いて高いエコー消去を実現することが可能となる。
本実施形態の発明では、受話信号を入力とする適応フィルタを追加することにより、残留しているスピーカ音をさらに消去することでき、エコー消去性能が向上する。
<第六実施形態>
以下、図12〜図13を参照して音声コミュニケーション装置600を説明する。図12は、音声コミュニケーション装置600の構成を示すブロック図である。図13は、音声コミュニケーション装置600の動作を示すフローチャートである。図12に示すように音声コミュニケーション装置600は、スピーカ102と、第1マイク104と、第2マイク106と、補正部610と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。つまり、音声コミュニケーション装置600は、乗算部110の代わりに補正部610を含む点において音声コミュニケーション装置100と異なる。
以下、図13を参照し、音声コミュニケーション装置600の動作について説明する。補正部610は、第1収音信号から、スピーカ102から第1マイク104までの距離d1とスピーカ102から第2マイク106までの距離d2との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する(S610)。補正の程度は、例えば、第一実施形態の[固定係数]で説明した式(1)を考慮して決定するとよい。
第1減算部120は、S610で生成した補正済収音信号から第2収音信号を減じることにより、第1減算済第1収音信号を生成する(S120)。適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号を減じることにより、送話信号を生成する(S130)。
(変形例)
音声コミュニケーション装置600では、第1収音信号を補正するように構成したが、第2収音信号を補正するよう構成することもできる。このような構成である音声コミュニケーション装置601について説明する。
以下、図14〜図15を参照して音声コミュニケーション装置601を説明する。図14は、音声コミュニケーション装置601の構成を示すブロック図である。図15は、音声コミュニケーション装置601の動作を示すフローチャートである。図14に示すように音声コミュニケーション装置601は、スピーカ102と、第1マイク104と、第2マイク106と、補正部611と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。つまり、音声コミュニケーション装置601は、補正部610の代わりに補正部611を含む点において音声コミュニケーション装置600と異なる。
以下、図15を参照し、音声コミュニケーション装置601の動作について説明する。補正部611は、第2収音信号から、スピーカ102から第1マイク104までの距離d1とスピーカ102から第2マイク106までの距離d2との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する(S611)。補正の程度は、例えば、第一実施形態の[固定係数]で説明した式(1)を考慮して決定するとよい。
第1減算部120は、第1収音信号からS611で生成した補正済収音信号を減じることにより、第1減算済第1収音信号を生成する(S120)。適応フィルタ140は、第2収音信号と送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する(S140)。第2減算部130は、第1減算済第1収音信号から適応フィルタリング済第2収音信号を減じることにより、送話信号を生成する(S130)。
本実施形態の発明によれば、無指向性マイクを用いても高いエコー消去を実現する音声コミュニケーションが可能となる。特に、スピーカ音の歪が大きい小型の音声コミュニケーション装置であっても、安価な無指向性マイクを用いて高いエコー消去を実現することが可能となる。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims (14)

  1. 遠端話者の音声信号である受話信号を放声するスピーカと、
    近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
    前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
    前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、
    前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
    前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
    前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部と
    を含む音声コミュニケーション装置であって、
    前記適応フィルタのフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
    音声コミュニケーション装置。
  2. 遠端話者の音声信号である受話信号を放声するスピーカと、
    近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
    前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
    前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延部と、
    前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算部と、
    前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
    前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
    前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む音声コミュニケーション装置であって、
    前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
    前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
    前記適応フィルタのフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
    音声コミュニケーション装置。
  3. 遠端話者の音声信号である受話信号を放声するスピーカと、
    近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
    前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
    前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、
    前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
    前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
    前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部と
    を含む音声コミュニケーション装置であって、
    前記適応フィルタのフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
    音声コミュニケーション装置。
  4. 遠端話者の音声信号である受話信号を放声するスピーカと、
    近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
    前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
    前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延部と、
    前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算部と、
    前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
    前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
    前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む音声コミュニケーション装置であって、
    前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
    前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
    前記適応フィルタのフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
    音声コミュニケーション装置。
  5. 遠端話者の音声信号である受話信号を放声するスピーカと、
    近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
    前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
    前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、
    前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
    前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
    前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部と
    を含む音声コミュニケーション装置であって、
    前記適応フィルタのフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
    音声コミュニケーション装置。
  6. 遠端話者の音声信号である受話信号を放声するスピーカと、
    近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
    前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
    前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延部と、
    前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算部と、
    前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
    前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
    前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む音声コミュニケーション装置であって、
    前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
    前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
    前記適応フィルタのフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
    音声コミュニケーション装置。
  7. 請求項5または6に記載の音声コミュニケーション装置であって、
    前記閾値は、0.1以上0.5以下であり、
    前記適応フィルタのフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が前記閾値以下であるまたは前記閾値より小さい場合に更新される
    ことを特徴とする音声コミュニケーション装置。
  8. 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
    前記音声コミュニケーション装置が、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正ステップと、
    前記音声コミュニケーション装置が、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
    前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
    前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップと
    を含む音声コミュニケーション方法であって、
    前記適応フィルタリングステップで用いるフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
    音声コミュニケーション方法。
  9. 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
    前記音声コミュニケーション方法は、
    前記音声コミュニケーション装置が、前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延ステップと、
    前記音声コミュニケーション装置が、前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算ステップと、
    前記音声コミュニケーション装置が、前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
    前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
    前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップとを含み、
    前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
    前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
    前記適応フィルタリングステップで用いるフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
    音声コミュニケーション方法。
  10. 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
    前記音声コミュニケーション装置が、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正ステップと、
    前記音声コミュニケーション装置が、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
    前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
    前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップと
    を含む音声コミュニケーション方法であって、
    前記適応フィルタリングステップで用いるフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
    音声コミュニケーション方法。
  11. 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
    前記音声コミュニケーション方法は、
    前記音声コミュニケーション装置が、前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延ステップと、
    前記音声コミュニケーション装置が、前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算ステップと、
    前記音声コミュニケーション装置が、前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
    前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
    前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップとを含み、
    前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
    前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
    前記適応フィルタリングステップで用いるフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
    音声コミュニケーション方法。
  12. 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
    前記音声コミュニケーション装置が、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正ステップと、
    前記音声コミュニケーション装置が、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
    前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
    前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップと
    を含む音声コミュニケーション方法であって、
    前記適応フィルタリングステップで用いるフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
    音声コミュニケーション方法。
  13. 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
    前記音声コミュニケーション方法は、
    前記音声コミュニケーション装置が、前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延ステップと、
    前記音声コミュニケーション装置が、前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算ステップと、
    前記音声コミュニケーション装置が、前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
    前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
    前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップとを含み、
    前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
    前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
    前記適応フィルタリングステップで用いるフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
    音声コミュニケーション方法。
  14. 請求項1ないし7のいずれか1項に記載の音声コミュニケーション装置としてコンピュータを機能させるためのプログラム。
JP2019554218A 2017-11-14 2018-11-13 音声コミュニケーション装置、音声コミュニケーション方法、プログラム Active JP6954370B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017218825 2017-11-14
JP2017218825 2017-11-14
PCT/JP2018/041945 WO2019098178A1 (ja) 2017-11-14 2018-11-13 音声コミュニケーション装置、音声コミュニケーション方法、プログラム

Publications (2)

Publication Number Publication Date
JPWO2019098178A1 JPWO2019098178A1 (ja) 2020-11-19
JP6954370B2 true JP6954370B2 (ja) 2021-10-27

Family

ID=66538618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019554218A Active JP6954370B2 (ja) 2017-11-14 2018-11-13 音声コミュニケーション装置、音声コミュニケーション方法、プログラム

Country Status (7)

Country Link
US (1) US11232806B2 (ja)
EP (1) EP3713250B1 (ja)
JP (1) JP6954370B2 (ja)
CN (1) CN111345048A (ja)
ES (1) ES2943483T3 (ja)
RU (1) RU2744518C1 (ja)
WO (1) WO2019098178A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112153547A (zh) * 2020-09-03 2020-12-29 海尔优家智能科技(北京)有限公司 音频信号的校正方法、装置、存储介质及电子装置
CN113726966A (zh) * 2021-07-28 2021-11-30 台湾立讯精密有限公司 通讯终端、通讯系统和音频信息处理方法
CN115148203A (zh) * 2022-06-06 2022-10-04 青岛海尔科技有限公司 拾音校准方法、装置、非易失性存储介质及电子设备

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05241582A (ja) * 1992-02-28 1993-09-21 Nec Corp ノイズキャンセラ
US5402496A (en) * 1992-07-13 1995-03-28 Minnesota Mining And Manufacturing Company Auditory prosthesis, noise suppression apparatus and feedback suppression apparatus having focused adaptive filtering
JPH06153289A (ja) * 1992-11-05 1994-05-31 Sony Corp 音声入出力装置
JPH08223274A (ja) * 1995-02-15 1996-08-30 Matsushita Electric Works Ltd ハンズフリー通話装置
JPH08223275A (ja) * 1995-02-15 1996-08-30 Matsushita Electric Works Ltd ハンズフリー通話装置
US5793864A (en) * 1996-12-12 1998-08-11 At&T Corp. Nonintrusive measurement of echo power and echo path delay present on a transmission path
JP3139405B2 (ja) 1997-02-28 2001-02-26 日本電気株式会社 エコーキャンセラ
JPH1141342A (ja) * 1997-07-15 1999-02-12 Calsonic Corp 自動車電話装置
EP1300963A4 (en) * 2001-05-22 2009-03-04 Mitsubishi Electric Corp APPARATUS FOR TREATING ECHOS
US20040059571A1 (en) * 2002-09-24 2004-03-25 Marantz Japan, Inc. System for inputting speech, radio receiver and communication system
JP2004343262A (ja) * 2003-05-13 2004-12-02 Sony Corp マイクロフォン・スピーカ一体構成型・双方向通話装置
CN1701528A (zh) * 2003-07-17 2005-11-23 松下电器产业株式会社 通话装置
JP4425114B2 (ja) 2004-11-09 2010-03-03 日本電信電話株式会社 反響消去方法、反響消去装置、反響消去プログラム、及びこれを記録した記録媒体
WO2007015203A1 (en) * 2005-08-02 2007-02-08 Koninklijke Philips Electronics N.V. Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dξpendance of the background noise
JP2007336132A (ja) * 2006-06-14 2007-12-27 Matsushita Electric Ind Co Ltd エコー抑圧装置
JP5075042B2 (ja) * 2008-07-23 2012-11-14 日本電信電話株式会社 エコー消去装置、エコー消去方法、そのプログラム、記録媒体
JP5241582B2 (ja) * 2009-03-27 2013-07-17 三菱電機株式会社 マルチメディア送信装置
JP2011160429A (ja) 2011-02-15 2011-08-18 Nippon Telegr & Teleph Corp <Ntt> エコー消去装置
CN103051818B (zh) * 2012-12-20 2014-10-29 歌尔声学股份有限公司 一种用于小型免提语音通讯系统中的回声消除装置和方法
US9936290B2 (en) * 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
EP3295681B1 (en) * 2015-05-15 2021-06-30 Harman International Industries, Inc. Acoustic echo cancelling system and method
JP6189395B2 (ja) * 2015-10-20 2017-08-30 株式会社フジエンジニアリング 膜厚測定装置
JP2017191987A (ja) * 2016-04-12 2017-10-19 日本電信電話株式会社 エコー消去装置、その方法、プログラム、及び記録媒体

Also Published As

Publication number Publication date
US11232806B2 (en) 2022-01-25
WO2019098178A1 (ja) 2019-05-23
EP3713250B1 (en) 2023-04-05
CN111345048A (zh) 2020-06-26
RU2744518C1 (ru) 2021-03-11
ES2943483T3 (es) 2023-06-13
JPWO2019098178A1 (ja) 2020-11-19
US20200251121A1 (en) 2020-08-06
EP3713250A1 (en) 2020-09-23
EP3713250A4 (en) 2021-06-23

Similar Documents

Publication Publication Date Title
JP6954370B2 (ja) 音声コミュニケーション装置、音声コミュニケーション方法、プログラム
JP5075042B2 (ja) エコー消去装置、エコー消去方法、そのプログラム、記録媒体
KR101975251B1 (ko) 오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법
US9667803B2 (en) Nonlinear acoustic echo cancellation based on transducer impedance
US8761386B2 (en) Sound processing apparatus, method, and program
US20190251948A1 (en) Signal processing device, signal processing method, and program
JP2016503262A (ja) エコー抑圧
CN114466297B (zh) 一种具有改进的反馈抑制的听力辅助装置及抑制方法
JP2008060715A (ja) エコー消去装置、その方法、そのプログラム、およびその記録媒体
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JP2017191987A (ja) エコー消去装置、その方法、プログラム、及び記録媒体
CN112863532A (zh) 回音抑制装置、回音抑制方法以及存储介质
JP4425114B2 (ja) 反響消去方法、反響消去装置、反響消去プログラム、及びこれを記録した記録媒体
JP3583998B2 (ja) 多チャネルエコー消去方法、その装置及びプログラム記録媒体
US20230274724A1 (en) Cancel filter coefficient generation method, cancel filter coefficient generation apparatus, and program
CN113724722B (zh) 回声延迟估计方法、装置、存储介质和计算设备
JP6994221B2 (ja) 抽出発生音補正装置、抽出発生音補正方法、プログラム
JP2002261659A (ja) 多チャネルエコーキャンセル方法、その装置、そのプログラム及び記録媒体
JP6075783B2 (ja) エコー消去装置、エコー消去方法及びプログラム
CN113453124B (zh) 音频处理方法、装置以及系统
JP2001251224A (ja) 反響消去方法および反響消去装置
JP5264687B2 (ja) エコーキャンセル方法、エコーキャンセル装置、エコーキャンセルプログラム
JP5086969B2 (ja) エコーキャンセル装置、その方法、そのプログラム、およびその記録媒体
JP3457275B2 (ja) 反響消去装置、反響消去方法及び反響消去プログラムを記録した記録媒体
JP2019220917A (ja) エコー消去装置、エコー消去方法、プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200324

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210913

R150 Certificate of patent or registration of utility model

Ref document number: 6954370

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150