JP6954370B2 - 音声コミュニケーション装置、音声コミュニケーション方法、プログラム - Google Patents
音声コミュニケーション装置、音声コミュニケーション方法、プログラム Download PDFInfo
- Publication number
- JP6954370B2 JP6954370B2 JP2019554218A JP2019554218A JP6954370B2 JP 6954370 B2 JP6954370 B2 JP 6954370B2 JP 2019554218 A JP2019554218 A JP 2019554218A JP 2019554218 A JP2019554218 A JP 2019554218A JP 6954370 B2 JP6954370 B2 JP 6954370B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- speaker
- pick
- voice communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
- G10K11/17853—Methods, e.g. algorithms; Devices of the filter
- G10K11/17854—Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/23—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/108—Communication systems, e.g. where useful sound is kept and noise is cancelled
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/50—Miscellaneous
- G10K2210/505—Echo cancellation, e.g. multipath-, ghost- or reverberation-cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Description
以下、図1〜図2を参照して音声コミュニケーション装置100を説明する。図1は、音声コミュニケーション装置100の構成を示すブロック図である。図2は、音声コミュニケーション装置100の動作を示すフローチャートである。図1に示すように音声コミュニケーション装置100は、スピーカ102と、第1マイク104と、第2マイク106と、乗算部110と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。
ここでは、固定係数について説明する。自由空間に均等に放射される音声信号は、距離に反比例して振幅が小さくなる。スピーカ102から第2マイク106までの距離をd2、スピーカ102から第1マイク104までの距離をd1とする(ただし、d2≦d1)と、第1マイク104で観測される音の振幅P1と第2マイク106で観測される音の振幅P2の間には以下の関係が成立する。
上記説明では、第2マイク106が第1マイク104よりスピーカ102に近い位置にあることのみを要求した。図3A、図3B、図3C、図3Dにスピーカとマイクの位置関係の例を示す。図3Aはスピーカに対してマイクが片側にしかないような位置関係であるが、図3Bのようにスピーカを挟み込むように2つのマイクを配置してもよい。また、図3Cのようにスピーカが2つのマイクからほぼ等しい距離にあるように配置してもよい。さらに、図3Dのように(当該図上)左右方向に偏りがあるように配置してもよい。
適応フィルタではフィルタ係数を逐次更新する適応アルゴリズムが用いられる。この適応アルゴリズムの代表的なものとして、NLMS(Normalized Least Mean Squares)アルゴリズムやLMS(Least Mean Squares)アルゴリズムなどがある。フィルタ係数は、遠端話者からの受話信号x(t)と遠端話者への送話信号e(t)等を用いて更新される。以下、NLMSアルゴリズムとLMSアルゴリズムについて、簡単に説明する(特許文献1参照)。
NLMSアルゴリズムは、観測された最新の1サンプルの送話信号e(t)のみを用いてフィルタ係数を更新するアルゴリズムであり、演算量が少ない特徴を持つ。フィルタ係数の更新式は、以下の2つ式で表される。
LMSアルゴリズムも、NLMSアルゴリズムと同様、観測された最新の1サンプルの送話信号e(t)のみを用いてフィルタ係数を更新するアルゴリズムであり、演算量が少ない特徴を持つ。LMSアルゴリズムの更新式は、以下の2つの式で表すことができる。
(参考特許文献1:特開2006−135886号公報)
スピーカ102と第2マイク106の距離d2がスピーカ102と第1マイク104の距離d1より小さいことから、受音信号がスピーカ102から放声された再生音は、第2マイク106、第1マイク104の順に収音される。この収音のタイミングのずれを考慮することにより、エコー消去性能をさらに高めることが可能となる。以下、収音タイミングのずれを考慮した第二実施形態について説明する。
ここでは、遅延部210で加える遅延時間について説明する。スピーカ102と第1マイク104の距離d1とスピーカ102と第2マイク106の距離d2の差に相当する距離d1-d2を音が進むのにかかる時間τを遅延時間とすればよい。
第二実施形態の遅延部210と乗算部110では、第1マイク104と第2マイク106の間の収音タイミングのずれ(遅延時間差)や収音信号の振幅の差については考慮することができるが、第1マイク104と第2マイク106の間の周波数特性の差については考慮することができない。そこで、第三実施形態では、第1マイク104と第2マイク106の間の周波数特性の差についても扱える固定フィルタを用いた構成について説明する。
第三実施形態では、第1収音信号からフィルタリング済第2収音信号を減算しているが、これにより、目的音である近端話者の音声に対する周波数特性の劣化が生じてしまうことがある。この劣化は、スピーカ102と第1マイク104の距離d1とスピーカ102と第2マイク106の距離d2が近い場合ほど大きくなる。そこで、この周波数特性の劣化を補正する固定フィルタを加えた構成について第四実施形態では説明する。
これまで説明してきた各実施形態では、第2収音信号を入力とする適応フィルタ140を用いてエコー消去を行った。ここでは、受話信号を入力とする第2の適応フィルタを追加した構成を第五実施形態として説明する。なお、ここでは、第四実施形態に第2の適応フィルタを追加した構成について説明するが、第四実施形態の代わりに第一実施形態〜第三実施形態のいずれかに当該適応フィルタを追加する構成としてもよい。
以下、図12〜図13を参照して音声コミュニケーション装置600を説明する。図12は、音声コミュニケーション装置600の構成を示すブロック図である。図13は、音声コミュニケーション装置600の動作を示すフローチャートである。図12に示すように音声コミュニケーション装置600は、スピーカ102と、第1マイク104と、第2マイク106と、補正部610と、第1減算部120と、第2減算部130と、適応フィルタ140を含む。つまり、音声コミュニケーション装置600は、乗算部110の代わりに補正部610を含む点において音声コミュニケーション装置100と異なる。
音声コミュニケーション装置600では、第1収音信号を補正するように構成したが、第2収音信号を補正するよう構成することもできる。このような構成である音声コミュニケーション装置601について説明する。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (14)
- 遠端話者の音声信号である受話信号を放声するスピーカと、
近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、
前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部と
を含む音声コミュニケーション装置であって、
前記適応フィルタのフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
音声コミュニケーション装置。 - 遠端話者の音声信号である受話信号を放声するスピーカと、
近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延部と、
前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算部と、
前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む音声コミュニケーション装置であって、
前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
前記適応フィルタのフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
音声コミュニケーション装置。 - 遠端話者の音声信号である受話信号を放声するスピーカと、
近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、
前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部と
を含む音声コミュニケーション装置であって、
前記適応フィルタのフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
音声コミュニケーション装置。 - 遠端話者の音声信号である受話信号を放声するスピーカと、
近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延部と、
前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算部と、
前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む音声コミュニケーション装置であって、
前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
前記適応フィルタのフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
音声コミュニケーション装置。 - 遠端話者の音声信号である受話信号を放声するスピーカと、
近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正部と、
前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部と
を含む音声コミュニケーション装置であって、
前記適応フィルタのフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
音声コミュニケーション装置。 - 遠端話者の音声信号である受話信号を放声するスピーカと、
近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、
前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクと、
前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延部と、
前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算部と、
前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算部と、
前記第2収音信号と前記遠端話者に送信する送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタと、
前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算部とを含む音声コミュニケーション装置であって、
前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
前記適応フィルタのフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
音声コミュニケーション装置。 - 請求項5または6に記載の音声コミュニケーション装置であって、
前記閾値は、0.1以上0.5以下であり、
前記適応フィルタのフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が前記閾値以下であるまたは前記閾値より小さい場合に更新される
ことを特徴とする音声コミュニケーション装置。 - 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
前記音声コミュニケーション装置が、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正ステップと、
前記音声コミュニケーション装置が、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップと
を含む音声コミュニケーション方法であって、
前記適応フィルタリングステップで用いるフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
音声コミュニケーション方法。 - 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
前記音声コミュニケーション方法は、
前記音声コミュニケーション装置が、前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延ステップと、
前記音声コミュニケーション装置が、前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算ステップと、
前記音声コミュニケーション装置が、前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップとを含み、
前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
前記適応フィルタリングステップで用いるフィルタ係数は、前記送話信号のパワーPow1と前記第2収音信号のパワーPow2の比Pow1/Pow2が小さいことを示す所定の範囲にある場合にNLMS(Normalized Least Mean Squares)アルゴリズムまたはLMS(Least Mean Squares)アルゴリズムを用いて更新される
音声コミュニケーション方法。 - 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
前記音声コミュニケーション装置が、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正ステップと、
前記音声コミュニケーション装置が、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップと
を含む音声コミュニケーション方法であって、
前記適応フィルタリングステップで用いるフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
音声コミュニケーション方法。 - 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
前記音声コミュニケーション方法は、
前記音声コミュニケーション装置が、前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延ステップと、
前記音声コミュニケーション装置が、前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算ステップと、
前記音声コミュニケーション装置が、前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップとを含み、
前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
前記適応フィルタリングステップで用いるフィルタ係数は、修正アフィン射影アルゴリズムで用いるリミッタ関数ψ(a)の上限値が小さいことを示す所定の範囲にある場合に前記修正アフィン射影アルゴリズムを用いて更新される
音声コミュニケーション方法。 - 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
前記音声コミュニケーション装置が、前記第1収音信号または前記第2収音信号のいずれか1つの信号から、前記スピーカから前記第1マイクまでの距離d1と前記スピーカから前記第2マイクまでの距離d2(ただし、d2≦d1)との違いに基づく振幅の違いを補正した信号である補正済収音信号を生成する補正ステップと、
前記音声コミュニケーション装置が、前記補正済収音信号から前記第2収音信号を減じた信号または前記第1収音信号から前記補正済収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップと
を含む音声コミュニケーション方法であって、
前記適応フィルタリングステップで用いるフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
音声コミュニケーション方法。 - 遠端話者の音声信号である受話信号を放声するスピーカと、近端話者が発した音声である話者音声と前記受話信号を放声した再生音を含む音響信号を第1収音信号として収音する第1マイクと、前記話者音声と前記再生音を含む音響信号を第2収音信号として収音する第2マイクとを含む音声コミュニケーション装置が前記遠端話者に送信する送話信号を生成する音声コミュニケーション方法であって、
前記音声コミュニケーション方法は、
前記音声コミュニケーション装置が、前記第2収音信号に所定の遅延を加えた信号である遅延済第2収音信号を生成する遅延ステップと、
前記音声コミュニケーション装置が、前記遅延済第2収音信号に所定の固定係数を乗じた信号であるゲイン済第2収音信号を生成する乗算ステップと、
前記音声コミュニケーション装置が、前記第1収音信号から前記ゲイン済第2収音信号を減じた信号である第1減算済第1収音信号を生成する第1減算ステップと、
前記音声コミュニケーション装置が、前記第2収音信号と前記送話信号から、経時的に変化するエコーを消去することにより、適応フィルタリング済第2収音信号を生成する適応フィルタリングステップと、
前記音声コミュニケーション装置が、前記第1減算済第1収音信号から前記適応フィルタリング済第2収音信号を減じた信号を前記送話信号として生成する第2減算ステップとを含み、
前記スピーカから前記第1マイクまでの距離d1は、前記スピーカから前記第2マイクまでの距離d2以上であり、
前記固定係数は、前記距離d2と前記距離d1の比d2/d1であり、
前記適応フィルタリングステップで用いるフィルタ係数は、所定の閾値を用いて前記送話信号のパワーPow1が前記第2収音信号のパワーPow2に比べて小さいと判断される場合に更新される
音声コミュニケーション方法。 - 請求項1ないし7のいずれか1項に記載の音声コミュニケーション装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017218825 | 2017-11-14 | ||
JP2017218825 | 2017-11-14 | ||
PCT/JP2018/041945 WO2019098178A1 (ja) | 2017-11-14 | 2018-11-13 | 音声コミュニケーション装置、音声コミュニケーション方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019098178A1 JPWO2019098178A1 (ja) | 2020-11-19 |
JP6954370B2 true JP6954370B2 (ja) | 2021-10-27 |
Family
ID=66538618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019554218A Active JP6954370B2 (ja) | 2017-11-14 | 2018-11-13 | 音声コミュニケーション装置、音声コミュニケーション方法、プログラム |
Country Status (7)
Country | Link |
---|---|
US (1) | US11232806B2 (ja) |
EP (1) | EP3713250B1 (ja) |
JP (1) | JP6954370B2 (ja) |
CN (1) | CN111345048A (ja) |
ES (1) | ES2943483T3 (ja) |
RU (1) | RU2744518C1 (ja) |
WO (1) | WO2019098178A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112153547A (zh) * | 2020-09-03 | 2020-12-29 | 海尔优家智能科技(北京)有限公司 | 音频信号的校正方法、装置、存储介质及电子装置 |
CN113726966A (zh) * | 2021-07-28 | 2021-11-30 | 台湾立讯精密有限公司 | 通讯终端、通讯系统和音频信息处理方法 |
CN115148203A (zh) * | 2022-06-06 | 2022-10-04 | 青岛海尔科技有限公司 | 拾音校准方法、装置、非易失性存储介质及电子设备 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05241582A (ja) * | 1992-02-28 | 1993-09-21 | Nec Corp | ノイズキャンセラ |
US5402496A (en) * | 1992-07-13 | 1995-03-28 | Minnesota Mining And Manufacturing Company | Auditory prosthesis, noise suppression apparatus and feedback suppression apparatus having focused adaptive filtering |
JPH06153289A (ja) * | 1992-11-05 | 1994-05-31 | Sony Corp | 音声入出力装置 |
JPH08223274A (ja) * | 1995-02-15 | 1996-08-30 | Matsushita Electric Works Ltd | ハンズフリー通話装置 |
JPH08223275A (ja) * | 1995-02-15 | 1996-08-30 | Matsushita Electric Works Ltd | ハンズフリー通話装置 |
US5793864A (en) * | 1996-12-12 | 1998-08-11 | At&T Corp. | Nonintrusive measurement of echo power and echo path delay present on a transmission path |
JP3139405B2 (ja) | 1997-02-28 | 2001-02-26 | 日本電気株式会社 | エコーキャンセラ |
JPH1141342A (ja) * | 1997-07-15 | 1999-02-12 | Calsonic Corp | 自動車電話装置 |
EP1300963A4 (en) * | 2001-05-22 | 2009-03-04 | Mitsubishi Electric Corp | APPARATUS FOR TREATING ECHOS |
US20040059571A1 (en) * | 2002-09-24 | 2004-03-25 | Marantz Japan, Inc. | System for inputting speech, radio receiver and communication system |
JP2004343262A (ja) * | 2003-05-13 | 2004-12-02 | Sony Corp | マイクロフォン・スピーカ一体構成型・双方向通話装置 |
CN1701528A (zh) * | 2003-07-17 | 2005-11-23 | 松下电器产业株式会社 | 通话装置 |
JP4425114B2 (ja) | 2004-11-09 | 2010-03-03 | 日本電信電話株式会社 | 反響消去方法、反響消去装置、反響消去プログラム、及びこれを記録した記録媒体 |
WO2007015203A1 (en) * | 2005-08-02 | 2007-02-08 | Koninklijke Philips Electronics N.V. | Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dξpendance of the background noise |
JP2007336132A (ja) * | 2006-06-14 | 2007-12-27 | Matsushita Electric Ind Co Ltd | エコー抑圧装置 |
JP5075042B2 (ja) * | 2008-07-23 | 2012-11-14 | 日本電信電話株式会社 | エコー消去装置、エコー消去方法、そのプログラム、記録媒体 |
JP5241582B2 (ja) * | 2009-03-27 | 2013-07-17 | 三菱電機株式会社 | マルチメディア送信装置 |
JP2011160429A (ja) | 2011-02-15 | 2011-08-18 | Nippon Telegr & Teleph Corp <Ntt> | エコー消去装置 |
CN103051818B (zh) * | 2012-12-20 | 2014-10-29 | 歌尔声学股份有限公司 | 一种用于小型免提语音通讯系统中的回声消除装置和方法 |
US9936290B2 (en) * | 2013-05-03 | 2018-04-03 | Qualcomm Incorporated | Multi-channel echo cancellation and noise suppression |
EP3295681B1 (en) * | 2015-05-15 | 2021-06-30 | Harman International Industries, Inc. | Acoustic echo cancelling system and method |
JP6189395B2 (ja) * | 2015-10-20 | 2017-08-30 | 株式会社フジエンジニアリング | 膜厚測定装置 |
JP2017191987A (ja) * | 2016-04-12 | 2017-10-19 | 日本電信電話株式会社 | エコー消去装置、その方法、プログラム、及び記録媒体 |
-
2018
- 2018-11-13 ES ES18879623T patent/ES2943483T3/es active Active
- 2018-11-13 EP EP18879623.9A patent/EP3713250B1/en active Active
- 2018-11-13 RU RU2020115442A patent/RU2744518C1/ru active
- 2018-11-13 US US16/652,199 patent/US11232806B2/en active Active
- 2018-11-13 JP JP2019554218A patent/JP6954370B2/ja active Active
- 2018-11-13 CN CN201880073209.7A patent/CN111345048A/zh active Pending
- 2018-11-13 WO PCT/JP2018/041945 patent/WO2019098178A1/ja unknown
Also Published As
Publication number | Publication date |
---|---|
US11232806B2 (en) | 2022-01-25 |
WO2019098178A1 (ja) | 2019-05-23 |
EP3713250B1 (en) | 2023-04-05 |
CN111345048A (zh) | 2020-06-26 |
RU2744518C1 (ru) | 2021-03-11 |
ES2943483T3 (es) | 2023-06-13 |
JPWO2019098178A1 (ja) | 2020-11-19 |
US20200251121A1 (en) | 2020-08-06 |
EP3713250A1 (en) | 2020-09-23 |
EP3713250A4 (en) | 2021-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6954370B2 (ja) | 音声コミュニケーション装置、音声コミュニケーション方法、プログラム | |
JP5075042B2 (ja) | エコー消去装置、エコー消去方法、そのプログラム、記録媒体 | |
KR101975251B1 (ko) | 오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법 | |
US9667803B2 (en) | Nonlinear acoustic echo cancellation based on transducer impedance | |
US8761386B2 (en) | Sound processing apparatus, method, and program | |
US20190251948A1 (en) | Signal processing device, signal processing method, and program | |
JP2016503262A (ja) | エコー抑圧 | |
CN114466297B (zh) | 一种具有改进的反馈抑制的听力辅助装置及抑制方法 | |
JP2008060715A (ja) | エコー消去装置、その方法、そのプログラム、およびその記録媒体 | |
JP6537997B2 (ja) | エコー抑圧装置、その方法、プログラム、及び記録媒体 | |
JP2017191987A (ja) | エコー消去装置、その方法、プログラム、及び記録媒体 | |
CN112863532A (zh) | 回音抑制装置、回音抑制方法以及存储介质 | |
JP4425114B2 (ja) | 反響消去方法、反響消去装置、反響消去プログラム、及びこれを記録した記録媒体 | |
JP3583998B2 (ja) | 多チャネルエコー消去方法、その装置及びプログラム記録媒体 | |
US20230274724A1 (en) | Cancel filter coefficient generation method, cancel filter coefficient generation apparatus, and program | |
CN113724722B (zh) | 回声延迟估计方法、装置、存储介质和计算设备 | |
JP6994221B2 (ja) | 抽出発生音補正装置、抽出発生音補正方法、プログラム | |
JP2002261659A (ja) | 多チャネルエコーキャンセル方法、その装置、そのプログラム及び記録媒体 | |
JP6075783B2 (ja) | エコー消去装置、エコー消去方法及びプログラム | |
CN113453124B (zh) | 音频处理方法、装置以及系统 | |
JP2001251224A (ja) | 反響消去方法および反響消去装置 | |
JP5264687B2 (ja) | エコーキャンセル方法、エコーキャンセル装置、エコーキャンセルプログラム | |
JP5086969B2 (ja) | エコーキャンセル装置、その方法、そのプログラム、およびその記録媒体 | |
JP3457275B2 (ja) | 反響消去装置、反響消去方法及び反響消去プログラムを記録した記録媒体 | |
JP2019220917A (ja) | エコー消去装置、エコー消去方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200324 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210216 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6954370 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |