JPWO2017064839A1 - 双方向会話補助装置及び双方向会話補助方法 - Google Patents

双方向会話補助装置及び双方向会話補助方法 Download PDF

Info

Publication number
JPWO2017064839A1
JPWO2017064839A1 JP2017545085A JP2017545085A JPWO2017064839A1 JP WO2017064839 A1 JPWO2017064839 A1 JP WO2017064839A1 JP 2017545085 A JP2017545085 A JP 2017545085A JP 2017545085 A JP2017545085 A JP 2017545085A JP WO2017064839 A1 JPWO2017064839 A1 JP WO2017064839A1
Authority
JP
Japan
Prior art keywords
transfer function
signal
microphone
speaker
output signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017545085A
Other languages
English (en)
Other versions
JP6311136B2 (ja
Inventor
良二 鈴木
良二 鈴木
宏正 大橋
宏正 大橋
田中 直也
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Application granted granted Critical
Publication of JP6311136B2 publication Critical patent/JP6311136B2/ja
Publication of JPWO2017064839A1 publication Critical patent/JPWO2017064839A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/002Applications of echo suppressors or cancellers in telephonic connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/40Applications of speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/085Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using digital techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

双方向会話補助装置は、第1話者の第1音声を入力するための第1マイクと、第1音声を出力するための第1スピーカと、第2話者の第2音声を入力するための第2マイクと、第2音声を出力するための第2スピーカと、第1エコー・クロストークキャンセラと、を備える。第1エコー・クロストークキャンセラは、第2スピーカへの入力信号を用いて、第2スピーカから出力された第2音声が第1マイクに入力される第1エコー、及び、第2音声が第1マイクに入力される第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した第1妨害信号を、第1マイクの出力信号から除去する。

Description

本開示は、第1話者と第2話者による双方向の会話を拡声して補助する双方向会話補助装置及び双方向会話補助方法に関する。
特許文献1は、2線伝送路を介してハンズフリー通話が可能な拡声電話回路を開示する。この拡声電話回路は、2線4線変換回路における回線反響信号を消去する第1のエコーキャンセラと、スピーカからマイクへの空間伝播による室内反響信号を消去する第2のエコーキャンセラと、第1のエコーキャンセラの送信出力側と第2のエコーキャンセラの受信入力側の間に可変利得増幅回路とを備える。これにより、安定してスピーカからの受話音量の調整がなされたハンズフリー通話品質を得ることができる。
特開昭61−194958号公報
本開示は、エコー(反響)だけでなくクロストーク(漏話)を含む音響的雑音を除去したうえで双方向の会話を拡声して補助する双方向会話補助装置及び双方向会話補助方法を提供する。
本開示における双方向会話補助装置は、第1話者と第2話者による双方向の会話を拡声して補助する双方向会話補助装置であって、第1話者の第1音声を入力するための第1マイクと、第1音声を出力するための第1スピーカと、第2話者の第2音声を入力するための第2マイクと、第2音声を出力するための第2スピーカと、第1エコー・クロストークキャンセラと、を備える。第1エコー・クロストークキャンセラは、第2スピーカへの入力信号を用いて、第2スピーカから出力された第2音声が第1マイクに入力される第1エコー、及び、第2音声が第1マイクに入力される第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した第1妨害信号を、第1マイクの出力信号から除去する。
本開示における双方向会話補助方法は、会話システムにおいて第1話者と第2話者による双方向の会話を拡声して補助する双方向会話補助方法であって、会話システムは、第1話者の第1音声を入力するための第1マイクと、第1音声を出力するための第1スピーカと、第2話者の第2音声を入力するための第2マイクと、第2音声を出力するための第2スピーカとを備える。双方向会話補助方法は、第2スピーカへの入力信号を用いて、第2スピーカから出力された第2音声が第1マイクに入力される第1エコー、及び、第2音声が第1マイクに入力される第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した第1妨害信号を、第1マイクの出力信号から除去する第1エコー・クロストークキャンセルステップを含む。
本開示における双方向会話補助装置及び双方向会話補助方法は、エコー(反響)だけでなくクロストーク(漏話)を含む音響的雑音を除去したうえで双方向の会話を拡声して補助するのに有効である。
実施の形態1における双方向会話補助装置の適用例を示す図 図1に示された双方向会話補助装置の構成を示すブロック図 実施の形態2における双方向会話補助装置の構成を示すブロック図 実施の形態3における双方向会話補助装置の構成を示すブロック図 実施の形態4における双方向会話補助装置の構成を示すブロック図 実施の形態5における双方向会話補助装置の構成を示すブロック図
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者らは、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(実施の形態1)
以下、図1及び図2を用いて、実施の形態1を説明する。
[1−1.適用例]
図1は、実施の形態1における双方向会話補助装置20の適用例を示す図である。ここでは、双方向会話補助装置20を車10における双方向の会話を拡声して補助する装置(車室内会話補助装置)として適用した例が示されている。
双方向会話補助装置20は、第1話者11(ここでは、運転者)と第2話者12(ここでは、後部乗員)による双方向の会話を拡声して補助する装置である。運転席の天井には、第1話者11の音声(第1音声)を入力するための第1マイク21が設けられ、後部座席横の両側の内側面には、その音声を出力するための第1スピーカ22が設けられている。また、後部座席の天井には、第2話者12の音声(第2音声)を入力するための第2マイク23が設けられ、2つの前扉の内側面には、その音声を出力するための第2スピーカ24が設けられている。
第1話者11と第2話者12とは、この双方向会話補助装置20を用いることで、車における一つの狭い空間であっても、ハウリング(鳴音)、エコー(反響)及びクロストーク(漏話)を含む音響的雑音が除去された双方向会話を楽しむことができる。
なお、ハウリングとは、ある話者の音声を出力するスピーカから出力された音声がその話者の音声が入力されるマイクに帰還して入力される現象をいい、ここでは、第1スピーカ22から出力された音声が第1マイク21に帰還して入力される現象、及び、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される現象である。
また、エコーとは、ある話者に向けて出力された音声がその話者の音声を入力するためのマイクに回り込んで入力される現象をいい、ここでは、第2スピーカ24から出力された音声が第1マイク21に回り込んで入力される現象、及び、第1スピーカ22から出力された音声が第2マイク23に回り込んで入力される現象である。
また、クロストークとは、ある話者の音声が他人の音声を入力するためのマイクに入力される現象をいい、ここでは、第2話者12の音声が第1マイク21に入力される現象、及び、第1話者11の音声が第2マイク23に入力される現象である。
[1−2.構成]
図2は、図1に示された双方向会話補助装置20の構成を示すブロック図である。この双方向会話補助装置20は、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70を備える。なお、双方向会話補助装置20の各構成要素は、有線又は無線で接続されている。また、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70は、例えば、車10のヘッドユニットの一部として実装される。
第1マイク21は、第1話者11の音声を入力するためのマイクであり、例えば、図1に示されるように、車10の運転席の天井に設けられる。なお、第1マイク21から出力される音声信号は、例えば、第1マイク21に内蔵又は直後に設けられたA/D変換器で生成されるデジタル音声データである。
第1スピーカ22は、第1話者11の音声を出力するためのスピーカであり、例えば、図1に示されるように、車10の後部座席横の内側面に設けられる。なお、第1スピーカ22は、例えば、入力されたデジタル音声データを第1スピーカ22に内蔵又は直前に設けられたD/A変換器でアナログ信号に変換した後に音声として出力する。
第2マイク23は、第2話者12の音声を入力するためのマイクであり、例えば、図1に示されるように、後部座席の天井に設けられる。なお、第2マイク23から出力される音声信号は、例えば、第2マイク23に内蔵又は直後に設けられたA/D変換器で生成されるデジタル音声データである。
第2スピーカ24は、第2話者12の音声を出力するためのスピーカであり、例えば、図1に示されるように、車10の2つの前扉の内側面に設けられる。なお、第2スピーカ24は、例えば、入力されたデジタル音声データを第2スピーカ24に内蔵又は直前に設けられたD/A変換器でアナログ信号に変換した後に音声として出力する。
[1−2−1.第1ハウリングキャンセラ40]
第1ハウリングキャンセラ40は、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される第1ハウリング30の程度を示す第1ハウリング信号を推定して算出し、算出した第1ハウリング信号を、第2マイク23の出力信号から除去する回路である。本実施の形態では、第1ハウリングキャンセラ40は、第2マイク23の出力信号から後述する第2妨害信号が除去された第2エコー・クロストークキャンセラ70の出力信号から、さらに第1ハウリング信号を除去し、除去後の信号を第2スピーカ24に出力する回路であり、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。
より詳しくは、第1ハウリングキャンセラ40は、第1伝達関数記憶回路44、第1遅延器46、第1記憶回路42、第1畳み込み演算器43、第1減算器41、及び、第1伝達関数更新回路45を有する。
第1伝達関数記憶回路44は、第1ハウリング30の伝達関数として推定された伝達関数を記憶する。
第1遅延器46は、第1ハウリングキャンセラ40の出力信号を遅延させる。
第1記憶回路42は、第1遅延器46から出力された信号を記憶する。
第1畳み込み演算器43は、第1記憶回路42に記憶された信号と第1伝達関数記憶回路44に記憶された伝達関数とを畳み込むことで第1ハウリング信号を生成する。例えば、第1畳み込み演算器43は、以下の式1に示される畳み込み演算を行うNタップのFIR(Finite Impulse Response)フィルタである。
Figure 2017064839
ここで、y1’tは、時刻tにおける第1ハウリング信号である。Nは、FIRフィルタのタップ数である。H1(i)tは、時刻tにおいて第1伝達関数記憶回路44に記憶されたN個の伝達関数のうちのi番目の伝達関数である。x1(t−i−τ1)は、第1記憶回路42に記憶された信号のうち、(t−i−τ1)番目の信号である。τ1は、第1遅延器46による遅延時間である。
第1減算器41は、第2エコー・クロストークキャンセラ70の出力信号から、第1畳み込み演算器43から出力された第1ハウリング信号を除去し、第1ハウリングキャンセラ40の出力信号として出力する。例えば、第1減算器41は、以下の式2に示される減算を行う。
Figure 2017064839
ここで、e1tは、時刻tにおける第1減算器41の出力信号である。y1tは、時刻tにおける第2エコー・クロストークキャンセラ70の出力信号である。
第1伝達関数更新回路45は、第1減算器41の出力信号と第1記憶回路42に記憶された信号とに基づいて第1伝達関数記憶回路44に記憶された伝達関数を更新する。例えば、第1伝達関数更新回路45は、以下の式3に示されるように、独立成分分析を用いて、第1減算器41の出力信号と第1記憶回路42に記憶された信号とに基づいて、第1減算器41の出力信号と第1記憶回路42に記憶された信号とが相互に独立となるように、第1伝達関数記憶回路44に記憶された伝達関数を更新する。
Figure 2017064839
ここで、H1(j)t+1は、時刻t+1における(つまり、更新後の)第1伝達関数記憶回路44に記憶されるN個の伝達関数のうちのj番目の伝達関数である。H1(j)tは、時刻t(つまり、更新前の)第1伝達関数記憶回路44に記憶されたN個の伝達関数のうちのj番目の伝達関数である。α1は、第1ハウリング30の伝達関数の推定における学習速度を制御するためのステップサイズパラメータである。φ1は、非線形関数(例えば、シグモイド関数(sigmoid関数)、双曲線正接関数(tanh関数)、正規化線形関数又は符号関数(sign関数))である。
このように、第1伝達関数更新回路45は、第1減算器41の出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して第1記憶回路42に記憶された信号と、第1ハウリング30の伝達関数の推定における学習速度を制御するための第1ステップサイズパラメータとを乗じることで第1更新係数を算出する。そして、算出した第1更新係数を第1伝達関数記憶回路44に記憶された伝達関数に加算することで更新を行う。
[1−2−2.第1エコー・クロストークキャンセラ50]
第1エコー・クロストークキャンセラ50は、第1ハウリングキャンセラ40の出力信号を用いて、第2スピーカ24から出力された音声が第1マイク21に回り込んで入力される第1エコー31、及び、第2話者12の音声が第1マイク21に入力される第1クロストーク32の程度を示す第1妨害信号を推定して算出し、算出した第1妨害信号を、第1マイク21の出力信号から除去する回路である。本実施の形態では、第1エコー・クロストークキャンセラ50は、第1妨害信号が除去された信号を第2ハウリングキャンセラ60に出力する回路であり、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。ここで、第1ハウリングキャンセラ40の出力信号は、図2示すように、第2スピーカ24への入力信号である。
より詳しくは、第1エコー・クロストークキャンセラ50は、第2伝達関数記憶回路54、第2記憶回路52、第2畳み込み演算器53、第2減算器51、及び、第2伝達関数更新回路55を有する。
第2伝達関数記憶回路54は、第1エコー31と第1クロストーク32とを合わせた伝達関数として推定された伝達関数を記憶する。
第2記憶回路52は、第1ハウリングキャンセラ40の出力信号を記憶する。
第2畳み込み演算器53は、第2記憶回路52に記憶された信号と第2伝達関数記憶回路54に記憶された伝達関数とを畳み込むことで第1妨害信号を生成する。例えば、第2畳み込み演算器53は、以下の式4に示される畳み込み演算を行うNタップのFIRフィルタである。
Figure 2017064839
ここで、y2’tは、時刻tにおける第1妨害信号である。Nは、FIRフィルタのタップ数である。H2(i)tは、時刻tにおいて第2伝達関数記憶回路54に記憶されたN個の伝達関数のうちのi番目の伝達関数である。x2(t−i)は、第2記憶回路52に記憶された信号のうち、(t−i)番目の信号である。
第2減算器51は、第1マイク21の出力信号から、第2畳み込み演算器53から出力された第1妨害信号を除去し、第1エコー・クロストークキャンセラ50の出力信号として出力する。例えば、第2減算器51は、以下の式5に示される減算を行う。
Figure 2017064839
ここで、e2tは、時刻tにおける第2減算器51の出力信号である。y2tは、時刻tにおける第1マイク21の出力信号である。
第2伝達関数更新回路55は、第2減算器51の出力信号と第2記憶回路52に記憶された信号とに基づいて第2伝達関数記憶回路54に記憶された伝達関数を更新する。例えば、第2伝達関数更新回路55は、以下の式6に示されるように、独立成分分析を用いて、第2減算器51の出力信号と第2記憶回路52に記憶された信号とに基づいて、第2減算器51の出力信号と第2記憶回路52に記憶された信号とが相互に独立となるように、第2伝達関数記憶回路54に記憶された伝達関数を更新する。
Figure 2017064839
ここで、H2(j)t+1は、時刻t+1における(つまり、更新後の)第2伝達関数記憶回路54に記憶されるN個の伝達関数のうちのj番目の伝達関数である。H2(j)tは、時刻t(つまり、更新前の)第2伝達関数記憶回路54に記憶されたN個の伝達関数のうちのj番目の伝達関数である。α2は、第1エコー31と第1クロストーク32とを合わせた伝達関数の推定における学習速度を制御するためのステップサイズパラメータである。φ2は、非線形関数(例えば、シグモイド関数(sigmoid関数)、双曲線正接関数(tanh関数)、正規化線形関数又は符号関数(sign関数))である。
このように、第2伝達関数更新回路55は、第2減算器51の出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して第2記憶回路52に記憶された信号と、第1エコー31と第1クロストーク32とを合わせた伝達関数の推定における学習速度を制御するための第2ステップサイズパラメータとを乗じることで第2更新係数を算出する。そして、算出した第2更新係数を第2伝達関数記憶回路54に記憶された伝達関数に加算することで更新を行う。
なお、本実施の形態における双方向会話補助装置20では、第2話者12の同一時刻における音声について、第1ハウリングキャンセラ40の出力信号が第1エコー・クロストークキャンセラ50に入力される時刻は、第2話者12の音声が第1マイク21に入力される時刻と同一、又は、より早くなるように、設計されている。つまり、第1エコー・クロストークキャンセラ50が第1クロストーク32をキャンセルできるように、因果律が保持されている。これは、第1ハウリングキャンセラ40の出力信号が第1エコー・クロストークキャンセラ50に入力される時刻を決定づける要因(A/D変換の速度、第2エコー・クロストークキャンセラ70での処理速度、第1ハウリングキャンセラ40での処理速度等)と、第2話者12の音声が第1マイク21に入力される時刻を決定づける要因(第2話者12と第1マイク21との位置関係等)とを考慮することで適宜、実現し得る。
[1−2−3.第2ハウリングキャンセラ60]
第2ハウリングキャンセラ60は、第1エコー・クロストークキャンセラ50と第1スピーカ22との間に設けられ、第1スピーカ22から出力された音声が第1マイク21に帰還して入力される第2ハウリング33の程度を示す第2ハウリング信号を推定して算出し、算出した第2ハウリング信号を、第1マイク21の出力信号から除去する回路である。本実施の形態では、第2ハウリングキャンセラ60は、第1マイク21の出力信号から第1妨害信号が除去された第1エコー・クロストークキャンセラ50の出力信号から、さらに第2ハウリング信号を除去し、除去後の信号を第1スピーカ22に出力する回路であり、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。
より詳しくは、第2ハウリングキャンセラ60は、第3伝達関数記憶回路64、第2遅延器66、第3記憶回路62、第3畳み込み演算器63、第3減算器61、及び、第3伝達関数更新回路65を有する。
第3伝達関数記憶回路64は、第2ハウリング33の伝達関数として推定された伝達関数を記憶する。
第2遅延器66は、第2ハウリングキャンセラ60の出力信号を遅延させる。
第3記憶回路62は、第2遅延器66から出力された信号を記憶する。
第3畳み込み演算器63は、第3記憶回路62に記憶された信号と第3伝達関数記憶回路64に記憶された伝達関数とを畳み込むことで第2ハウリング信号を生成する。例えば、第3畳み込み演算器63は、以下の式7に示される畳み込み演算を行うNタップのFIRフィルタである。
Figure 2017064839
ここで、y3’tは、時刻tにおける第2ハウリング信号である。Nは、FIRフィルタのタップ数である。H3(i)tは、時刻tにおいて第3伝達関数記憶回路64に記憶されたN個の伝達関数のうちのi番目の伝達関数である。x3(t−i−τ2)は、第3記憶回路62に記憶された信号のうち、(t−i−τ2)番目の信号である。τ2は、第2遅延器66による遅延時間である。
第3減算器61は、第1エコー・クロストークキャンセラ50の出力信号から、第3畳み込み演算器63から出力された第2ハウリング信号を除去し、第2ハウリングキャンセラ60の出力信号として出力する。例えば、第3減算器61は、以下の式8に示される減算を行う。
Figure 2017064839
ここで、e3tは、時刻tにおける第3減算器61の出力信号である。y3tは、時刻tにおける第1エコー・クロストークキャンセラ50の出力信号である。
第3伝達関数更新回路65は、第3減算器61の出力信号と第3記憶回路62に記憶された信号とに基づいて第3伝達関数記憶回路64に記憶された伝達関数を更新する。例えば、第3伝達関数更新回路65は、以下の式9に示されるように、独立成分分析を用いて、第3減算器61の出力信号と第3記憶回路62に記憶された信号とに基づいて、第3減算器61の出力信号と第3記憶回路62に記憶された信号とが相互に独立となるように、第3伝達関数記憶回路64に記憶された伝達関数を更新する。
Figure 2017064839
ここで、H3(j)t+1は、時刻t+1における(つまり、更新後の)第3伝達関数記憶回路64に記憶されるN個の伝達関数のうちのj番目の伝達関数である。H3(j)tは、時刻t(つまり、更新前の)第3伝達関数記憶回路64に記憶されたN個の伝達関数のうちのj番目の伝達関数である。α3は、第2ハウリング33の伝達関数の推定における学習速度を制御するためのステップサイズパラメータである。φ3は、非線形関数(例えば、シグモイド関数(sigmoid関数)、双曲線正接関数(tanh関数)、正規化線形関数又は符号関数(sign関数))である。
このように、第3伝達関数更新回路65は、第3減算器61の出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して第3記憶回路62に記憶された信号と、第2ハウリング33の伝達関数の推定における学習速度を制御するための第3ステップサイズパラメータとを乗じることで第3更新係数を算出する。そして、算出した第3更新係数を第3伝達関数記憶回路64に記憶された伝達関数に加算することで更新を行う。
[1−2−4.第2エコー・クロストークキャンセラ70]
第2エコー・クロストークキャンセラ70は、第2ハウリングキャンセラ60の出力信号を用いて、第1スピーカ22から出力された音声が第2マイク23に回り込んで入力される第2エコー34、及び、第1話者11の音声が第2マイク23に入力される第2クロストーク35の程度を示す第2妨害信号を推定して算出し、算出した第2妨害信号を、第2マイク23の出力信号から除去する回路である。本実施の形態では、第2エコー・クロストークキャンセラ70は、第2妨害信号が除去された信号を第1ハウリングキャンセラ40に出力する回路であり、デジタル音声データを時間軸領域で処理するデジタル信号処理回路である。ここで、第2ハウリングキャンセラ60の出力信号は、図2示すように、第1スピーカ22への入力信号である。
より詳しくは、第2エコー・クロストークキャンセラ70は、第4伝達関数記憶回路74、第4記憶回路72、第4畳み込み演算器73、第4減算器71、及び、第4伝達関数更新回路75を有する。
第4伝達関数記憶回路74は、第2エコー34と第2クロストーク35とを合わせた伝達関数として推定された伝達関数を記憶する。
第4記憶回路72は、第2ハウリングキャンセラ60の出力信号を記憶する。
第4畳み込み演算器73は、第4記憶回路72に記憶された信号と第4伝達関数記憶回路74に記憶された伝達関数とを畳み込むことで第2妨害信号を生成する。例えば、第4畳み込み演算器73は、以下の式10に示される畳み込み演算を行うNタップのFIRフィルタである。
Figure 2017064839
ここで、y4’tは、時刻tにおける第2妨害信号である。Nは、FIRフィルタのタップ数である。H4(i)tは、時刻tにおいて第4伝達関数記憶回路74に記憶されたN個の伝達関数のうちのi番目の伝達関数である。x4(t−i)は、第4記憶回路72に記憶された信号のうち、(t−i)番目の信号である。
第4減算器71は、第2マイク23の出力信号から、第4畳み込み演算器73から出力された第2妨害信号を除去し、第2エコー・クロストークキャンセラ70の出力信号として出力する。例えば、第4減算器71は、以下の式11に示される減算を行う。
Figure 2017064839
ここで、e4tは、時刻tにおける第4減算器71の出力信号である。y4tは、時刻tにおける第2マイク23の出力信号である。
第4伝達関数更新回路75は、第4減算器71の出力信号と第4記憶回路72に記憶された信号とに基づいて第4伝達関数記憶回路74に記憶された伝達関数を更新する。例えば、第4伝達関数更新回路75は、以下の式12に示されるように、独立成分分析を用いて、第4減算器71の出力信号と第4記憶回路72に記憶された信号とに基づいて、第4減算器71の出力信号と第4記憶回路72に記憶された信号とが相互に独立となるように、第4伝達関数記憶回路74に記憶された伝達関数を更新する。
Figure 2017064839
ここで、H4(j)t+1は、時刻t+1における(つまり、更新後の)第4伝達関数記憶回路74に記憶されるN個の伝達関数のうちのj番目の伝達関数である。H4(j)tは、時刻t(つまり、更新前の)第4伝達関数記憶回路74に記憶されたN個の伝達関数のうちのj番目の伝達関数である。α4は、第2エコー34と第2クロストーク35とを合わせた伝達関数の推定における学習速度を制御するためのステップサイズパラメータである。φ4は、非線形関数(例えば、シグモイド関数(sigmoid関数)、双曲線正接関数(tanh関数)、正規化線形関数又は符号関数(sign関数))である。
このように、第4伝達関数更新回路75は、第4減算器71の出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して第4記憶回路72に記憶された信号と、第2エコー34と第2クロストーク35とを合わせた伝達関数の推定における学習速度を制御するための第4ステップサイズパラメータとを乗じることで第4更新係数を算出する。そして、算出した第4更新係数を第4伝達関数記憶回路74に記憶された伝達関数に加算することで更新を行う。
なお、本実施の形態における双方向会話補助装置20では、第1話者11の同一時刻における音声について、第2ハウリングキャンセラ60の出力信号が第2エコー・クロストークキャンセラ70に入力される時刻は、第1話者11の音声が第2マイク23に入力される時刻と同一、又は、より早くなるように、設計されている。つまり、第2エコー・クロストークキャンセラ70が第2クロストーク35をキャンセルできるように、因果律が保持されている。これは、第2ハウリングキャンセラ60の出力信号が第2エコー・クロストークキャンセラ70に入力される時刻を決定づける要因(A/D変換の速度、第1エコー・クロストークキャンセラ50での処理速度、第2ハウリングキャンセラ60での処理速度等)と、第1話者11の音声が第2マイク23に入力される時刻を決定づける要因(第1話者11と第2マイク23との位置関係等)とを考慮することで適宜、実現し得る。
[1−3.動作]
以上のように構成された本実施の形態における双方向会話補助装置20では、第1話者11の音声及び第2話者12の音声は次のように、処理される。
第1話者11の音声は、第1マイク21に入力される。第1マイク21の出力信号は、第1エコー・クロストークキャンセラ50において、第1妨害信号が除去される。第1妨害信号は、第1エコー31及び第1クロストーク32の程度を示す(推定された)信号である。よって、第1エコー・クロストークキャンセラ50の出力信号は、第1マイク21に入力された音声から、第1エコー31及び第1クロストーク32の影響が除去された音声を示す信号となる。
続いて、第1エコー・クロストークキャンセラ50の出力信号は、第2ハウリングキャンセラ60において、第2ハウリング信号が除去される。第2ハウリング信号は、第2ハウリング33の程度を示す(推定された)信号である。よって、第2ハウリングキャンセラ60の出力信号は、第1エコー・クロストークキャンセラ50の出力信号から、第2ハウリング33の影響が除去された信号となる。この信号が第1スピーカ22に入力され音声となって出力される。
よって、第1スピーカ22から出力される音声は、第1マイク21に入力された音声のうち、第1エコー31、第1クロストーク32及び第2ハウリング33の影響が除去された音声、つまり、音響的雑音が除去された第1話者11の音声だけとなる。
同様に、第2話者12の音声は、第2マイク23に入力される。第2マイク23の出力信号は、第2エコー・クロストークキャンセラ70において、第2妨害信号が除去される。第2妨害信号は、第2エコー34及び第2クロストーク35の程度を示す(推定された)信号である。よって、第2エコー・クロストークキャンセラ70の出力信号は、第2マイク23に入力された音声から、第2エコー34及び第2クロストーク35の影響が除去された音声を示す信号となる。
続いて、第2エコー・クロストークキャンセラ70の出力信号は、第1ハウリングキャンセラ40において、第1ハウリング信号が除去される。第1ハウリング信号は、第1ハウリング30の程度を示す(推定された)信号である。よって、第1ハウリングキャンセラ40の出力信号は、第2エコー・クロストークキャンセラ70の出力信号から、第1ハウリング30の影響が除去された信号となる。この信号が第2スピーカ24に入力され音声となって出力される。
よって、第2スピーカ24から出力される音声は、第2マイク23に入力された音声のうち、第2エコー34、第2クロストーク35及び第1ハウリング30の影響が除去された音声、つまり、音響的雑音が除去された第2話者12の音声だけとなる。
なお、音響的雑音が除去される程度は、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70に保持された伝達関数の精度、上記式3、式6、式9及び式12に示される伝達関数の更新式におけるパラメータ等に依存するのは言うまでもない。
[1−4.効果等]
以上のように、本実施の形態における双方向会話補助装置20は、第1マイク21及び第1エコー・クロストークキャンセラ50を備える。そして、双方向会話補助装置20では、第2話者12の同一時刻における音声について、信号が第1エコー・クロストークキャンセラ50に入力される時刻は、第2話者12の音声が第1マイク21に入力される時刻と同一、又は、より早くなるように、設計されている。よって、第1エコー・クロストークキャンセラ50は、第2スピーカ24から出力された音声が第1マイク21に回り込んで入力される第1エコー31だけでなく、第2話者12の音声が第1マイク21に入力される第1クロストーク32をも推定して、第1マイク21の出力信号から除去する。
これにより、例えば音源分離技術を使って、第1マイク21に入力される第1話者11の音声と第2話者12の音声(第1クロストーク32)とを分離して第1話者11の音声だけを抽出することなく、第1マイク21の出力信号から第1エコー31及び第1クロストーク32による音響的雑音が除去される。そのため、ハードウェアを増加することなく、第1クロストーク32による音声が第2話者12側の第1スピーカ22から拡声されてしまうことが抑制される。
同様に、本実施の形態における双方向会話補助装置20は、第2マイク23及び第2エコー・クロストークキャンセラ70を備える。そして、双方向会話補助装置20では、第1話者11の同一時刻における音声について、信号が第2エコー・クロストークキャンセラ70に入力される時刻は、第1話者11の音声が第2マイク23に入力される時刻と同一、又は、より早くなるように、設計されている。よって、第2エコー・クロストークキャンセラ70は、第1スピーカ22から出力された音声が第2マイク23に回り込んで入力される第2エコー34だけでなく、第1話者11の音声が第2マイク23に入力される第2クロストーク35をも推定して、第2マイク23の出力信号から除去する。
これにより、例えば音源分離技術を使って、第2マイク23に入力される第2話者12の音声と第1話者11の音声(第2クロストーク35)とを分離して第2話者12の音声だけを抽出することなく、第2マイク23の出力信号から第2エコー34及び第2クロストーク35による音響的雑音が除去される。そのため、ハードウェアを増加することなく、第2クロストーク35による音声が第1話者11側の第2スピーカ24から拡声されてしまうことが抑制される。
また、本実施の形態における双方向会話補助装置20は、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70を備える。
一般に、第1話者11側に設置される第1マイク21と第2スピーカ24との距離は、第1話者11の音声を処理する第1マイク21と第1スピーカ22との距離よりも小さく、同様に、第2話者12側に設置される第2マイク23と第1スピーカ22との距離は、第2話者12の音声を処理する第2マイク23と第2スピーカ24との距離よりも小さい。
よって、本実施の形態における双方向会話補助装置20では、第1マイク21に入力された音声に対して、まず、第1エコー・クロストークキャンセラ50で第1エコー31と第1クロストーク32とが除去され、次に、第2ハウリングキャンセラ60で第2ハウリング33が除去される。同様に、第2マイク23に入力された音声に対して、まず、第2エコー・クロストークキャンセラ70で第2エコー34と第2クロストーク35とが除去され、次に、第1ハウリングキャンセラ40で第1ハウリング30が除去される。
このように、距離が近くて音響結合の強い第2スピーカ24から第1マイク21への第1エコー31と、第1スピーカ22から第2マイク23への第2エコー34がそれぞれ第1エコー・クロストークキャンセラ50と第2エコー・クロストークキャンセラ70とによって最初に除去される。これにより、第1マイク21及び第2マイク23に入力される最も強い第1エコー31と第2エコー34とが最初に除去されるために、第1エコー・クロストークキャンセラ50の後段に位置する第2ハウリングキャンセラ60による第2ハウリング33の除去と、第2エコー・クロストークキャンセラ70の後段に位置する第1ハウリングキャンセラ40による第1ハウリング30の除去が容易になる。そのため、音響的雑音の効率的な除去が可能になる。
さらに、このようなエコーの除去に加えて、第1マイク21に入力された音声に対して、第1エコー・クロストークキャンセラ50によって第1クロストーク32が除去され、第2ハウリングキャンセラ60よって第2ハウリング33が除去される。同様に、第2マイク23に入力された音声に対して、第2エコー・クロストークキャンセラ70によって第2クロストーク35が除去され、第1ハウリングキャンセラ40によって第1ハウリング30が除去され、第1マイク21及び第2マイク23に入力される不要な信号が全て除去される。そのため、ハウリング、エコー及びクロストークを起こすことなく、車内のような同一空間において、音響的雑音を除去した状態で、双方向に音声を拡声することが可能になる。
また、本実施の形態における双方向会話補助装置20では、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70に畳み込み演算器が設けられているので、周波数領域ではなく、時間軸領域で音響的雑音を除去する信号処理が行われ、高速フーリエ変換(FFT:Fast Fourier Transform)等の処理が不要となり、その結果、高速な信号処理によって確実に音響的雑音が除去される。
[1−5.変形例]
上記実施の形態では、第1伝達関数更新回路45は、上記式3に従って伝達関数を更新したが、以下の式13又は式14に示されるように、正規化された式に従って伝達関数を更新してもよい。
Figure 2017064839
ここで、Nは、第1伝達関数記憶回路44に記憶される伝達関数の個数である。|x1(t−i−τ1)|は、x1(t−i−τ1)の絶対値である。
Figure 2017064839
これにより、第1伝達関数更新回路45による推定伝達関数の更新が、入力信号x1(t−j)の振幅に依存せず、安定して実施される。
同様に、第2伝達関数更新回路55は、上記式6に従って伝達関数を更新したが、以下の式15又は式16に示されるように、正規化された式に従って伝達関数を更新してもよい。
Figure 2017064839
ここで、Nは、第2伝達関数記憶回路54に記憶される伝達関数の個数である。|x2(t−i)|は、x2(t−i)の絶対値である。
Figure 2017064839
これにより、第2伝達関数更新回路55による推定伝達関数の更新が、入力信号x2(t−j)の振幅に依存せず、安定して実施される。
同様に、第3伝達関数更新回路65は、上記式9に従って伝達関数を更新したが、以下の式17又は式18に示されるように、正規化された式に従って伝達関数を更新してもよい。
Figure 2017064839
ここで、Nは、第3伝達関数記憶回路64に記憶される伝達関数の個数である。|x3(t−i−τ3)|は、x3(t−i−τ3)の絶対値である。
Figure 2017064839
これにより、第3伝達関数更新回路65による推定伝達関数の更新が、入力信号x3(t−j)の振幅に依存せず、安定して実施される。
同様に、第4伝達関数更新回路75は、上記式12に従って伝達関数を更新したが、以下の式19又は式20に示されるように、正規化された式に従って伝達関数を更新してもよい。
Figure 2017064839
ここで、Nは、第4伝達関数記憶回路74に記憶される伝達関数の個数である。|x4(t−i−τ)|は、x4(t−i−τ)の絶対値である。
Figure 2017064839
これにより、第4伝達関数更新回路75による推定伝達関数の更新が、入力信号x4(t−j)の振幅に依存せず、安定して実施される。
また、上記実施の形態は、双方向会話補助装置であったが、以下のような双方向会話補助方法であってもよい。
つまり、会話システムにおいて第1話者11と第2話者12による双方向の会話を拡声して補助する双方向会話補助方法であって、会話システムは、第1話者11の音声を入力するための第1マイク21と、第1話者11の音声を出力するための第1スピーカ22と、第2話者12の音声を入力するための第2マイク23と、第2話者12の音声を出力するための第2スピーカ24とを備える。双方向会話補助方法は、第1ハウリングキャンセルステップと、第1エコー・クロストークキャンセルステップと、第2ハウリングキャンセルステップと、第2エコー・クロストークキャンセルステップと、を含む。
第1ハウリングキャンセルステップでは、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される第1ハウリング30の程度を示す第1ハウリング信号を推定して算出し、算出した第1ハウリング信号を、第2マイク23からの信号から除去し、除去後の信号を第2スピーカ24に出力する。ここで、第2マイク23からの信号は第2エコー・クロストークキャンセルステップで得られた信号である。
第1エコー・クロストークキャンセルステップでは、第2スピーカ24に入力される信号を用いて、第2スピーカ24から出力された音声が第1マイク21に回り込んで入力される第1エコー31、及び、第2話者12の音声が第1マイク21に入力される第1クロストーク32の程度を示す第1妨害信号を推定して算出し、算出した第1妨害信号を、第1マイク21の出力信号から除去する。ここで、第2スピーカ24に入力される信号は、第1ハウリングキャンセルステップで得られた信号である。
第2ハウリングキャンセルステップでは、第1スピーカ22から出力された音声が第1マイク21に帰還して入力される第2ハウリング33の程度を示す第2ハウリング信号を推定して算出し、算出した第2ハウリング信号を、第1マイク21からの信号から除去し、除去後の信号を第1スピーカ22に出力する。ここで、第1マイク21からの信号は第1エコー・クロストークキャンセルステップで得られた信号である。
第2エコー・クロストークキャンセルステップでは、第1スピーカ22に入力される信号を用いて、第1スピーカ22から出力された音声が第2マイク23に回り込んで入力される第2エコー34、及び、第1話者11の音声が第2マイク23に入力される第2クロストーク35の程度を示す第2妨害信号を推定して算出し、算出した第2妨害信号を、第2マイク23の出力信号から除去する。ここで、第1スピーカ22に入力される信号は、第2ハウリングキャンセルステップで得られた信号である。
このような双方向会話補助方法は、例えば、プログラムを実行するプロセッサによって行われる。つまり、上記実施の形態における第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70は、プログラムを実行するプロセッサによって実現されてもよい。そのプロセッサには、DSP(Digital Signal Processor)、CPU(Central Processing Unit)、MPU(Micro−Processing Unit)、及び、マイクロプロセッサが含まれる。
また、このような双方向会話補助方法は、CD−ROM等のコンピュータ読み取り可能な記録媒体に記録されるプログラム、及び、そのプログラムが記録された記録媒体で実現されてもよい。
(実施の形態2)
次に、実施の形態2における双方向会話補助装置について説明する。本実施の形態における双方向会話補助装置は、実施の形態1における双方向会話補助装置と同様に、第1話者と第2話者による双方向の会話を拡声して補助する装置であるが、実施の形態1における第2ハウリング33、第2エコー34及び第2クロストーク35が無視できる程度に小さい場合に、好適な装置である。
[2−1.構成]
図3は、実施の形態2における双方向会話補助装置20aの構成を示すブロック図である。この双方向会話補助装置20aは、実施の形態1における双方向会話補助装置20の構成から、第2ハウリングキャンセラ60及び第2エコー・クロストークキャンセラ70を除外した構成に相当する。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
この双方向会話補助装置20aは、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、第1ハウリングキャンセラ40、及び、第1エコー・クロストークキャンセラ50を備える。いずれの構成要素も、実施の形態1における対応する構成要素と同一である。
ただし、この双方向会話補助装置20aでは、実施の形態1における第2ハウリングキャンセラ60及び第2エコー・クロストークキャンセラ70が備えられていないので、第1エコー・クロストークキャンセラ50の出力信号は第1スピーカ22に入力され、第2マイク23の出力信号は第1ハウリングキャンセラ40に入力される。
また、第2話者12が使用する第1スピーカ22及び第2マイク23は、典型的には、第2話者12の頭部に装着されるヘッドセットである。
[2−2.動作]
このような構成を備える本実施の形態における双方向会話補助装置20aは、実施の形態1における双方向会話補助装置20と比較して、第1ハウリングキャンセラ40及び第1エコー・クロストークキャンセラ50を備えるが、第2ハウリングキャンセラ60及び第2エコー・クロストークキャンセラ70を備えない。よって、この双方向会話補助装置20aは、実施の形態1における双方向会話補助装置20が有する音響的雑音の除去機能のうち、第1ハウリング30、第1エコー31及び第1クロストーク32の除去機能を有し、第2ハウリング33、第2エコー34及び第2クロストーク35の除去機能を有しない。
本実施の形態では、第2話者12が使用する第1スピーカ22及び第2マイク23がヘッドセットであるので、第1スピーカ22が第2話者12の耳に密着して装着され、その結果、第1スピーカ22からの音漏れが少ない。よって、実施の形態1における第2ハウリング33及び第2エコー34を無視し得る。また、第2マイク23が第2話者12の口元に保持されることから、第1話者11の音声が第2マイク23に入力される第2クロストーク35の影響も無視し得る。
[2−3.効果等]
本実施の形態における双方向会話補助装置20aは、第2話者12が使用する第1スピーカ22及び第2マイク23がヘッドセットである場合に必要となる最低限の音響的雑音(第1ハウリング30、第1エコー31及び第1クロストーク32)の除去機能だけを有するので、実施の形態1と比べて、少ない構成要素で、つまり、安価で、かつ、コンパクトな構成で、必要最低限の音響的雑音を除去することができる。
なお、本実施の形態も、実施の形態1と同様に、双方向会話補助方法及びプログラムとして実現されてもよい。そのような双方向会話補助方法は、上述した第1ハウリングキャンセルステップと、第1エコー・クロストークキャンセルステップとを含む。
(実施の形態3)
次に、実施の形態3における双方向会話補助装置について説明する。本実施の形態における双方向会話補助装置は、実施の形態1における双方向会話補助装置と同様に、第1話者と第2話者による双方向の会話を拡声して補助する装置であるが、実施の形態1における第1ハウリング30、第2ハウリング33、第2エコー34及び第2クロストーク35が無視できる程度に小さい場合に、好適な装置である。
[3−1.構成]
図4は、実施の形態3における双方向会話補助装置20bの構成を示すブロック図である。この双方向会話補助装置20bは、実施の形態1における双方向会話補助装置20の構成から、第1ハウリングキャンセラ40、第2ハウリングキャンセラ60及び第2エコー・クロストークキャンセラ70を除外した構成、言い換えると、実施の形態2における双方向会話補助装置20aの構成から、第1ハウリングキャンセラ40を除外した構成に相当する。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
この双方向会話補助装置20bは、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、及び、第1エコー・クロストークキャンセラ50を備える。いずれの構成要素も、実施の形態1における対応する構成要素と同一である。
ただし、この双方向会話補助装置20bでは、実施の形態1における第1ハウリングキャンセラ40、第2ハウリングキャンセラ60及び第2エコー・クロストークキャンセラ70が備えられていないので、第1エコー・クロストークキャンセラ50の出力信号は第1スピーカ22に入力され、第2マイク23の出力信号は第2スピーカ24及び第1エコー・クロストークキャンセラ50に入力される。
また、第2話者12が使用する第1スピーカ22及び第2マイク23は、典型的には、第2話者12の頭部に装着されるヘッドセットである。さらに、第2マイク23と第2スピーカ24とは、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される第1ハウリング30が無視できる程度に小さい環境に設置されている。例えば、第2スピーカ24は、第2マイク23が存在する方向とは反対の方向に向けて音声を出力する位置に設けられている(あるいは、そのような音声出力の指向特性を有する)。
[3−2.動作]
このような構成を備える本実施の形態における双方向会話補助装置20bは、実施の形態1における双方向会話補助装置20と比較して、第1エコー・クロストークキャンセラ50を備えるが、第1ハウリングキャンセラ40、第2ハウリングキャンセラ60及び第2エコー・クロストークキャンセラ70を備えない。よって、この双方向会話補助装置20bは、実施の形態1における双方向会話補助装置20が有する音響的雑音の除去機能のうち、第1エコー31及び第1クロストーク32の除去機能を有し、第1ハウリング30、第2ハウリング33、第2エコー34及び第2クロストーク35の除去機能を有しない。
本実施の形態では、第2話者12が使用する第1スピーカ22及び第2マイク23がヘッドセットであるので、第1スピーカ22が第2話者12の耳に密着して装着され、その結果、第1スピーカ22からの音漏れが少ない。よって、実施の形態1における第2ハウリング33及び第2エコー34を無視し得る。また、第2マイク23が第2話者12の口元に保持されることから、第1話者11の音声が第2マイク23に入力される第2クロストーク35の影響も無視し得る。さらに、第2マイク23と第2スピーカ24とは、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される第1ハウリング30が無視できる程度に小さい環境に設置されている。
[3−3.効果等]
本実施の形態における双方向会話補助装置20bは、第2話者12が使用する第1スピーカ22及び第2マイク23がヘッドセットであり、かつ、第2マイク23と第2スピーカ24とが第1ハウリング30が無視できる程度に音響結合が小さい環境に設置されている場合に必要となる最低限の音響的雑音(第1エコー31及び第1クロストーク32)の除去機能だけを有する。そのため、実施の形態1及び2と比べて、少ない構成要素で、つまり、安価で、かつ、コンパクトな構成で、必要最低限の音響的雑音を除去することができる。
なお、本実施の形態も、実施の形態1と同様に、双方向会話補助方法及びプログラムとして実現されてもよい。そのような双方向会話補助方法は、上述した第1エコー・クロストークキャンセルステップを含む。
(実施の形態4)
次に、実施の形態4における双方向会話補助装置について説明する。本実施の形態における双方向会話補助装置は、実施の形態1における双方向会話補助装置と同様に、第1話者と第2話者による双方向の会話を拡声して補助する装置であるが、実施の形態1における第1ハウリング30及び第2ハウリング33が無視できる程度に小さい場合に、好適な装置である。
[4−1.構成]
図5は、実施の形態4における双方向会話補助装置20cの構成を示すブロック図である。この双方向会話補助装置20cは、実施の形態1における双方向会話補助装置20の構成から、第1ハウリングキャンセラ40及び第2ハウリングキャンセラ60を除外した構成に相当する。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
この双方向会話補助装置20cは、第1マイク21、第1スピーカ22、第2マイク23、第2スピーカ24、第1エコー・クロストークキャンセラ50及び第2エコー・クロストークキャンセラ70を備える。いずれの構成要素も、実施の形態1における対応する構成要素と同一である。
ただし、この双方向会話補助装置20cでは、実施の形態1における第1ハウリングキャンセラ40及び第2ハウリングキャンセラ60が備えられていないので、第1エコー・クロストークキャンセラ50の出力信号は第1スピーカ22及び第2エコー・クロストークキャンセラ70に入力され、第2エコー・クロストークキャンセラ70の出力信号は第2スピーカ24及び第1エコー・クロストークキャンセラ50に入力される。
また、第1マイク21と第1スピーカ22とは、第1スピーカ22から出力された音声が第1マイク21に帰還して入力される第2ハウリング33が無視できる程度に小さい環境に設置されている。例えば、第1スピーカ22は、第1マイク21が存在する方向とは反対の方向に向けて音声を出力する位置に設けられている(あるいは、そのような音声出力の指向特性を有する)。
同様に、第2マイク23と第2スピーカ24とは、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される第1ハウリング30が無視できる程度に小さい環境に設置されている。例えば、第2スピーカ24は、第2マイク23が存在する方向とは反対の方向に向けて音声を出力する位置に設けられている(あるいは、そのような音声出力の指向特性を有する)。
[4−2.動作]
このような構成を備える本実施の形態における双方向会話補助装置20cは、実施の形態1における双方向会話補助装置20と比較して、第1エコー・クロストークキャンセラ50及び第2エコー・クロストークキャンセラ70を備えるが、第1ハウリングキャンセラ40及び第2ハウリングキャンセラ60を備えない。よって、この双方向会話補助装置20cは、実施の形態1における双方向会話補助装置20が有する音響的雑音の除去機能のうち、第1エコー31、第1クロストーク32、第2エコー34及び第2クロストーク35の除去機能を有し、第1ハウリング30及び第2ハウリング33の除去機能を有しない。
本実施の形態では、第1マイク21と第1スピーカ22とは、第1スピーカ22から出力された音声が第1マイク21に帰還して入力される第2ハウリング33が無視できる程度に小さい環境に設置されている。さらに、第2マイク23と第2スピーカ24とは、第2スピーカ24から出力された音声が第2マイク23に帰還して入力される第1ハウリング30が無視できる程度に小さい環境に設置されている。
[4−3.効果等]
本実施の形態における双方向会話補助装置20cは、第1マイク21と第1スピーカ22とが第2ハウリング33が無視できる程度に音響結合が小さい環境に設置され、かつ、第2マイク23と第2スピーカ24とが第1ハウリング30が無視できる程度に音響結合が小さい環境に設置されている場合に必要となる最低限の音響的雑音(第1エコー31、第1クロストーク32、第2エコー34及び第2クロストーク35)の除去機能だけを有する。そのため、実施の形態1と比べて、少ない構成要素で、つまり、安価で、かつ、コンパクトな構成で、必要最低限の音響的雑音を除去することができる。
なお、本実施の形態も、実施の形態1と同様に、双方向会話補助方法及びプログラムとして実現されてもよい。そのような双方向会話補助方法は、上述した第1エコー・クロストークキャンセルステップと、第2エコー・クロストークキャンセルステップとを含む。
(実施の形態5)
次に、実施の形態5における双方向会話補助装置について説明する。本実施の形態における双方向会話補助装置は、実施の形態1における双方向会話補助装置と同様に、第1話者と第2話者による双方向の会話を拡声して補助する装置であるが、その拡声機能に加えて、ラジオ、TV及びミュージックプレーヤ等の音響再生器からの音響を第1話者及び第2話者に出力する機能も有する。
[5−1.構成]
図6は、実施の形態5における双方向会話補助装置20dの構成を示すブロック図である。この双方向会話補助装置20dは、実施の形態1における双方向会話補助装置20の構成に加えて、音響再生器100、第1ビームフォーマ102、第2ビームフォーマ106、第1ノイズ抑圧器104、第2ノイズ抑圧器108、第1音響キャンセラ150及び第2音響キャンセラ170を備える。以下、実施の形態1と同じ構成要素については、実施の形態1と同じ符号を付し、その説明を省略する。
第1ビームフォーマ102は、複数のマイクで構成される第1マイク21から入力される音声の指向特性を目的とする方向(第1話者11の口元)に定める音響ビームフォーミングを行う回路である。
第2ビームフォーマ106は、複数のマイクで構成される第2マイク23から入力される音声の指向特性を目的とする方向(第2話者12の口元)に定める音響ビームフォーミングを行う回路である。
第1ノイズ抑圧器104は、第1マイク21に飛び込んだ外来ノイズを除去する回路であり、第2ハウリングキャンセラ60の出力信号から音声以外の信号成分を除去する。
第2ノイズ抑圧器108は、第2マイク23に飛び込んだ外来ノイズを除去する回路であり、第1ハウリングキャンセラ40の出力信号から音声以外の信号成分を除去する。
音響再生器100は、第1話者11及び第2話者12に提供する音響の音源であり、例えば、ラジオ、TV及びミュージックプレーヤ等である。
第1音響キャンセラ150は、第2ノイズ抑圧器108の出力信号に音響再生器100の出力信号(音響信号)を加算して第2スピーカ24に出力するとともに、第1ビームフォーマ102の出力信号から、第2スピーカ24から出力された音響が第1マイク21に回り込んで入力される第1音響エコーの程度を示す第1音響エコー信号を推定して算出する。そして、算出した第1音響エコー信号を、第1ビームフォーマ102の出力信号から除去し、除去後の信号を第1エコー・クロストークキャンセラ50に出力する回路である。
この第1音響キャンセラ150は、第5伝達関数記憶回路154、第5記憶回路152、第5畳み込み演算器153、第5減算器151、第5伝達関数更新回路155、及び、第1加算器156を有する。この構成は、実施の形態1で説明した第1エコー・クロストークキャンセラ50の構成に、第1加算器156を加えたものに相当する。
第1音響キャンセラ150の各構成要素(第5伝達関数記憶回路154、第5記憶回路152、第5畳み込み演算器153、第5減算器151、第5伝達関数更新回路155)は、第1エコー・クロストークキャンセラ50の対応する構成要素と同様の機能を有する。
ただし、第5記憶回路152は、音響再生器100の出力信号(音響信号)を記憶する。また、第5畳み込み演算器153は、上述した第1音響エコー信号を生成する。
さらに、第1加算器156は、第2ノイズ抑圧器108の出力信号に音響再生器100の出力信号(音響信号)を加算して第2スピーカ24に出力する。
第2音響キャンセラ170は、第1ノイズ抑圧器104の出力信号に音響再生器100の出力信号(音響信号)を加算して第1スピーカ22に出力するとともに、第2ビームフォーマ106の出力信号から、第1スピーカ22から出力された音響が第2マイク23に回り込んで入力される第2音響エコーの程度を示す第2音響エコー信号を推定して算出する。そして、算出した第2音響エコー信号を、第2ビームフォーマ106の出力信号から除去し、除去後の信号を第2エコー・クロストークキャンセラ70に出力する回路である。
この第2音響キャンセラ170は、第6伝達関数記憶回路174、第6記憶回路172、第6畳み込み演算器173、第6減算器171、第6伝達関数更新回路175、及び、第2加算器176を有する。この構成は、実施の形態1で説明した第2エコー・クロストークキャンセラ70の構成に、第2加算器176を加えたものに相当する。
第2音響キャンセラ170の各構成要素(第6伝達関数記憶回路174、第6記憶回路172、第6畳み込み演算器173、第6減算器171、第6伝達関数更新回路175)は、第2エコー・クロストークキャンセラ70の対応する構成要素と同様の機能を有する。
ただし、第6記憶回路172は、音響再生器100の出力信号(音響信号)を記憶する。また、第6畳み込み演算器173は、上述した第2音響エコー信号を生成する。
さらに、第2加算器176は、第1ノイズ抑圧器104の出力信号に音響再生器100の出力信号(音響信号)を加算して第1スピーカ22に出力する。
[5−2.動作及び効果等]
このような構成を備える本実施の形態における双方向会話補助装置20dは、実施の形態1における双方向会話補助装置20の構成に加えて、第1音響キャンセラ150及び第2音響キャンセラ170を備えるので、実施の形態1における双方向会話補助装置20の機能に加えて、音響再生器100からの音響が、音響エコー信号が除去された状態で、第1話者11及び第2話者12に提供される。
さらに、本実施の形態における双方向会話補助装置20dは、第1ビームフォーマ102、第2ビームフォーマ106、第1ノイズ抑圧器104及び第2ノイズ抑圧器108を備えるので、第1話者11及び第2話者12以外の外来ノイズが抑圧されたクリアな会話が拡声される。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態1〜5及び変形例を説明した。しかしながら、本開示における技術は、これらに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1〜5及び変形例で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施の形態を例示する。
例えば、実施の形態5における双方向会話補助装置20dは、実施の形態1における双方向会話補助装置20に、付加的な構成(音響再生器100、第1ビームフォーマ102、第2ビームフォーマ106、第1ノイズ抑圧器104、第2ノイズ抑圧器108、第1音響キャンセラ150及び第2音響キャンセラ170)が追加されたが、これらの付加的な構成は、実施の形態2〜4のいずれかにおける双方向会話補助装置に対して追加されてもよい。
また、これらの付加的な構成(音響再生器100、第1ビームフォーマ102、第2ビームフォーマ106、第1ノイズ抑圧器104、第2ノイズ抑圧器108、第1音響キャンセラ150及び第2音響キャンセラ170)は、一部の構成だけ(例えば、第1ビームフォーマ102及び第2ビームフォーマ106だけ)が実施の形態1〜4のいずれかに追加されてもよい。例えば、実施の形態1における双方向会話補助装置20に、第1音響キャンセラ150及び第2音響キャンセラ170だけが追加される場合、第1音響キャンセラ150の第5減算器151には第1マイク21の出力信号が入力され、第2音響キャンセラ170の第6減算器171には第2マイク23の出力信号が直接入力される。また、第1音響キャンセラ150の第1加算器156には第2マイク23からの信号として第1ハウリングキャンセラ40の出力信号が入力され、第2音響キャンセラ170の第2加算器176には第1マイク21からの信号として第2ハウリングキャンセラ60の出力信号が入力される。
また、実施の形態1〜5では、双方向会話補助装置は、車室内会話補助装置として適用された例が示されたが、このような適用例に限られず、会議室等における部屋内会話補助装置として適用したり、運転者とドライブスルーの店員との会話を補助する装置として適用したりしてもよい。本開示における双方向会話補助装置によれば、双方向会話におけるクロストークが除去されるので、クロストークが発生し易い環境での会話(例えば、同一空間での会話)を補助する装置として、本開示における双方向会話補助装置は好適である。
また、実施の形態1〜5では、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70が有する畳み込み演算器は、いずれも、NタップのFIRフィルタを例として、畳み込み演算を行ったが、それぞれが異なるタップ数の異なるタイプのデジタルフィルタであってもよい。つまり、いかなる種類のデジタルフィルタにするかは、キャンセルする音響的雑音の伝達関数等に依存して適宜、独立して設計してもよい。
また、実施の形態1〜5では、第1ハウリングキャンセラ40、第1エコー・クロストークキャンセラ50、第2ハウリングキャンセラ60、及び、第2エコー・クロストークキャンセラ70が有する伝達関数更新回路による伝達関数の更新アルゴリズムは、上記式3、式6、式9、式12に示されるように、同一のアルゴリズムであってもよいし、同一のアルゴリズムであるがステップサイズパラメータが異なってもよいし、異なるアルゴリズムであってもよい。つまり、伝達関数の更新アルゴリズムは、キャンセルする音響的雑音の大きさ等に依存して適宜、独立して設計してもよい。
また、実施の形態1、5の双方向会話補助装置では、マイクから入力された音声信号に対し、エコーとクロストークの除去を行った後、ハウリングを除去するような構成としていたが、ハウリングを除去した後、エコーとクロストークの除去を行うような構成にしてもよい。即ち、第1エコー・クロストークキャンセラ50と第2ハウリングキャンセラ60との順序、及び、第2エコー・クロストークキャンセラ70と第1ハウリングキャンセラ40との順序は、それぞれ入れ替えることができる。この場合も、実施の形態1、5の双方向会話補助装置と同等の効果が得られる。
また、実施の形態5では、第1音響エコー信号を、第1ビームフォーマ102の出力信号から除去する例を示したが、第1エコー・クロストークキャンセラ50または第2ハウリングキャンセラ60の出力信号から除去してもよい。同様に、第2音響エコー信号についても、第2エコー・クロストークキャンセラ70または第1ハウリングキャンセラ40の出力信号から除去してもよい。
また、上記実施の形態では、双方向会話補助装置が備えるマイク及びスピーカの例として、車に組み込まれたタイプ、車に取り付けられたタイプ、ヘッドセット等が挙げられたが、これらに限られず、スマートフォン等の携帯型情報端末が有するマイク及び/又はスピーカであってもよい。例えば、車における後部乗員の音声を第2マイク23としてのスマートフォンで収音し、無線でヘッドユニット(双方向会話補助装置)に送信し、第2スピーカ24としての前部スピーカから、ハウリング、エコー及びクロストークを抑制した状態で拡声する。また、第1マイク21としての前部マイクで収音した運転者の音声を無線で後部乗員のスマートフォンに送信し、第1スピーカ22としてのスマートフォンのスピーカから、ハウリング、エコー及びクロストークを抑制した状態で拡声する。これにより、後部乗員がスマートフォンを用いて運転者と円滑に会話できるとともに、車における後部マイクが不要となる。
また、このようなスマートフォン等の携帯型情報端末が有するマイク及び/又はスピーカを用いた双方向会話補助装置は、講演会等で用いられるPA(Public Address)システムとしても有用である。講演会における質問者の声を自身のスマートフォンで収音して無線でPAシステムに転送し、ハウリングやエコーを抑制した状態で拡声することができる。これにより、講演会において、質問者にマイクを手渡すのに要する時間が短縮され、質疑応答がスムーズに実施されて手際良い講演会の進行が可能になる。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示は、エコーだけでなくクロストークを含む音響的雑音を除去したうえで双方向の会話を拡声して補助する双方向会話補助装置に適用可能である。具体的には、車室内会話補助装置、PAシステム等に、本開示は適用可能である。
10 車
11 第1話者
12 第2話者
20,20a,20b,20c,20d 双方向会話補助装置
21 第1マイク
22 第1スピーカ
23 第2マイク
24 第2スピーカ
30 第1ハウリング
31 第1エコー
32 第1クロストーク
33 第2ハウリング
34 第2エコー
35 第2クロストーク
40 第1ハウリングキャンセラ
41 第1減算器
42 第1記憶回路
43 第1畳み込み演算器
44 第1伝達関数記憶回路
45 第1伝達関数更新回路
46 第1遅延器
50 第1エコー・クロストークキャンセラ
51 第2減算器
52 第2記憶回路
53 第2畳み込み演算器
54 第2伝達関数記憶回路
55 第2伝達関数更新回路
60 第2ハウリングキャンセラ
61 第3減算器
62 第3記憶回路
63 第3畳み込み演算器
64 第3伝達関数記憶回路
65 第3伝達関数更新回路
66 第2遅延器
70 第2エコー・クロストークキャンセラ
71 第4減算器
72 第4記憶回路
73 第4畳み込み演算器
74 第4伝達関数記憶回路
75 第4伝達関数更新回路
100 音響再生器
102 第1ビームフォーマ
104 第1ノイズ抑圧器
106 第2ビームフォーマ
108 第2ノイズ抑圧器
150 第1音響キャンセラ
151 第5減算器
152 第5記憶回路
153 第5畳み込み演算器
154 第5伝達関数記憶回路
155 第5伝達関数更新回路
156 第1加算器
170 第2音響キャンセラ
171 第6減算器
172 第6記憶回路
173 第6畳み込み演算器
174 第6伝達関数記憶回路
175 第6伝達関数更新回路
176 第2加算器

Claims (20)

  1. 第1話者と第2話者による双方向の会話を拡声して補助する双方向会話補助装置であって、
    前記第1話者の第1音声を入力するための第1マイクと、
    前記第1音声を出力するための第1スピーカと、
    前記第2話者の第2音声を入力するための第2マイクと、
    前記第2音声を出力するための第2スピーカと、
    前記第2スピーカへの入力信号を用いて、前記第2スピーカから出力された前記第2音声が前記第1マイクに入力される第1エコー、及び、前記第2音声が前記第1マイクに入力される第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した前記第1妨害信号を、前記第1マイクの出力信号から除去する第1エコー・クロストークキャンセラと、を備える、
    双方向会話補助装置。
  2. さらに、前記第2スピーカから出力された前記第2音声が前記第2マイクに入力される第1ハウリングの程度を示す第1ハウリング信号を推定して算出し、算出した前記第1ハウリング信号を、前記第2マイクの出力信号から除去する第1ハウリングキャンセラを備える、
    請求項1記載の双方向会話補助装置。
  3. さらに、
    前記第1スピーカから出力された前記第1音声が前記第1マイクに入力される第2ハウリングの程度を示す第2ハウリング信号を推定して算出し、算出した前記第2ハウリング信号を、前記第1マイクの前記出力信号から除去する第2ハウリングキャンセラと、
    前記第1スピーカへの入力信号を用いて、前記第1スピーカから出力された前記第1音声が前記第2マイクに入力される第2エコー、及び、前記第1音声が前記第2マイクに入力される第2クロストークの程度を示す第2妨害信号を推定して算出し、算出した前記第2妨害信号を、前記第2マイクの前記出力信号から除去する第2エコー・クロストークキャンセラと、を備える、
    請求項2記載の双方向会話補助装置。
  4. 前記第1話者の同一時刻における前記第1音声について、前記第1マイクの前記出力信号が前記第2エコー・クロストークキャンセラに入力される時刻は、前記第1音声が前記第2マイクに入力される時刻と同一、又は、より早く、
    前記第2話者の同一時刻における前記第2音声について、前記第2マイクの前記出力信号が前記第1エコー・クロストークキャンセラに入力される時刻は、前記第2音声が前記第1マイクに入力される時刻と同一、又は、より早い、
    請求項3記載の双方向会話補助装置。
  5. 前記第1ハウリングキャンセラは、
    前記第1ハウリングの伝達関数として推定された伝達関数を記憶する第1伝達関数記憶回路と、
    当該第1ハウリングキャンセラの出力信号を遅延させる第1遅延器と、
    前記第1遅延器から出力された信号を記憶する第1記憶回路と、
    前記第1記憶回路に記憶された前記信号と前記第1伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第1ハウリング信号を生成する第1畳み込み演算器と、
    前記第2マイクの前記出力信号から、前記第1畳み込み演算器から出力された前記第1ハウリング信号を除去し、当該第1ハウリングキャンセラの前記出力信号を出力する第1減算器と、
    前記第1減算器の前記出力信号と前記第1記憶回路に記憶された前記信号とに基づいて前記第1伝達関数記憶回路に記憶された前記伝達関数を更新する第1伝達関数更新回路と、を有する、
    請求項3記載の双方向会話補助装置。
  6. 前記第1エコー・クロストークキャンセラは、
    前記第1エコーと前記第1クロストークとを合わせた伝達関数として推定された伝達関数を記憶する第2伝達関数記憶回路と、
    前記第2マイクの前記出力信号を記憶する第2記憶回路と、
    前記第2記憶回路に記憶された前記出力信号と前記第2伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第1妨害信号を生成する第2畳み込み演算器と、
    前記第1マイクの出力信号から、前記第2畳み込み演算器から出力された前記第1妨害信号を除去し、当該第1エコー・クロストークキャンセラの出力信号を出力する第2減算器と、
    前記第2減算器の前記出力信号と前記第2記憶回路に記憶された前記出力信号とに基づいて前記第2伝達関数記憶回路に記憶された前記伝達関数を更新する第2伝達関数更新回路と、を有する、
    請求項5記載の双方向会話補助装置。
  7. 前記第2ハウリングキャンセラは、
    前記第2ハウリングの伝達関数として推定された伝達関数を記憶する第3伝達関数記憶回路と、
    当該第2ハウリングキャンセラの出力信号を遅延させる第2遅延器と、
    前記第2遅延器から出力された信号を記憶する第3記憶回路と、
    前記第3記憶回路に記憶された前記信号と前記第3伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第2ハウリング信号を生成する第3畳み込み演算器と、
    前記第1マイクの前記出力信号から、前記第3畳み込み演算器から出力された前記第2ハウリング信号を除去し、当該第2ハウリングキャンセラの前記出力信号を出力する第3減算器と、
    前記第3減算器の前記出力信号と前記第3記憶回路に記憶された前記信号とに基づいて前記第3伝達関数記憶回路に記憶された前記伝達関数を更新する第3伝達関数更新回路と、を有する、
    請求項6記載の双方向会話補助装置。
  8. 前記第2エコー・クロストークキャンセラは、
    前記第2エコーと前記第2クロストークとを合わせた伝達関数として推定された伝達関数を記憶する第4伝達関数記憶回路と、
    前記第1マイクの前記出力信号を記憶する第4記憶回路と、
    前記第4記憶回路に記憶された前記出力信号と前記第4伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第2妨害信号を生成する第4畳み込み演算器と、
    前記第2マイクの出力信号から、前記第4畳み込み演算器から出力された前記第2妨害信号を除去し、当該第2エコー・クロストークキャンセラの出力信号を出力する第4減算器と、
    前記第4減算器の前記出力信号と前記第4記憶回路に記憶された前記出力信号とに基づいて前記第4伝達関数記憶回路に記憶された前記伝達関数を更新する第4伝達関数更新回路と、を有する、
    請求項7記載の双方向会話補助装置。
  9. 前記第1伝達関数更新回路は、独立成分分析を用いて、前記第1減算器の前記出力信号と前記第1記憶回路に記憶された前記信号とに基づいて、前記第1減算器の前記出力信号と前記第1記憶回路に記憶された前記信号とが相互に独立となるように、前記第1伝達関数記憶回路に記憶された前記伝達関数を更新し、
    前記第2伝達関数更新回路は、独立成分分析を用いて、前記第2減算器の前記出力信号と前記第2記憶回路に記憶された前記出力信号とに基づいて、前記第2減算器の前記出力信号と前記第2記憶回路に記憶された前記出力信号とが相互に独立となるように、前記第2伝達関数記憶回路に記憶された前記伝達関数を更新し、
    前記第3伝達関数更新回路は、独立成分分析を用いて、前記第3減算器の前記出力信号と前記第3記憶回路に記憶された前記信号とに基づいて、前記第3減算器の前記出力信号と前記第3記憶回路に記憶された前記信号とが相互に独立となるように、前記第3伝達関数記憶回路に記憶された前記伝達関数を更新し、
    前記第4伝達関数更新回路は、独立成分分析を用いて、前記第4減算器の前記出力信号と前記第4記憶回路に記憶された前記出力信号とに基づいて、前記第4減算器の前記出力信号と前記第4記憶回路に記憶された前記出力信号とが相互に独立となるように、前記第4伝達関数記憶回路に記憶された前記伝達関数を更新する、
    請求項8記載の双方向会話補助装置。
  10. 前記第1伝達関数更新回路は、前記第1減算器の前記出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して前記第1記憶回路に記憶された前記信号と、前記第1ハウリングの前記伝達関数の推定における学習速度を制御するための第1ステップサイズパラメータとを乗じることで第1更新係数を算出し、算出した前記第1更新係数を前記第1伝達関数記憶回路に記憶された前記伝達関数に加算することで更新を行い、
    前記第2伝達関数更新回路は、前記第2減算器の前記出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して前記第2記憶回路に記憶された前記出力信号と、前記第1エコーと前記第1クロストークとを合わせた前記伝達関数の推定における学習速度を制御するための第2ステップサイズパラメータとを乗じることで第2更新係数を算出し、算出した前記第2更新係数を前記第2伝達関数記憶回路に記憶された前記伝達関数に加算することで更新を行い、
    前記第3伝達関数更新回路は、前記第3減算器の前記出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して前記第3記憶回路に記憶された前記信号と、前記第2ハウリングの前記伝達関数の推定における学習速度を制御するための第3ステップサイズパラメータとを乗じることで第3更新係数を算出し、算出した前記第3更新係数を前記第3伝達関数記憶回路に記憶された前記伝達関数に加算することで更新を行い、
    前記第4伝達関数更新回路は、前記第4減算器の前記出力信号に対して非線形関数を用いた非線形処理を施し、得られた結果に対して前記第4記憶回路に記憶された前記出力信号と、前記第2エコーと前記第2クロストークとを合わせた前記伝達関数の推定における学習速度を制御するための第4ステップサイズパラメータとを乗じることで第4更新係数を算出し、算出した前記第4更新係数を前記第4伝達関数記憶回路に記憶された前記伝達関数に加算することで更新を行う、
    請求項9記載の双方向会話補助装置。
  11. 前記第1伝達関数更新回路、前記第2伝達関数更新回路、前記第3伝達関数更新回路及び前記第4伝達関数更新回路が用いる前記非線形関数は、シグモイド関数、双曲線正接関数、正規化線形関数又は符号関数である、
    請求項10記載の双方向会話補助装置。
  12. さらに、前記第1スピーカへの入力信号を用いて、前記第1スピーカから出力された前記第1音声が前記第2マイクに入力される第2エコー、及び、前記第1音声が前記第2マイクに入力される第2クロストークの程度を示す第2妨害信号を推定して算出し、算出した前記第2妨害信号を、前記第2マイクの出力信号から除去する第2エコー・クロストークキャンセラを備える、
    請求項1記載の双方向会話補助装置。
  13. さらに、
    音響信号を用いて、前記第2スピーカから出力された音響が前記第1マイクに入力される第1音響エコーの程度を示す第1音響エコー信号を推定して算出し、算出した前記第1音響エコー信号を、前記第1マイクの前記出力信号から除去する第1音響キャンセラと、
    前記音響信号を用いて、前記第1スピーカから出力された前記音響が前記第2マイクに入力される第2音響エコーの程度を示す第2音響エコー信号を推定して算出し、算出した前記第2音響エコー信号を、前記第2マイクの前記出力信号から除去する第2音響キャンセラと、を備える、
    請求項3記載の双方向会話補助装置。
  14. 前記第1音響キャンセラは、
    前記第1音響エコーの伝達関数として推定された伝達関数を記憶する第5伝達関数記憶回路と、
    前記音響信号を記憶する第5記憶回路と、
    前記第5記憶回路に記憶された前記音響信号と前記第5伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第1音響エコー信号を生成する第5畳み込み演算器と、
    前記第1マイクの前記出力信号から、前記第5畳み込み演算器から出力された前記第1音響エコー信号を除去し、前記第1音響キャンセラの出力信号を出力する第5減算器と、
    前記第5減算器の前記出力信号と前記第5記憶回路に記憶された前記音響信号とに基づいて前記第5伝達関数記憶回路に記憶された前記伝達関数を更新する第5伝達関数更新回路と、を有し、
    前記第2音響キャンセラは、
    前記第2音響エコーの伝達関数として推定された伝達関数を記憶する第6伝達関数記憶回路と、
    前記音響信号を記憶する第6記憶回路と、
    前記第6記憶回路に記憶された前記音響信号と前記第6伝達関数記憶回路に記憶された前記伝達関数とを畳み込むことで前記第2音響エコー信号を生成する第6畳み込み演算器と、
    前記第2マイクの前記出力信号から、前記第6畳み込み演算器から出力された前記第2音響エコー信号を除去し、前記第2音響キャンセラの出力信号を出力する第6減算器と、
    前記第6減算器の前記出力信号と前記第6記憶回路に記憶された前記音響信号とに基づいて前記第6伝達関数記憶回路に記憶された前記伝達関数を更新する第6伝達関数更新回路と、を有する、
    請求項13記載の双方向会話補助装置。
  15. 前記第1音響キャンセラは、
    さらに、前記第2スピーカへの前記入力信号に前記音響信号を加算する第1加算器を有し、
    前記第2音響キャンセラは、
    さらに、前記第1スピーカへの前記入力信号に前記音響信号を加算する第2加算器を有する、
    請求項14記載の双方向会話補助装置。
  16. 会話システムにおいて第1話者と第2話者による双方向の会話を拡声して補助する双方向会話補助方法であって、
    前記会話システムは、
    前記第1話者の第1音声を入力するための第1マイクと、
    前記第1音声を出力するための第1スピーカと、
    前記第2話者の第2音声を入力するための第2マイクと、
    前記第2音声を出力するための第2スピーカと、を備え、
    前記双方向会話補助方法は、
    前記第2スピーカへの入力信号を用いて、前記第2スピーカから出力された前記第2音声が前記第1マイクに入力される第1エコー、及び、前記第2音声が前記第1マイクに入力される第1クロストークの程度を示す第1妨害信号を推定して算出し、算出した前記第1妨害信号を、前記第1マイクの出力信号から除去する第1エコー・クロストークキャンセルステップを含む、
    双方向会話補助方法。
  17. さらに、前記第2スピーカから出力された前記第2音声が前記第2マイクに入力される第1ハウリングの程度を示す第1ハウリング信号を推定して算出し、算出した前記第1ハウリング信号を、前記第2マイクの出力信号から除去する第1ハウリングキャンセルステップを含む、
    請求項16記載の双方向会話補助方法。
  18. さらに、
    前記第1スピーカから出力された前記第1音声が前記第1マイクに入力される第2ハウリングの程度を示す第2ハウリング信号を推定して算出し、算出した前記第2ハウリング信号を、前記第1マイクの前記出力信号から除去する第2ハウリングキャンセルステップと、
    前記第1スピーカへの入力信号を用いて、前記第1スピーカから出力された前記第1音声が前記第2マイクに入力される第2エコー、及び、前記第1音声が前記第2マイクに入力される第2クロストークの程度を示す第2妨害信号を推定して算出し、算出した前記第2妨害信号を、前記第2マイクの前記出力信号から除去する第2エコー・クロストークキャンルステップと、を含む、
    請求項17記載の双方向会話補助方法。
  19. さらに、前記第1スピーカへの入力信号を用いて、前記第1スピーカから出力された前記第1音声が前記第2マイクに入力される第2エコー、及び、前記第1音声が前記第2マイクに入力される第2クロストークの程度を示す第2妨害信号を推定して算出し、算出した前記第2妨害信号を、前記第2マイクの出力信号から除去する第2エコー・クロストークキャンセルステップを含む、
    請求項16記載の双方向会話補助方法。
  20. さらに、
    音響信号を用いて、前記第2スピーカから出力された音響が前記第1マイクに入力される第1音響エコーの程度を示す第1音響エコー信号を推定して算出し、算出した前記第1音響エコー信号を、前記第1マイクの前記出力信号から除去する第1音響キャンセルステップと、
    前記音響信号を用いて、前記第1スピーカから出力された音響が前記第2マイクに入力される第2音響エコーの程度を示す第2音響エコー信号を推定して算出し、算出した前記第2音響エコー信号を、前記第2マイクの前記出力信号から除去する第2音響キャンセルステップと、を備える、
    請求項18記載の双方向会話補助方法。
JP2017545085A 2015-10-16 2016-09-29 双方向会話補助装置及び双方向会話補助方法 Active JP6311136B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015205018 2015-10-16
JP2015205018 2015-10-16
PCT/JP2016/004390 WO2017064839A1 (ja) 2015-10-16 2016-09-29 双方向会話補助装置及び双方向会話補助方法

Publications (2)

Publication Number Publication Date
JP6311136B2 JP6311136B2 (ja) 2018-04-18
JPWO2017064839A1 true JPWO2017064839A1 (ja) 2018-05-10

Family

ID=58517542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017545085A Active JP6311136B2 (ja) 2015-10-16 2016-09-29 双方向会話補助装置及び双方向会話補助方法

Country Status (4)

Country Link
US (1) US10542154B2 (ja)
EP (1) EP3312839B1 (ja)
JP (1) JP6311136B2 (ja)
WO (1) WO2017064839A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017064840A1 (ja) * 2015-10-16 2017-04-20 パナソニックIpマネジメント株式会社 音源分離装置および音源分離方法
WO2019181758A1 (ja) 2018-03-19 2019-09-26 パナソニックIpマネジメント株式会社 会話支援装置
US10694285B2 (en) 2018-06-25 2020-06-23 Biamp Systems, LLC Microphone array with automated adaptive beam tracking
US10433086B1 (en) 2018-06-25 2019-10-01 Biamp Systems, LLC Microphone array with automated adaptive beam tracking
US10210882B1 (en) 2018-06-25 2019-02-19 Biamp Systems, LLC Microphone array with automated adaptive beam tracking
EP3833045B1 (en) * 2018-08-02 2023-10-25 Nippon Telegraph And Telephone Corporation Conversation assistance system, method therefor, and program
EP3890288A4 (en) * 2018-11-30 2022-05-18 Panasonic Intellectual Property Management Co., Ltd. TRANSLATION DEVICE AND TRANSLATION METHOD
CN110033773B (zh) * 2018-12-13 2021-09-14 蔚来(安徽)控股有限公司 用于车辆的语音识别方法、装置、系统、设备以及车辆
US11234088B2 (en) 2019-04-16 2022-01-25 Biamp Systems, LLC Centrally controlling communication at a venue
US11729550B2 (en) 2019-05-21 2023-08-15 Nippon Telegraph And Telephone Corporation Echo cancelation method, apparatus, program and recording medium
CN110738995B (zh) * 2019-10-11 2022-11-11 北京地平线机器人技术研发有限公司 一种声音信号采集方法及装置
US10811029B1 (en) * 2019-10-31 2020-10-20 Amazon Technologies, Inc. Cascade echo cancellation for asymmetric references
WO2023013019A1 (ja) * 2021-08-06 2023-02-09 日本電信電話株式会社 発話フィードバック装置、発話フィードバック方法、プログラム
US20230319488A1 (en) * 2022-03-29 2023-10-05 The Board Of Trustees Of The University Of Illinois Crosstalk cancellation and adaptive binaural filtering for listening system using remote signal sources and on-ear microphones
CN115604630A (zh) * 2022-09-29 2023-01-13 歌尔科技有限公司(Cn) 声场扩展方法、音频设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050025273A1 (en) * 2003-06-27 2005-02-03 Wolfgang Tschirk Method and apparatus for echo compensation
JP2005333270A (ja) * 2004-05-18 2005-12-02 Sony Corp マイクロフォン信号生成方法および通話装置
JP2010163054A (ja) * 2009-01-15 2010-07-29 Fujitsu Ten Ltd 会話支援装置及び会話支援方法
JP2012195801A (ja) * 2011-03-17 2012-10-11 Panasonic Corp 会話支援装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61194958A (ja) 1985-02-22 1986-08-29 Nippon Telegr & Teleph Corp <Ntt> エコ−キヤンセラ形拡声電話回路
US4677676A (en) 1986-02-11 1987-06-30 Nelson Industries, Inc. Active attenuation system with on-line modeling of speaker, error path and feedback pack
US5033082A (en) 1989-07-31 1991-07-16 Nelson Industries, Inc. Communication system with active noise cancellation
US6496581B1 (en) * 1997-09-11 2002-12-17 Digisonix, Inc. Coupled acoustic echo cancellation system
US6505057B1 (en) * 1998-01-23 2003-01-07 Digisonix Llc Integrated vehicle voice enhancement system and hands-free cellular telephone system
DE19938158C1 (de) 1999-08-16 2001-01-11 Daimler Chrysler Ag Verfahren und Vorrichtung sowie ihre Verwendung zur Kompensation von Verlusten eines akustischen Signals
US6934387B1 (en) * 1999-12-17 2005-08-23 Marvell International Ltd. Method and apparatus for digital near-end echo/near-end crosstalk cancellation with adaptive correlation
US7039197B1 (en) * 2000-10-19 2006-05-02 Lear Corporation User interface for communication system
US7388904B2 (en) * 2003-06-03 2008-06-17 Vativ Technologies, Inc. Near-end, far-end and echo cancellers in a multi-channel transceiver system
JP4333369B2 (ja) 2004-01-07 2009-09-16 株式会社デンソー 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
US7688968B1 (en) * 2004-09-16 2010-03-30 Marvell International Ltd. Adaptive analog echo/next cancellation
TWI414154B (zh) * 2009-09-11 2013-11-01 Realtek Semiconductor Corp 通訊裝置與其接收方法
DE102009051508B4 (de) * 2009-10-30 2020-12-03 Continental Automotive Gmbh Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung
JP5887535B2 (ja) * 2012-02-17 2016-03-16 パナソニックIpマネジメント株式会社 エコー消去装置、エコー消去方法、及び、通話装置
WO2017064840A1 (ja) * 2015-10-16 2017-04-20 パナソニックIpマネジメント株式会社 音源分離装置および音源分離方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050025273A1 (en) * 2003-06-27 2005-02-03 Wolfgang Tschirk Method and apparatus for echo compensation
JP2005333270A (ja) * 2004-05-18 2005-12-02 Sony Corp マイクロフォン信号生成方法および通話装置
JP2010163054A (ja) * 2009-01-15 2010-07-29 Fujitsu Ten Ltd 会話支援装置及び会話支援方法
JP2012195801A (ja) * 2011-03-17 2012-10-11 Panasonic Corp 会話支援装置

Also Published As

Publication number Publication date
EP3312839A4 (en) 2018-05-09
US20180115650A1 (en) 2018-04-26
EP3312839B1 (en) 2020-08-05
US10542154B2 (en) 2020-01-21
WO2017064839A1 (ja) 2017-04-20
EP3312839A1 (en) 2018-04-25
JP6311136B2 (ja) 2018-04-18

Similar Documents

Publication Publication Date Title
JP6311136B2 (ja) 双方向会話補助装置及び双方向会話補助方法
JP6318376B2 (ja) 音源分離装置および音源分離方法
CN107636758B (zh) 声学回声消除系统和方法
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
KR20040019362A (ko) 후처리기로서 멀티 마이크로폰 에코 억제기를 가지는 음향보강 시스템
JP5391103B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
JP2012195801A (ja) 会話支援装置
US10297245B1 (en) Wind noise reduction with beamforming
JP6821126B2 (ja) ノイズ除去装置、ノイズ除去方法およびノイズ除去プログラム
KR101587844B1 (ko) 마이크로폰의 신호 보상 장치 및 그 방법
JP5908170B2 (ja) エコー消去装置
EP3833045B1 (en) Conversation assistance system, method therefor, and program
JP5937451B2 (ja) エコー消去装置、エコー消去方法及びプログラム
JP7259092B2 (ja) モジュール式エコーキャンセルユニット
JP4162860B2 (ja) 不要音信号除去装置
EP3667662A1 (en) Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program
Saremi Spatial audio signal processing for speech telecommunication inside vehicles
JP5631523B2 (ja) エコー消去装置
JP2012205161A (ja) 音声通話装置
US20230274723A1 (en) Communication support system
JP2019165276A (ja) エコーキャンセル装置、エコーキャンセル方法およびエコーキャンセルプログラム
JP6356087B2 (ja) エコー消去装置、その方法及びプログラム
TW202331701A (zh) 雙麥克風陣列回音消除方法、雙麥克風陣列回音消除裝置、電子設備、及非揮發性電腦可讀儲存媒體
JP2021097292A (ja) エコーキャンセル装置、エコーキャンセル方法およびエコーキャンセルプログラム
CN113519169A (zh) 用于音频啸叫衰减的方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171211

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20171211

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180219

R151 Written notification of patent or utility model registration

Ref document number: 6311136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

SZ03 Written request for cancellation of trust registration

Free format text: JAPANESE INTERMEDIATE CODE: R313Z03