JP2017522594A - 音声信号を明瞭化するためのマルチ聴覚mmse分析技法 - Google Patents

音声信号を明瞭化するためのマルチ聴覚mmse分析技法 Download PDF

Info

Publication number
JP2017522594A
JP2017522594A JP2016573971A JP2016573971A JP2017522594A JP 2017522594 A JP2017522594 A JP 2017522594A JP 2016573971 A JP2016573971 A JP 2016573971A JP 2016573971 A JP2016573971 A JP 2016573971A JP 2017522594 A JP2017522594 A JP 2017522594A
Authority
JP
Japan
Prior art keywords
audio signal
frequency band
main
frequency bands
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016573971A
Other languages
English (en)
Other versions
JP6789827B2 (ja
Inventor
ガイガー,フレドリック
ブンダーソン,ブライアント
グルンドストロム,カール
Original Assignee
サイファ,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サイファ,エルエルシー filed Critical サイファ,エルエルシー
Publication of JP2017522594A publication Critical patent/JP2017522594A/ja
Application granted granted Critical
Publication of JP6789827B2 publication Critical patent/JP6789827B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

音声信号を処理するための技法は、音声信号からノイズを除去するステップ、またはそうでなければ、音声信号を出力する前に、音声信号を明瞭化するステップを含む。本開示の技法は、主マイクロホンおよび少なくとも1つの参照マイクロホンから受信された音声信号についての最小平均二乗誤差(MMSE)分析を採用することができ、MMSE分析を用いて主マイクロホンによって受信された音声信号からノイズを低減、または除去する技法に採用することができる。任意選択的に、音声信号の様々な周波数帯に、信頼区間を割り当てることができる。各信頼区間は、そのそれぞれの周波数帯が対象音声を含んでいる尤度に対応しており、また、各信頼区間は、ノイズが除去された、再構成された音声信号の中のそのそれぞれの周波数帯の寄与度を表している。

Description

技術分野
本開示は、概して、音声信号からノイズを除去するか、またはそうでなければ、音声信号を出力する前に音声信号を明瞭化するための技法を含めた、音声信号を処理するための技法に関する。より具体的には、本開示は、主マイクロホンおよび少なくとも1つの参照マイクロホンから受信された音声信号について最小平均二乗誤差(MMSE:minimum mean squared error)分析を行う技法、およびMMSE分析を用いて主マイクロホンによって受信された音声信号からノイズを低減、または除去する技法に関する。
概要
様々な態様において、本開示による方法は、音声信号の対象部分または対象構成成分を識別するステップと、音声信号の対象部分に付随するノイズを低減または除去するステップと、を含む明瞭化プロセスである。明瞭化プロセスを用いるとき、主音声信号の対象部分、または少なくとも主音声信号の対象部分のかなりの部分は、明瞭化プロセス後も残存、すなわち、存続することになる。明瞭化プロセスの後に残存する主音声信号の各部分は、本明細書では「明瞭化された音声信号」と呼ばれる。主音声信号の様々な周波数帯が別々に明瞭化される実施形態では、明瞭化された音声信号は、本明細書では「再構成された音声信号」とも呼ばれる、主音声信号の再構成されたバージョンに含むことができる。明瞭化プロセスが、移動電話などの音声通信デバイスとともに用いられる実施形態では、主音声信号の対象部分は、個人の声を含むことができる。いったん主音声信号が明瞭化され、明瞭化された音声信号が再構成された音声信号に任意選択的に含まれれば、明瞭化された音声信号および/または再構成された音声信号は、記憶され、別のデバイスに伝送され、かつ/または聞こえるように出力することができる。
音声信号を処理するための方法は、互いに近接しているが向きまたは遠近関係が異なった、したがって、互いに違った風に、または違った遠近関係から音声信号を受信する少なくとも2つのマイクロホンによって、音の形で音声信号を受信するステップを含む。このような構成は、「バイノーラル(binaural)な環境」と呼ばれる。マイクロホンは、主マイクロホンと、1つまたは複数の参照マイクロホンと、を含む。主マイクロホンは、意図した音源から音声信号を受信するように位置決めすることができる。例えば、主マイクロホンは、移動電話を使用中に、個人が話しかける移動電話のマイクロホンを含むことができる。意図した音源からの音声信号は、対象音声、または対象音を含むことができる。その向きまたは遠近関係の理由で、主マイクロホンによって受信される音声信号は、本明細書では「主音声信号」と呼ばれる。
参照マイクロホンはそれぞれ、意図した音源からいくぶん遠隔して、参照マイクロホンが、主マイクロホンが背景音を受信するのと同程度以上まで背景音を受信することが可能であり、かつ、主マイクロホンが対象音声を受信するよりも少ない程度で、対象音声を受信することが可能な場所と向き、または遠近関係で位置決めすることができる。それぞれの参照マイクロホンの遠近関係から受信された音声信号は、本明細書では「参照音声信号」と呼ばれる。
いったん音声信号が、主音声信号および、1つまたは複数の参照音声信号として受信されれば、主音声信号を明瞭化することができる。明瞭化プロセスの一部として、主音声信号および各参照音声信号は、1つまたは複数の適応時間領域フィルタにかけることができる。特定の一実施形態では、主音声信号および/または各参照音声信号は、最小平均二乗(LMS:least mean squares)フィルタにかけることができる。
主音声信号または任意の参照音声信号を1つまたは複数の適応時間領域フィルタにかけるか、かけないかにかかわらず、ノイズ推定が得られる。ノイズ推定は、1つまたは複数の参照音声信号から得ることができる。より具体的には、ノイズ推定は、少なくとも1つの対象音声(例えば、フォルマント(formant)、または人声音のスペクトルピークなど)の1つまたは複数の部分がその中に存在することが知られている、1つまたは複数の周波数帯から得ることができる。ノイズ推定は、参照音声信号のみから得ることができ、あるいは参照音声信号の適切な部分(例えば、対象となっている各周波数帯など)を、ノイズに加えて対象音声を含むことになる主音声信号の対応する部分と比較することによって得ることができる。さらにもっと具体的には、主音声信号のある特定の周波数帯のサンプルは、1つまたは複数の参照音声信号の同じ特定の周波数帯の、同時に得られたサンプルと比較して、主音声信号のこうした周波数帯に存在することが疑われるノイズ、またはおそらく存在するノイズを識別(すなわちノイズ推定)することができる。獲得方法を問わず、それぞれのノイズ推定を用いて、主音声信号に、または、主音声信号の1つまたは複数の周波数帯に存在することが疑われるノイズ、またはおそらく存在するノイズを識別することができる。バイノーラルな環境において音声信号を分析することによって、参照音声信号を用いずにノイズを推定するときに必要な、音声活動検出器なしでノイズ推定を行うことができる。
主音声信号についての、または、主音声信号の1つまたは複数の周波数帯についての最小平均二乗誤差(MMSE)分析を行う間に、それぞれのノイズ推定を考慮に入れることができる。MMSE分析を用いて、ノイズ推定の関数および主音声信号の周波数分解によって定義された誤差を最小化することができる。こうした最小化の結果を用いて、主音声信号の1つまたは複数の周波数帯を修正することができる。いくつかの実施形態では、MMSE分析は、1つまたは複数のノイズ推定に基づいて個別に適応させることができる。あるいは、主音声信号、または、主音声信号の1つまたは複数の周波数帯のMMSE分析に、1つまたは複数のノイズ推定を用いる(be accounted for)ことができ、あるいは組み込むことができる。MMSE分析は、主音声信号から、または、主音声信号の1つまたは複数の周波数帯から、ノイズを少なくとも部分的に除去し、1つまたは複数の明瞭化された音声信号を供給する。つまり、明瞭化された音声信号の1つまたは複数の周波数帯におけるノイズの存在を全体的に減らすことができる。あるいは、各周波数帯がノイズを含んでいるが、対象音声が足りない場合には、再構成された出力信号の周波数帯の存在を全体的に減らすことができる。
主音声信号が複数の様々な周波数帯に分かれている実施形態、ならびに様々な周波数帯について行われたMMSE分析の結果として、複数の明瞭化された音声信号が得られる実施形態を含むいくつかの実施形態では、複数の周波数帯のうちのある周波数帯に対応する各明瞭化された音声信号を用いて、各周波数帯または明瞭化された音声信号に信頼区間(confidence interval)を割り当てることができる。各周波数帯、または明瞭化された音声信号の信頼水準は、再構成された音声信号に含まれることになる、こうした周波数帯または明瞭化された音声信号の度合いに対応させることができる。各信頼区間は、リアルタイムの分析に、および/またはいくつかの実施形態では、履歴データに基づくことができる。より具体的には、各周波数帯または明瞭化された音声信号の信頼区間は、主音声信号および各参照音声信号から拾い集められた情報(例えば、対応する周波数帯ごとのノイズ推定、対応する周波数帯についてのMMSE分析の結果など)に対応させることができる。
信頼区間は、それに対応する周波数帯または明瞭化された音声信号が、人声音、音楽などといったような、主音声信号の対象音声の少なくとも一部分を含んでいる尤度に少なくとも部分的に対応させることができる。いくつかの実施形態では、ある特定の周波数帯または明瞭化された音声信号の信頼区間は、その周波数帯または明瞭化された音声信号が、対象音声の少なくとも一部分を含んでいる尤度に対応させることができる。これに代えて、またはこれに加えて、ある特定の周波数帯または明瞭化された音声信号の信頼区間は、参照音声信号の該当する部分の対応する周波数帯に存在するノイズとの比較時に、明瞭化された音声信号から除去されたノイズの量(例えば、ノイズの割合など)に対応させることができる。
各信頼区間は、ゲイン値として具体化することができる。すなわち、例えば、ゼロ(0)〜イチ(1)の値は、それに対応する所定の周波数帯に対する乗数として用いることができるため、こうした対応する所定の周波数帯が再構成された出力音声信号に含まれる程度を制御することができる。一例として、周波数帯または明瞭化された音声信号が(例えば、こうした周波数帯についてのMMSE分析などから)、主音声信号の対象音声の一部分に該当している信頼水準が高い場合には、相対的に高いゲイン値(例えば、0.5を上回るゲイン値、0.6〜1のゲイン値など)を、こうした周波数帯に割り当てることができる。ある周波数帯が主音声信号の対象音声の一部分に該当している可能性が低い場合には、対応する信頼区間を低くすることができ、それに応じて、低いゲイン値(例えば、0.5以下のゲイン値など)を、こうした特定の周波数帯に割り当てることができる。ある周波数帯が対象音声の一部分に該当している信頼水準が非常に低い場合には、すなわち、その周波数帯が主にノイズで構成されている可能性が非常に高い場合には、非常に低いゲイン値(例えば、0.3未満のゲイン値など)を、こうした特定の周波数帯に割り当てることができる。
複数の周波数帯が主音声信号から分離、または抽出され、信頼区間が各周波数帯に割り当てられると、次に、信頼区間を用いて、周波数帯のそれぞれが再構成された音声信号に含まれることになる程度を決定することができる。すなわち、再構成された音声出力信号の各周波数帯の存在を、その信頼区間に対応させることができる。より具体的には、各信頼区間を用いてそれに対応する周波数帯の大きさを動的に調節し、得られた再構成された信号の信号対ノイズ比(SNR:signal-to-noise ratio)を向上させることができる。信頼区間が高い周波数帯の方が、信頼区間が低い周波数帯よりも存在が大きくなるので、再構成された音声信号の信頼区間が高い周波数帯は、信頼区間が低い周波数帯よりも顕著になっている。いったん信頼区間が割り当てられれば、周波数帯を再コンパイルして、再構成された音声信号を生成することができる。
本開示の明瞭化プロセスは、継続的に、または実質的に継続的に(例えば、一連の時間セグメントなどにおいて)行うことができる。
本開示による明瞭化プロセスのあらゆる実施形態を、電子デバイスの要素プロセッサの動作を制御するプログラム(例えば、ソフトウェアアプリケーション、すなわち「アプリ(app)」、ファームウェアなど)として具体化することができる。したがって、本開示の電子デバイスは、音源の音声信号に存在したノイズの程度に関係なく、ほとんど、またはまったくノイズがない明瞭化された音声信号および/または再構成された音声信号を供給するように構成することができる。次に、電子デバイスは、明瞭化された音声信号および/または再構成された音声信号の可聴出力を記憶し、伝送し、かつ/または供給するように構成することができる。
特定の、しかし限定的でない一実施形態では、このような電子デバイスは、移動電話またはその他の音声通信デバイスを含むことができる。プログラムおよびプロセッサを含んでいることに加えて、音声通信デバイスは、主マイクロホンおよび、1つまたは複数の参照マイクロホンを含むことができる。音声通信デバイスは、音声信号を伝送するアンテナなどの伝送素子もまた含むことができる。主マイクロホンおよび各参照マイクロホンは、音声信号を受信し、かつ、その音声信号をプロセッサに通信するように構成されている。プロセッサは、上記方法の一実施形態に従って、主マイクロホンからの主音声信号および各参照マイクロホンからの参照音声信号を処理し、明瞭化された音声信号および/または再構成された音声信号を生成する。次に、明瞭化された音声信号および/または再構成された音声信号は、音声通信デバイスの出力素子によって、例えば、セルラキャリアネットワークに伝送し、そこから、別の電話などの受信者のデバイスによって、明瞭化された音声信号および/または再構成された音声信号を最終的に受信することができる。
本開示の主題の様々な態様の特徴および利点と同様に、他の態様は、以下の説明、添付の図面および添付の特許請求の範囲を考慮することにより当業者に明らかになるであろう。
図面の簡単な説明
図面には以下が示されている。
音声信号を明瞭化するための方法の一実施形態を示すフローチャートである。 本開示の教示に従って音声信号を明瞭化するための方法の一実施形態において、適応最小平均二乗(LMS)フィルタリングの使用の一実施形態を図示するフローチャートである。 本開示の教示に従って音声信号を明瞭化するための方法の一実施形態を実行するように構成された電子デバイスの、一実施形態を概略的に描いたものである。
詳細な説明
図1を参照すると、音声信号を明瞭化するための方法の一実施形態が図示され、説明されている。本方法は、おおむね次の3つの構成部分、すなわち、参照番号10において、音声信号を受信するステップと、参照番号20において、音声信号を処理して、明瞭化された音声信号および/または再構成された音声信号を供給するステップと、参照番号40において、明瞭化された音声信号および/または再構成された音声信号を出力するステップと、を含んでいる。
参照番号10において、音声信号を受信する行為は、複数の音声信号を受信することを含むことができる。参照番号12において、移動電話、または図3に示されるような他の音声通信デバイス100の主マイクロホン112などの第1の音源から主音声信号を受信することができる。図1の参照番号14において、音声通信デバイス100の1つまたは複数の参照マイクロホン114が、参照音声信号を受信することができる。主マイクロホン112は主音声信号を、また各参照マイクロホン114は各参照音声信号をそれぞれ同時に、かつ、同相で受信することができる。いくつかの実施形態では、主音声信号および各参照音声信号の構成成分は、実質的に同じである場合があるが、量が異なっている。これは、主音声信号が得られた主マイクロホン112、および参照音声信号が得られた参照マイクロホン114それぞれの異なる向きまたは遠近関係の間の両耳間レベル差(ILD:intraaural level difference)に起因するものである。
主音声信号および各参照音声信号を受信すると、主マイクロホン112、および図3に示される音声通信デバイス100の各参照マイクロホン114は、図1の参照番号16において、これらの信号を音声通信デバイス100のプロセッサ120に通信することができる。
図1の参照番号20において、明瞭化された音声信号を供給するように、主音声信号および各参照音声信号を処理することができる。この明瞭化プロセスは、複数の行為を含むことができる。それらについて図2で詳細に説明する。図2の参照番号22において、主音声信号、および任意選択的に、各参照音声信号を、1つまたは複数の適応時間領域フィルタにかけることができる。このようなフィルタは、低域フィルタを含むことができるが、フィルタリングされた信号から誤差、すなわちおそらくノイズを除去することができるため、さらなる処理後、より精製された信号、すなわちより明瞭な信号が得られる。特定の一実施形態では、最小平均二乗フィルタ(LMS)を適応時間領域フィルタとして使用することができる。適応時間領域フィルタは、フィルタリングされた各信号から、何らかのノイズおよび/またはその他の望ましくない人工物を除去するおおまかな、または受動的なフィルタリングを提供することができる。
図2の参照番号24において、ノイズ推定を得ることができる。より具体的には、参照音声信号、または、複数の参照音声信号が受信される実施形態では、複数の参照音声信号は、ノイズ推定を提供するように処理することができる。このような処理は、(図3の)音声通信デバイス100の主マイクロホン112に話しかけている個人の声の一部を構成しているフォルマントなどの、対象音声をおそらく含んでいる1つまたは複数の周波数帯の評価を含むことができる。このような処理によって提供されるノイズ評価は、それぞれの参照音声信号の、それぞれの評価された周波数帯からの音声信号だけに基づくことができる。あるいは、ノイズ推定は、それぞれの参照音声信号のそれぞれの評価された周波数帯と、参照音声信号に対応する主音声信号のそれぞれの対応する周波数帯と、の間の差異に基づくことができる。特定の一実施形態では、参照音声信号からのある特定の周波数帯が、対応する主音声信号の同じ周波数帯と実質的に同じパワーか、またはそれよりも大きなパワーを有する場合には、こうした周波数帯は、主としてノイズで構成されている可能性が非常に高く、したがって、主としてノイズで構成されていると見なすことができる。主音声信号からの周波数帯が、対応する参照音声信号の同じ周波数帯よりも大きなパワーを有する場合には、対象音声の少なくとも一部分を含んでいる可能性があり、したがって、対象音声の少なくとも一部分を含んでいると見なすことができる。
いったんノイズ推定が得られれば、図2の参照番号26で説明するように、ノイズ推定を主音声信号の最小平均二乗誤差(MMSE)分析と連携させて用いることができる。いくつかの実施形態では、MMSE分析は、ノイズ推定を加味することができる。より具体的には、MMSE分析は、ノイズ推定に基づいて個別に適応させることができる。例えば、ノイズ推定は、MMSE分析に組み込むことができる。次に、MMSE分析は、少なくとも1つの明瞭化された音声信号を供給する当技術分野で既知の方法で、主音声信号に適用することができる。主音声信号が適応時間領域フィルタにかけられている実施形態では、主音声信号のスペクトル特性が修正されており、それに応じてMMSE分析を修正することができる。いくつかの実施形態では、主音声信号の様々な周波数帯にMMSE分析を別々に適用して、それぞれが主音声信号の周波数帯の1つに対応する、複数の明瞭化された音声信号を供給することができる。
図2の参照番号28において、信頼区間を主音声信号の各周波数帯に割り当てることができる。信頼区間は、主音声信号の未処理の周波数帯に、主音声信号のフィルタリングされた周波数帯に、または、主音声信号の周波数帯についてのMMSE分析から得られた明瞭化された音声信号に適用することができる。各信頼区間は、主音声信号の対応する周波数帯が、対象音声の少なくとも一部分に対応する尤度の指標を提供することができる。いくつかの実施形態では、主音声信号および各参照音声信号、またはそれらの信号のいずれか一方、もしくは両方から得られた情報(例えば、各周波数帯のノイズ推定、各周波数帯についてのMMSE分析の結果など)を、主音声信号の各周波数帯に信頼区間を割り当てるときに考慮することができる。
各信頼区間は、対応する所定の周波数帯が、再構成された出力音声信号に含まれている程度を制御することができる。各信頼区間の実用的な効果は、対象音声に寄与するとは思えない周波数帯を減衰させることである。ある特定の予め定められた周波数帯の信頼区間は、任意の適切な方法でこうした所定の周波数帯に適用することができる。限定ではないが、信頼区間は、それに対応する所定の周波数帯に対する乗数を含むことができる。特定の一実施形態では、各信頼区間は、ゲイン値、すなわちゼロ(0)〜イチ(1)の値として具体化することができる。例えば、ある特定の周波数帯が主音声信号の対象音声の一部分である可能性がある場合には、相対的に高いゲイン値(例えば、0.5を上回るゲイン値、0.6〜1のゲイン値など)を、こうした周波数帯に割り当てることができる。ある特定の周波数帯が、対象音声の一部分を含む尤度と少なくとも同じくらいの可能性でノイズを含む場合には、こうした周波数帯の信頼区間を低くすることができ、それに応じて、低いゲイン値(例えば、0.5以下のゲイン値など)を、こうした周波数帯に割り当てることができる。ある特定の周波数帯が、対象音声の一部分を含む可能性が低い場合には、またはこの特定の周波数帯がノイズの結果である可能性が非常に高い場合には、非常に低い信頼区間および非常に低いゲイン値(例えば、0.3未満のゲイン値など)を、こうした周波数帯に割り当てることができる。
主音声信号の各周波数帯に適切な信頼区間を割り当てることで、こうした周波数帯は、図2の参照番号30において適切に調節することができる。信頼区間がゲイン値に対応する実施形態では、ゲイン値をその周波数帯に適用することができる。
図2の参照番号32において、修正された1つまたは複数の周波数帯を組み合わせることによって、再構成された音声信号を構成することができる。組み合わせられる周波数帯は、上記MMSE分析によって、信頼区間を用いることによって、または、MMSE分析および信頼区間の組み合わせによって、修正することができる。
次に、再構成された音声信号は、図1の参照番号40で出力することができる。図1および図2に関して説明したタイプのプロセスを用いて、主マイクロホンおよび、図3に描かれた移動電話のような音声通信デバイス100の1つまたは複数の参照マイクロホンによって受信された音声を修正する実施形態では、修正された主音声信号は、音声通信デバイス100のプロセッサ110によって音声通信デバイス100のアンテナ130に通信することができる。アンテナ130は次に、別の音声通信デバイスまたはネットワークに修正された主音声信号を伝送する。別の音声通信デバイスまたはネットワークは次に、別の音声通信デバイスに修正された主音声信号を伝送することができる。修正された主音声信号を受信する音声通信デバイスは次に、ほとんど、またはまったくノイズがない可聴出力を供給するように、こうした信号を処理することができる。
前述の開示は主として音声通信デバイスに関して提示されているが、本開示の主題は、様々な他の情況における音声信号にも同様に適用することができる。限定ではないが、本開示の主題は、音の受信および増幅に使用される装置(例えば、マイクロホン、増幅器および、任意選択的にミキサーなどを含むシステム)とともに、音声を受信し、記録する装置(例えば、ボイスレコーダ、ビデオレコーダ、音響スタジオなど)とともに、音声ヘッドセット(例えば、有線音声ヘッドセット、無線音声ヘッドセット(例えば、BLUETOOTH(登録商標)など)など)とともに、および様々な他の情況において用いることができる。より具体的には、図3で図示されるように、再構成された音声信号は、音声出力デバイス100のような、電子デバイスのプロセッサ110に連結されたメモリ120、または音声を受信し記憶するように構成された別のデバイス(例えば、ボイスレコーダ、音声レコーダ、ビデオカメラなど)に記憶させることができる。あるいは、再構成された音声信号は、ステレオのラウドスピーカ、携帯用電子デバイス、コンピュータ、音響システムなどといったような、電子デバイスのスピーカ140によって聞こえるように出力することができる。
主音声信号が、(例えば、図3の音声通信デバイス100の主マイクロホン112によって)得られ、(例えば、音声通信デバイス100のプロセッサ110に連結されたメモリ120などによって)記憶され、リアルタイムで、または実質的にリアルタイムで、(例えば、音声通信デバイス100のアンテナ130などによって)伝送されるか、または、(例えば、音声通信デバイス100のスピーカ140などによって)出力される信号を含む実施形態では、図1および図2を参照して説明したプロセスを繰り返し行うことができる。
明瞭化プロセスの繰り返しにより、主音声信号の継続的な修正、ならびにノイズの相対的レベルおよび主音声信号中の対象音声の変化を加味した迅速な調節を行うことができる。
前述の開示は多くの詳細を提供しているが、これらは添付の特許請求の範囲のいずれについてもその範囲を限定するものとして解釈されてはならない。特許請求の範囲による範囲から逸脱していない他の実施形態を考案することができる。様々な実施形態からの特徴を組み合わせて採用することができる。したがって、それぞれの請求項の範囲は、その平明な用語使いおよびその要素に対する利用可能な法的均等物の最大限の範囲によってのみ指示され限定される。

Claims (31)

  1. 音声信号を明瞭化するための方法であって、
    音声信号であって、それぞれが複数の周波数帯と、対象構成成分と、ノイズ構成成分と、を含む音声信号を、電子デバイスの少なくとも2つのマイクロホンであって、参照マイクロホンが前記対象構成成分を受信することになるよりも高いパワーで、前記対象構成成分を受信するための主マイクロホンを含む少なくとも2つのマイクロホンによって、受信するステップと、
    前記参照マイクロホンによって受信された参照音声信号からノイズ推定を決定するステップと、
    最小平均二乗誤差分析に前記ノイズ推定を組み込むステップと、
    前記主マイクロホンによって受信された主音声信号の前記複数の周波数帯の各周波数帯を前記最小平均二乗誤差分析にかけるステップと、
    前記最小平均二乗誤差分析の結果に基づいて、前記複数の周波数帯の各周波数帯に信頼区間を割り当てるステップと、
    前記周波数帯の前記信頼区間に基づいて、前記主音声信号の各周波数帯の音声出力レベルを修正して、修正された出力周波数帯を供給するステップと、
    前記主音声信号の前記複数の周波数帯の各周波数帯について修正された出力周波数帯を組み合わせて、明瞭化された出力音声信号を供給するステップと、
    を含む方法。
  2. 前記ノイズ推定を決定するステップが、前記主マイクロホンによって受信された前記主音声信号からの少なくとも1つの周波数帯を、前記参照マイクロホンによって受信された前記参照音声信号の少なくとも1つの対応する周波数帯と比較するステップを含む、請求項1に記載の方法。
  3. 前記ノイズ推定を決定するステップが、前記主マイクロホンによって受信された前記主音声信号からの複数の周波数帯を、前記参照マイクロホンによって受信された前記参照音声信号の対応する複数の周波数帯と比較するステップを含む、請求項2に記載の方法。
  4. 前記参照マイクロホンにおいて受信された前記参照音声信号の前記複数の周波数帯の各周波数帯を前記最小平均二乗誤差分析にかけるステップをさらに含む、請求項1に記載の方法。
  5. 前記信頼区間を割り当てるステップが、
    前記主マイクロホンによって受信されるよりも大きなパワーで前記参照マイクロホンによって受信された周波数帯に、非常に低い信頼区間を割り当てるステップと、
    前記主マイクロホンおよび前記参照マイクロホンの両方によって実質的に同じパワーで受信された周波数帯に、低い信頼区間を割り当てるステップと、
    前記参照マイクロホンによって受信されるよりも大きなパワーで前記主マイクロホンによって受信された前記周波数帯に、高い信頼区間を割り当てるステップと、
    を含む、請求項1に記載の方法。
  6. 前記非常に低い信頼区間を割り当てるステップが、前記周波数帯に0.3未満のゲインを割り当てるステップを含む、請求項5に記載の方法。
  7. 前記低い信頼区間を割り当てるステップが、前記周波数帯に約0.5以下のゲインを割り当てるステップを含む、請求項5に記載の方法。
  8. 前記高い信頼区間を割り当てるステップが、前記周波数帯に0.6を上回るゲインを割り当てるステップを含む、請求項5に記載の方法。
  9. 前記信頼区間を割り当てるステップが、各周波数帯に適切なゲインを割り当てるステップを含む、請求項1に記載の方法。
  10. 前記信頼区間を割り当てるステップが、前記音声信号中のノイズを動的に推定するステップを含む、請求項1に記載の方法。
  11. 音声活動を検出せずに行われる、請求項1に記載の方法。
  12. 前記主音声信号および前記参照音声信号を、適応時間領域フィルタにかけるステップをさらに含む、請求項1に記載の方法。
  13. 前記主音声信号および前記参照音声信号を前記適応時間領域フィルタにかけるステップが、前記主音声信号および前記参照音声信号を最小平均二乗フィルタにかけるステップを含む、請求項12に記載の方法。
  14. 前記主音声信号および前記参照音声信号を前記適応時間領域フィルタにかけるステップが、前記主音声信号の前記複数の周波数帯の各周波数帯、および前記参照音声信号の前記複数の周波数帯の各周波数帯を最小平均二乗誤差分析にかける前に、前記主音声信号および前記参照音声信号を前記適応時間領域フィルタにかけるステップを含む、請求項12に記載の方法。
  15. 音声信号を明瞭化するための方法であって、
    音声信号であって、それぞれが複数の周波数帯と、対象構成成分と、ノイズ構成成分と、を含む音声信号を、電子デバイスの少なくとも2つのマイクロホンであって、参照マイクロホンが前記対象構成成分を受信するよりも高いパワーで、前記対象構成成分を受信する主マイクロホンを含む少なくとも2つのマイクロホンによって、受信するステップと、
    前記主マイクロホンによって受信された主音声信号を適応時間領域フィルタにかけて、フィルタリングされた音声信号を供給するステップと、
    前記参照マイクロホンによって受信された参照音声信号を用いてノイズ推定を決定するステップと、
    前記ノイズ推定に基づいて最小平均二乗誤差分析を個別に適応させるステップと、
    前記フィルタリングされた音声信号の前記複数の周波数帯の各周波数帯を前記最小平均二乗誤差分析にかけるステップと、
    を含む方法。
  16. 前記主音声信号および前記参照音声信号を前記適応時間領域フィルタにかけるステップが、前記主音声信号および前記参照音声信号を最小平均二乗フィルタにかけるステップを含む、請求項15に記載の方法。
  17. 前記参照マイクロホンによって受信された前記参照音声信号を前記適応時間領域フィルタにかけて、フィルタリングされた参照音声信号を供給するステップをさらに含む、請求項15に記載の方法。
  18. 前記参照マイクロホンによって受信された前記参照音声信号を前記適応時間領域フィルタにかけるステップが、前記参照音声信号を最小平均二乗フィルタにかけるステップを含む、請求項17に記載の方法。
  19. 前記参照音声信号を用いて前記ノイズ推定を決定するステップが、前記フィルタリングされた参照音声信号を用いて前記ノイズ推定を決定するステップを含む、請求項17に記載の方法。
  20. 前記フィルタリングされた参照音声信号の前記複数の周波数帯の各周波数帯を、前記最小平均二乗誤差分析にかけるステップをさらに含む、請求項17に記載の方法。
  21. 前記参照音声信号の前記複数の周波数帯の各周波数帯を、前記最小平均二乗誤差分析にかけるステップをさらに含む、請求項15に記載の方法。
  22. 前記最小平均二乗誤差分析の結果に基づいて、前記複数の周波数帯の各周波数帯に信頼区間を割り当てるステップと、
    前記周波数帯の前記信頼区間に基づいて、前記フィルタリングされた音声信号の各周波数帯の音声出力レベルを修正して、修正された出力周波数帯を供給するステップと、
    前記フィルタリングされた音声信号の前記複数の周波数帯の各周波数帯について修正された出力周波数帯を組み合わせて、明瞭化された出力音声信号を供給するステップと、
    をさらに含む、請求項15に記載の方法。
  23. 音声信号を受信するように構成された電子デバイスであって、
    主音声信号を受信し、通信するための主マイクロホンと、
    参照音声信号を受信し、通信するための参照マイクロホンと、
    プロセッサであって、
    前記主音声信号および前記参照音声信号を受信し、
    前記参照音声信号を処理して、ノイズ推定を提供し、
    前記ノイズ推定を用いた最小平均二乗誤差分析を生成し、
    前記主音声信号の複数の周波数帯を前記最小平均二乗誤差分析にかけ、
    前記主音声信号の前記複数の周波数帯の各周波数帯の前記最小平均二乗誤差分析の結果を、前記参照音声信号の前記複数の周波数帯の対応する周波数帯の前記最小平均二乗誤差分析の結果と比較し、周波数帯の比較結果を提供し、
    前記主音声信号の前記複数の周波数帯の各周波数帯に、前記周波数帯に対応する前記周波数帯の比較結果に基づいて、信頼区間を割り当て、
    前記信頼区間に基づいて、前記周波数帯の出力パワーを調節して、修正された出力周波数帯を提供し、
    前記主音声信号の前記複数の周波数帯の各周波数帯について修正された出力周波数帯を組み合わせて、明瞭化された出力音声信号を供給し、
    出力素子に前記明瞭化された出力音声信号を出力させるように、プログラムされたプロセッサと、
    前記プロセッサとつながっている前記出力素子と、
    を含む電子デバイス。
  24. 前記プロセッサが、前記参照音声信号の複数の周波数帯を前記最小平均二乗誤差分析にかけるようにさらにプログラムされており、前記主音声信号の前記複数の周波数帯の周波数範囲および前記参照音声信号の前記複数の周波数帯の周波数範囲が、互いに対応している、請求項23に記載の電子デバイス。
  25. 移動電話を含む、請求項23に記載の電子デバイス。
  26. 前記出力素子が、スピーカを含む、請求項23に記載の電子デバイス。
  27. 前記スピーカが、前記電子デバイスに収容されている、請求項23に記載の電子デバイス。
  28. 前記スピーカが、前記電子デバイスに選択的に結合するように構成されている、請求項23に記載の電子デバイス。
  29. 前記プロセッサが、前記主音声信号および前記参照音声信号に適応時間領域フィルタを適用するようにさらにプログラムされている、請求項23に記載の電子デバイス。
  30. 前記プロセッサが、前記主音声信号および前記参照音声信号に適応最小平均二乗フィルタを適用するようにプログラムされている、請求項29に記載の電子デバイス。
  31. 前記プロセッサが、前記主音声信号の前記複数の周波数帯、および前記参照音声信号の前記複数の周波数帯を前記最小平均二乗誤差分析にかける前に、前記主音声信号および前記参照音声信号に前記適応時間領域フィルタを適用するようにプログラムされている、請求項29に記載の電子デバイス。
JP2016573971A 2014-06-18 2015-06-12 音声信号を明瞭化するためのマルチ聴覚mmse分析技法 Expired - Fee Related JP6789827B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/308,541 2014-06-18
US14/308,541 US10149047B2 (en) 2014-06-18 2014-06-18 Multi-aural MMSE analysis techniques for clarifying audio signals
PCT/US2015/035612 WO2015195482A1 (en) 2014-06-18 2015-06-12 Multi-aural mmse analysis techniques for clarifying audio signals

Publications (2)

Publication Number Publication Date
JP2017522594A true JP2017522594A (ja) 2017-08-10
JP6789827B2 JP6789827B2 (ja) 2020-11-25

Family

ID=54870902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016573971A Expired - Fee Related JP6789827B2 (ja) 2014-06-18 2015-06-12 音声信号を明瞭化するためのマルチ聴覚mmse分析技法

Country Status (6)

Country Link
US (1) US10149047B2 (ja)
EP (1) EP3158775A4 (ja)
JP (1) JP6789827B2 (ja)
KR (1) KR102378207B1 (ja)
CN (1) CN106797517B (ja)
WO (1) WO2015195482A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2963817B1 (en) * 2014-07-02 2016-12-28 GN Audio A/S Method and apparatus for attenuating undesired content in an audio signal
CN110970015B (zh) * 2018-09-30 2024-04-23 北京搜狗科技发展有限公司 一种语音处理方法、装置和电子设备
EP3667662B1 (en) * 2018-12-12 2022-08-10 Panasonic Intellectual Property Corporation of America Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program
CN110021307B (zh) * 2019-04-04 2022-02-01 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116275A (ja) * 2007-11-09 2009-05-28 Toshiba Corp 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置
JP2011527025A (ja) * 2008-06-30 2011-10-20 オーディエンス,インコーポレイテッド ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4658426A (en) * 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
FR2722631B1 (fr) * 1994-07-13 1996-09-20 France Telecom Etablissement P Procede et systeme de filtrage adaptatif par egalisation aveugle d'un signal telephonique numerique et leurs applications
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
US5924065A (en) * 1997-06-16 1999-07-13 Digital Equipment Corporation Environmently compensated speech processing
FR2766604B1 (fr) * 1997-07-22 1999-10-01 France Telecom Procede et dispositif d'egalisation aveugle des effets d'un canal de transmission sur un signal de parole numerique
JPH11126090A (ja) * 1997-10-23 1999-05-11 Pioneer Electron Corp 音声認識方法及び音声認識装置並びに音声認識装置を動作させるためのプログラムが記録された記録媒体
US20020002455A1 (en) * 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
WO2000057671A2 (de) * 1999-03-19 2000-09-28 Siemens Aktiengesellschaft Verfahren und einrichtung zum aufnehmen und bearbeiten von audiosignalen in einer störschallerfüllten umgebung
US20030018471A1 (en) * 1999-10-26 2003-01-23 Yan Ming Cheng Mel-frequency domain based audible noise filter and method
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
FR2820227B1 (fr) * 2001-01-30 2003-04-18 France Telecom Procede et dispositif de reduction de bruit
US7617099B2 (en) * 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
US6549629B2 (en) * 2001-02-21 2003-04-15 Digisonix Llc DVE system with normalized selection
CA2354858A1 (en) * 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
JP3950930B2 (ja) * 2002-05-10 2007-08-01 財団法人北九州産業学術推進機構 音源の位置情報を利用した分割スペクトルに基づく目的音声の復元方法
US7161973B2 (en) * 2002-12-17 2007-01-09 Sbc Properties, L.P. Pilot aided adaptive minimum mean square interference cancellation and detection
WO2004084182A1 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
US6931362B2 (en) * 2003-03-28 2005-08-16 Harris Corporation System and method for hybrid minimum mean squared error matrix-pencil separation weights for blind source separation
JP4989967B2 (ja) * 2003-07-11 2012-08-01 コクレア リミテッド ノイズ低減のための方法および装置
DE10362073A1 (de) * 2003-11-06 2005-11-24 Herbert Buchner Vorrichtung und Verfahren zum Verarbeiten eines Eingangssignals
US7392181B2 (en) * 2004-03-05 2008-06-24 Siemens Corporate Research, Inc. System and method for nonlinear signal enhancement that bypasses a noisy phase of a signal
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
US8233636B2 (en) * 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
CN101091209B (zh) * 2005-09-02 2010-06-09 日本电气株式会社 抑制噪声的方法及装置
EP1760696B1 (en) * 2005-09-03 2016-02-03 GN ReSound A/S Method and apparatus for improved estimation of non-stationary noise for speech enhancement
CN101089952B (zh) * 2006-06-15 2010-10-06 株式会社东芝 噪声抑制、提取特征、训练模型及语音识别的方法和装置
EP1887708B1 (en) * 2006-08-07 2012-09-19 Mitel Networks Corporation Delayed adaptation structure for improved double-talk immunity in echo cancellation devices
US7933420B2 (en) * 2006-12-28 2011-04-26 Caterpillar Inc. Methods and systems for determining the effectiveness of active noise cancellation
TW200847137A (en) * 2007-03-09 2008-12-01 Fortemedia Inc Method and apparatus for voice communication
JP4469882B2 (ja) * 2007-08-16 2010-06-02 株式会社東芝 音響信号処理方法及び装置
KR100930584B1 (ko) * 2007-09-19 2009-12-09 한국전자통신연구원 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
US8175291B2 (en) * 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US8660281B2 (en) * 2009-02-03 2014-02-25 University Of Ottawa Method and system for a multi-microphone noise reduction
JP5127754B2 (ja) * 2009-03-24 2013-01-23 株式会社東芝 信号処理装置
CN102111697B (zh) * 2009-12-28 2015-03-25 歌尔声学股份有限公司 一种麦克风阵列降噪控制方法及装置
JP5641186B2 (ja) * 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
JP5528538B2 (ja) * 2010-03-09 2014-06-25 三菱電機株式会社 雑音抑圧装置
US8798992B2 (en) * 2010-05-19 2014-08-05 Disney Enterprises, Inc. Audio noise modification for event broadcasting
US9837097B2 (en) * 2010-05-24 2017-12-05 Nec Corporation Single processing method, information processing apparatus and signal processing program
US9408542B1 (en) * 2010-07-22 2016-08-09 Masimo Corporation Non-invasive blood pressure measurement system
US8861756B2 (en) * 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US9142207B2 (en) * 2010-12-03 2015-09-22 Cirrus Logic, Inc. Oversight control of an adaptive noise canceler in a personal audio device
EP2652737B1 (en) * 2010-12-15 2014-06-04 Koninklijke Philips N.V. Noise reduction system with remote noise detector
WO2012105940A1 (en) 2011-01-31 2012-08-09 Empire Technology Development Llc Speech quality enhancement in telecommunication system
US8948407B2 (en) * 2011-06-03 2015-02-03 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US9002027B2 (en) * 2011-06-27 2015-04-07 Gentex Corporation Space-time noise reduction system for use in a vehicle and method of forming same
US9680497B2 (en) * 2014-03-26 2017-06-13 Syntropy Systems, Llc Conversion of a discrete-time quantized signal into a continuous-time, continuously variable signal
CN102306496B (zh) * 2011-09-05 2014-07-09 歌尔声学股份有限公司 一种多麦克风阵列噪声消除方法、装置及系统
US20130094657A1 (en) * 2011-10-12 2013-04-18 University Of Connecticut Method and device for improving the audibility, localization and intelligibility of sounds, and comfort of communication devices worn on or in the ear
US20130163781A1 (en) * 2011-12-22 2013-06-27 Broadcom Corporation Breathing noise suppression for audio signals
JP5875414B2 (ja) * 2012-03-07 2016-03-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 雑音抑制方法、プログラム及び装置
US9002030B2 (en) * 2012-05-01 2015-04-07 Audyssey Laboratories, Inc. System and method for performing voice activity detection
FR2992459B1 (fr) * 2012-06-26 2014-08-15 Parrot Procede de debruitage d'un signal acoustique pour un dispositif audio multi-microphone operant dans un milieu bruite.
US20160240210A1 (en) * 2012-07-22 2016-08-18 Xia Lou Speech Enhancement to Improve Speech Intelligibility and Automatic Speech Recognition
DE112012006876B4 (de) * 2012-09-04 2021-06-10 Cerence Operating Company Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung
EP2747081A1 (en) * 2012-12-18 2014-06-25 Oticon A/s An audio processing device comprising artifact reduction
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
JP5588054B1 (ja) * 2013-09-06 2014-09-10 リオン株式会社 補聴器、拡声器及びハウリングキャンセラ
US9633671B2 (en) * 2013-10-18 2017-04-25 Apple Inc. Voice quality enhancement techniques, speech recognition techniques, and related systems
US9449615B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Externally estimated SNR based modifiers for internal MMSE calculators
US9449609B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Accurate forward SNR estimation based on MMSE speech probability presence
ES2831407T3 (es) * 2013-12-11 2021-06-08 Med El Elektromedizinische Geraete Gmbh Selección automática de reducción o realzado de sonidos transitorios
US9271077B2 (en) * 2013-12-17 2016-02-23 Personics Holdings, Llc Method and system for directional enhancement of sound using small microphone arrays
EP2916321B1 (en) * 2014-03-07 2017-10-25 Oticon A/s Processing of a noisy audio signal to estimate target and noise spectral variances
US9479860B2 (en) * 2014-03-07 2016-10-25 Cirrus Logic, Inc. Systems and methods for enhancing performance of audio transducer based on detection of transducer status
US10181315B2 (en) * 2014-06-13 2019-01-15 Cirrus Logic, Inc. Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system
US9466282B2 (en) * 2014-10-31 2016-10-11 Qualcomm Incorporated Variable rate adaptive active noise cancellation
US9576583B1 (en) * 2014-12-01 2017-02-21 Cedar Audio Ltd Restoring audio signals with mask and latent variables

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116275A (ja) * 2007-11-09 2009-05-28 Toshiba Corp 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置
JP2011527025A (ja) * 2008-06-30 2011-10-20 オーディエンス,インコーポレイテッド ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法

Also Published As

Publication number Publication date
US10149047B2 (en) 2018-12-04
EP3158775A4 (en) 2018-02-21
EP3158775A1 (en) 2017-04-26
US20150373453A1 (en) 2015-12-24
JP6789827B2 (ja) 2020-11-25
CN106797517A (zh) 2017-05-31
WO2015195482A1 (en) 2015-12-23
CN106797517B (zh) 2019-12-17
KR102378207B1 (ko) 2022-03-25
KR20170039126A (ko) 2017-04-10

Similar Documents

Publication Publication Date Title
US10650796B2 (en) Single-channel, binaural and multi-channel dereverberation
US10466957B2 (en) Active acoustic filter with automatic selection of filter parameters based on ambient sound
EP3526979B1 (en) Method and apparatus for output signal equalization between microphones
US9305568B2 (en) Active acoustic filter with socially determined location-based filter characteristics
US9558755B1 (en) Noise suppression assisted automatic speech recognition
CN107371111B (zh) 用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统
US9036825B2 (en) Audio signal correction and calibration for a room environment
EP3203473B1 (en) A monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system
US8682006B1 (en) Noise suppression based on null coherence
US8761410B1 (en) Systems and methods for multi-channel dereverberation
US20140161280A1 (en) Audio signal correction and calibration for a room environment
JP6789827B2 (ja) 音声信号を明瞭化するためのマルチ聴覚mmse分析技法
CN104796836A (zh) 双耳声源增强
WO2015085946A1 (zh) 语音信号处理方法、装置及服务器
CN110140294B (zh) 用于均衡音频信号的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190315

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200218

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201104

R150 Certificate of patent or registration of utility model

Ref document number: 6789827

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees