JP2014502471A - 動的マイクロフォン信号ミキサ - Google Patents

動的マイクロフォン信号ミキサ Download PDF

Info

Publication number
JP2014502471A
JP2014502471A JP2013540940A JP2013540940A JP2014502471A JP 2014502471 A JP2014502471 A JP 2014502471A JP 2013540940 A JP2013540940 A JP 2013540940A JP 2013540940 A JP2013540940 A JP 2013540940A JP 2014502471 A JP2014502471 A JP 2014502471A
Authority
JP
Japan
Prior art keywords
signal
signals
channel
noise
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013540940A
Other languages
English (en)
Other versions
JP5834088B2 (ja
Inventor
ブック,マルクス
マテヤ,ティモ
アイヒェントプフ,アヒム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Nuance Communications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuance Communications Inc filed Critical Nuance Communications Inc
Publication of JP2014502471A publication Critical patent/JP2014502471A/ja
Application granted granted Critical
Publication of JP5834088B2 publication Critical patent/JP5834088B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R9/00Transducers of moving-coil, moving-strip, or moving-wire type
    • H04R9/08Microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

ノイズ環境において異なる話者を支援する信号結合システムおよび方法を提供する。特に、チャネル間のノイズ特性の逸脱に対して、種々の実施形態は、話者交代時における背景ノイズの円滑な遷移を確実に行わせる。動的な、チャネル特定の、そして周波数に依存する最大減衰を適用することによって、修正ノイズ低減(NR)から同等の背景ノイズ特性を得ることができる。背景ノイズを調節するための基準特性は、優性な話者チャネルによって指定することができる。種々の実施形態において、動的な目標レベルを有する自動利得制御(AGC)が、全てのチャネルにおいて同様の音声信号レベルを確保することができる。
【選択図】図1

Description

[0001] 本発明は、動的信号ミキサのためのシステムおよび方法に関し、更に特定すれば、異なる音声レベルおよび/または異なる背景ノイズを補償するためのスペクトル前処理を含む、動的マイクロフォン信号ミキサに関するものである。
従来技術
[0002] ディジタル信号処理では、多くの多重マイクロフォン配列が存在し、1つ以上のマイクロフォン信号を結合する必要がある。用途は多岐にわたり、例えば、テレビ会議に関連する生のミキシングというシナリオから、自動車内環境におけるハンズ・フリー通話(hands free telephony)までに及ぶと考えてよい。信号品質は、マイクロフォンの位置、マイクロフォンのタイプ、背景ノイズの種類、話者自身に依存して、種々の話者チャネル間で激しく異なる場合がある。例えば、車内において多数の話者を含むハンズ・フリー通話システムについて考える。各話者は、音声を取り込むことができる専用マイクロフォンを有する。開いている窓のような異なる影響要因のために、マイクロフォン信号を互いに比較する場合、背景ノイズが大きく変動する可能性がある。アクティブな話者間でハードの切り替えを行う場合に、ノイズのジャンプおよび/または異なる色合い(coloration)が顕著となる場合もあり、またはソフト・ミキシング機能が更に高いノイズを含み、その結果ノイズ・レベルを高めることもある。
[0003] 自動マイクロフォン・ミキサの概念が、D.Dugan: Application of Automatic Mixing Techniques to Audio Consoles(オーディオ・コンソールへの自動ミキシング技法の応用), SMPTE Television Conference, vol. 101, 19-27, New York, NY, 1922において提案されている。この文献をここで引用したことにより、その内容全体が本願にも含まれることとする。これは、多重マイクロフォン生音響のシナリオに、「自動ミキシング」機能を用いる。しかしながら、Duganでは、背景ノイズからの影響が考慮されていない。S. P. Chandra, K. M. Senthil, M.P.P. Bala: Audio Mixer for Multi-party Conferencing in VoIP(VoIPにおける多者会議用オーディオ・ミキサ), Proceedings of the 3rd IEEE International Conference on Internet Multimedia Services Architecture and Applications (IMSAA'09), 31-36, IEEE Press, Piscataway, NJ, USA,2009では、切り替え時におけるノイズが多い信号のために、各チャネルにおいて固定方式のノイズ低減が開示されているが、ミキサの判断基準自体には、ノイズは考慮されていない。この文献をここで引用したことにより、その内容全体が本願にも含まれることとする。他の解決策には、ミキシング・プロセスの出力における信号対ノイズ比(SNR)の最大化に基づくものがある(例えば、J. Freudenberger, S. Stenzel, B. Venditti: Spectral Combination for Microphonediversity Systems(マイクロフォン・ダイバシティ・システムのためのスペクトル結合), 17th European Signal Processing Confierence (EUSIPCO-2009), Glasgow, 2009、およびW. Kellermann: Sprachverarbeitungseinrichtung, (DE4330243), 1995を参照のこと。双方の文献をここで引用したことにより、その内容全体が本願にも含まれることとする)。自動車内環境のような背景ノイズが多いシナリオが考慮されているが、多数の専用マイクロフォンを有する1人の話者しか考慮されていない。Freudenbergerでは、全てのマイクロフォン・チャネルにおいて同様のノイズ・レベルを想定するが同相の信号を追加するダイバシティ技法が開示されている。ダイバシティ効果を用いて異なるノイズを処理する他の方法が、T. Gerkmann and R. Martin, "Soft decision combining for dual channel noise reduction" (デュアル・チャネル・ノイズ低減のためのソフト判断結合)(9. Int. Conference on Spoken Language Processing (Interspeech ICSLP), Pittsburgh, Pennsylvania, Sept. 2006, pp. 2134-2137に開示されている。この文献をここで引用したことにより、その内容全体が本願にも含まれることとする。ここでは、音声期間において位相差を推定する。
[0004] 以上で述べた手法は、異なるノイズ・レベルや色合いが生ずるかもしれないこと、そして異なる話者の活動(activity)間の切り替えは、背景ノイズを考慮して、目立ってはならないことを考慮に入れていない。更に、ノイズ・レベルがミキシング機能によって増大されてはならない。
[0005] 本発明の一実施形態によれば、信号処理システムは、前処理モジュールを含む。この前処理モジュールは、複数の信号を受信し、これらの信号の各々を、ノイズ低減アルゴリズムにしたがって動的にフィルタ処理して、実質的に同等のノイズ特性を有する前処理信号を生成する。ミキサは、これらの前処理信号の内少なくとも2つを結合する。
[0006] 本発明の関連実施形態によれば、信号処理システムは、複数の信号を供給する複数のマイクロフォンを備えてもよい。上記マイクロフォンの内少なくとも2つ以上が、自動車またはボートというような、車両の異なる乗員室内に位置付けられている。他の実施形態では、2つ以上のマイクロフォンは、会議の通話のために、異なる場所に離れて位置付けてもよい。
[0007] 本発明の他の関連実施形態によれば、上記ノイズ低減アルゴリズムが、スペクトル形状および/またはパワーに関して、信号の背景ノイズが実質的に同等となるように、信号の各々を駆動するとよい。上記ノイズ低減アルゴリズムは、信号の信号対ノイズ比が実質的に同等となるように、信号の各々を駆動してもよい。各信号にはチャネルと関連付けられてもよく、上記ノイズ低減アルゴリズムは、少なくとも部分的にノイズ・パワー・スペクトル密度に基づいて、チャネル毎に動的スペクトル・フロアを決定するステップを含む。
[0008] 本発明の更に他の関連実施形態では、前処理モジュールが、更に、信号の各々の信号レベルを動的に調節する利得制御モジュールを含んでもよい。利得制御モジュールは、信号の各々の信号レベルを、動的に目標レベルに調節するとよい。各信号はチャネルと関連付けられてもよく、前処理モジュールは、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを含んでもよく、利得制御モジュールは、信号の各々の信号レベルを、その関連付けられたチャネルの優性重みに少なくとも部分的に基づいて調節する。
[0009] 本発明の更に他の実施形態では、各信号がチャネルと関連付けられており、前処理モジュールが、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを含んでもよく、ノイズ低減アルゴリズムは、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前処理信号を生成する。ミキサは、更に、前処理信号に重み付けする動的重みを含んでもよく、動的重みは、前処理モジュールと関連付けられた優性重みとは異なる。
[0010] 本発明の他の実施形態によれば、信号処理方法は、複数の信号を受信するステップを含む。ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理して、実質的に同等なノイズ特性を有する前処理信号を生成する。前処理信号の内少なくとも2つを結合する。
[0011] 本発明の関連実施形態によれば、この方法は、更に、複数のマイクロフォンによって複数の信号を供給するステップを含み、マイクロフォンの内少なくとも2つ以上が、車両の異なる乗員室に位置付けられている。他の実施形態では、2つ以上のマイクロフォンが、会議の通話のために、異なる場所に離れて位置付けられる。
[0012] 本発明の関連実施形態によれば、ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理するステップが、スペクトル形状およびパワーの内少なくとも1つに関して、信号の背景ノイズが実質的に同等となるように、信号の各々を駆動するステップを含んでもよい。ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理するステップは、信号の信号対ノイズ比が実質的に同等となるように、信号の各々を駆動するステップを含むのでもよい。各信号はチャネルと関連付けられてもよく、ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理するステップは、少なくとも部分的にノイズ・パワー・スペクトル密度に基づいて、チャネル毎に動的スペクトル・フロアを決定するステップを含む。
[0013] 本発明の更に他の実施形態によれば、この方法は、更に、前処理信号を生成するときに、信号の各々の信号レベルを動的に調節するステップを含んでも良い。信号の各々の信号レベルを動的に調節するステップは、信号の各々の信号レベルを、動的に目標レベルに調節するステップを含んでもよい。各信号はチャネルと関連付けられてもよく、この方法は、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するステップを含む。前処理信号を生成するときに、信号の各々の信号レベルを動的に調節するステップは、チャネル毎に、その関連付けられた優性重みに少なくとも部分的に基づいて、前処理信号を生成するステップを含んでもよい。
[0014] 本発明の更に他の実施形態によれば、各信号はチャネルと関連付けられており、この方法は、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するステップを含む。ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理して、前処理信号を生成するステップは、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前処理信号を生成するステップを含んでもよい。前処理信号の内少なくとも2つを結合するステップは、更に、前処理信号に重み付けするために、動的重み係数を用いるステップを含んでもよい。前処理信号を結合することに関連する動的重み係数は、前処理信号を生成することに関連する優性重みとは異なるとよい。
[0015] 本発明の他の実施形態によれば、複数の信号を動的に結合するためのコンピュータ・プログラム生産物を提供する。このコンピュータ・プログラム生産物は、コンピュータ読み取り可能プログラム・コードを有するコンピュータ使用可能媒体を含み、コンピュータ読み取り可能プログラム・コードは、プログラム・コードを含む。このプログラム・コードは、コンピュータ読み取り可能プログラム・コードが、ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理して、実質的に同等なノイズ特性を有する前処理信号を生成する機能を備えている。前処理信号の内少なくとも2つを結合する。
[0016] 本発明の関連実施形態によれば、ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理するプログラム・コードは、スペクトル形状および/またはパワーの内少なくとも1つに関して、信号の背景ノイズが実質的に同等となるように、信号の各々を駆動するプログラム・コードを含んでもよい。各信号はチャネルと関連付けられてもよく、ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理するプログラム・コードは、少なくとも部分的にノイズ・パワー・スペクトル密度に基づいて、チャネル毎に動的スペクトル・フロアを決定するプログラム・コードを含む。
[0017] 本発明の更に別の関連実施形態によれば、コンピュータ・プログラム生産物は、更に、前処理信号を生成するときに、信号の各々の信号レベルを動的に調節するプログラム・コードを含む。各信号は、チャネルと関連付けられてもよい。コンピュータ・プログラム生産物は、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するプログラム・コードを含む。前処理信号を生成するときに、信号の各々の信号レベルを動的に調節するプログラム・コードは、チャネル毎に、その関連付けられた優性重みに少なくとも部分的に基づいて、前処理信号を生成するプログラム・コードを含んでもよい。
[0018] 本発明の更に別の関連実施形態によれば、各信号はチャネルと関連付けられてもよく、コンピュータ・プログラム生産物は、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するプログラム・コードを含む。ノイズ低減アルゴリズムにしたがって信号の各々を動的にフィルタ処理して、前処理信号を生成するプログラム・コードは、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前処理信号を生成するプログラム・コードを含んでもよい。前処理信号の内少なくとも2つを結合するプログラム・コードは、更に、前処理信号に重み付けするために、動的重み係数を用いるプログラム・コードを含んでもよい。前処理信号を結合することに関連する動的重み係数は、前処理信号を生成することに関連する優性重みとは異なるとよい。
[0019] 以上の実施形態の特徴は、添付図面を参照しながら以下の詳細な説明を参照することによって、一層容易に理解されよう。
[0020]図1は、本発明の一実施形態による動的信号ミキシングのための信号処理システムのシステム全体像を示す。 [0021]図2(a)は、本発明の一実施形態による、種々のチャネルと関連付けられたカウンタ例(Cmax=100)を示す。図2(b)は、本発明の一実施形態による、話者の優性(dominance)を特徴付ける、話者優性重みgm(l)にマッピングされたカウンタを示す。 [0022]図3は、本発明の一実施形態による自動利得制御(AGC)のブロック図を示す。 [0023]図4は、本発明の一実施形態によるノイズ低減(NR)のブロック図を示す。 [0024]図5(a)は、入力チャネルの切り替え(NRなし)後における、処理された出力信号を示す。図5(b)は、本発明の一実施形態による、bref=0.4を有する、処理後に得られた信号を示す。 [0025]図6(a)は、種々のミキシング・システムの方法を評価した、平均投票結果(mean voting results)を示す。図6(b)は、異なる方法に対する格付け分布(rating distribution)を示す。
[0026] 本発明の例示的な実施形態において、ノイズのある環境において異なる話者を支援する新たな信号結合システムおよび方法を提供する。特に、チャネル間のノイズ特性の逸脱(deviation)に対して、種々の実施形態は、話者交代時における背景ノイズの円滑な遷移を確実に行わせる。動的な、チャネル特定の、そして周波数に依存する最大減衰を適用することによって、修正ノイズ低減(NR)から同等な背景ノイズ特性を得ることができる。背景ノイズを調節するための基準特性は、優性話者チャネルによって指定することができる。種々の実施形態において、動的な目標レベルを有する自動利得制御(AGC)が、全てのチャネルにおいて同様の音声信号レベルを確保する。以下で詳細について論ずる。
[0027] 図1は、本発明の一実施形態による、動的信号ミキシングのための信号処理システムのシステム全体像を示す。本システムの用途は、テレビ会議システム上のライブ・ミキシングのシナリオから、自動車システムにおけるハンズ・フリー通話まで、多岐にわたることができる。本システムは、M個のマイクロフォン100を含む。これらには、マイクロフォン・インデックスmが付けられ、限定ではなく、M個の入力信号に関連付けられている。M個の入力信号が結合されて1つ(以上)の出力信号Yを形成する。
[0028] 話者の交代(change)を含むがこれに限定されない音響状況の変化のために、マイクロフォンの信号レベルはときの経過と共に変動するのが通例である。更に、種々のマイクロフォン100が、限定ではなく、様々なノイズ特性を有するように互いから離れて位置する、異なる話者の中に位置付けられている場合もある。例えば、種々の話者が、自動車またはボートのような車両の異なる乗員室内に位置する場合や、あるいは会議の通話(conference call)のために異なる場所に位置する場合がある。
[0029] 例示的な実施形態では、前処理モジュール110がマイクロフォン100から信号を受信し、これらの信号の各々を、ノイズ低減アルゴリズムにしたがって動的にフィルタ処理して、実質的に同等のノイズ特性を有する前処理信号YからYまでを生成する。前処理モジュール110は、限定ではなく、音声活動検出(VAD)112を含むことができる。音声活動検出(VAD)112は、各マイクロフォンおよび/または話者の優性(dominance)を判定し、それに基づいて優性重み(DW ; Dominance Weights)を計算する(118)。この優性重み118は、AGC114およびNR116の最大減衰を調節するための目標値120を計算するのに寄与する。これらの前処理ステップの後、各チャネルにおける信号を同様の音響レベルおよびノイズ特性に駆動し、例えば、ミキサ122において結合する。
[0030] 以上の処理は、周波数ドメインまたはサブバンド・ドメインにおいて行うことができ、lはフレーム・インデックスを示し、kは周波数インデックスを示す。短時間フーリエ変換は、ハミング・ウィンドウ(Hann window)と、限定ではなく、256サンプルを有し11025Hzのサンプリング周波数において75%重複するブロック長とを用いることができる。各マイクロフォン信号は、例えば、音声およびノイズ信号成分の重畳によってモデル化することができる。
話者の優性
[0031] 本発明の種々の実施形態によれば、目標レベル120を計算するとき、どの話者/マイクロフォンがある時点において優性であるか把握することが重要なことが多い。話者が話していた時間を評価することによって、優性重み(DW)118を決定することができる。DW118は、後に目標値を設定するために用いることができる。1人の話者のみがアクティブである場合、所定の時間量の後、この具体的なチャネルだけで、目標値を制御することができる。全ての話者が同様にアクティブである場合、目標値は全てのチャネル特性の平均に対応すればよいが、これは限定ではない。DWの速い変化は、背景ノイズにおいてレベル・ジャンプまたは変調(modulation)を生ずる可能性がある。したがって、これらの重みは、ゆっくりと適応させることを推奨する(例えば、強い時間的スムージングによって実現する)。
[0032] チャネル毎に必要なフルバンド(fullband)VAD vadm(l)に対する値を決定するために、T. Matheja and M. Buck, "Robust Voice Activity Detection for Distributed Microphones by Modoeling of Power Ratios"(パワー比率のモデリングによる分散マイクロフォンのためのロバストな音声活動検出) (9. ITG_Fachtagung Sprachkommunications, Bochen, Oct. 2010)に記載されている方法のような、種々の方法を用いることができる。この文献をここで引用したことにより、その内容全体が本願にも含まれることとする。例えば、特定のカウンタCm(l)を時間枠毎に、そして特定の話者がアクティブであるチャネル毎に(vadm(l)=1)増加させ、それ以外ではカウンタを減少させるか、不変のままにしておいてもよいが、これは限定ではない。
[0033] カウンタをそれぞれCmaxまたはCminによって制限することによって、話者の最大優性または最少優性を定義する。種々の実施形態では、現在の話者がtinc秒発話した後に優性になるように、カウンタの増大間隔cincを設定するとよい。増大間隔cincは、2つの連続する時間枠間の更新時間Tframeを用いて、次の式に従う。
[0034] いずれかの他のチャネルm’において他の話者がアクティブになった場合、チャネルmについて減少定数(decreasing constant)を再計算するとよい。この実施形態では、1人が話すことを想定する。このような実施形態では、直前の話者の優性カウンタは、新たなアクティブな話者がcmaxに達しそれによって最大優性になった後、cminになるとよい。非常に小さな値の定数εを含ませてゼロによる除算を回避すると、cdec,mは次の式によって決定することができる。
[0035] 実例として、図2(a)は、カウンタ例(cmin=0,cmax=100)を示す。図2(b)に示すように、これらのカウンタを、話者の優性を特徴付ける話者優性重みgm(l)にマッピングすることができる。
動的信号調節
[0036] 前出の音声および/またはノイズ・レベルの相違を補償するために、本発明の種々の実施形態にしたがって、基礎となるマイクロフォン信号から計算される適応目標レベルに対する適応化(adaptation)を実行するAGC114および動的NR116を以下で紹介する。
自動利得制御
[0037] 図3は、本発明の一実施形態によるAGCのブロック図を示す。本発明の種々の実施形態において、入力信号X~m(l,k)に基づいて、AGC302は、限定ではなく、m番目のマイクロフォン信号304におけるピーク・レベルX^P,m(k)を推定することができ、この推定したピーク・レベルを目標ピーク・レベルXref P(k)に適用するためのフルバンド増幅係数am(l)306を決定する。
[0038] ピーク・レベル推定のための例示的な方法が、E. Hansler and G. Schmidt, Acoustic Echo and Noise Control: A Practical Approach (音響エコーおよびノイズ制御:実用的手法)Hoboken, NJ, USA: John Wiley & Sons, 2004, vol. 1において提案されている。この文献をここで引用したことにより、その内容全体が本願にも含まれるものとする。ピーク追跡のために時間ドメイン信号を用いる代わりに、全てのサブバンドに二乗平均平方根を適用してもよい。AGC114は、各チャネルにおいて、周波数に依存しない利得係数によって処理されるとよい。すると、出力は次の結果を得る。
利得係数を再帰的に平均すると、
ここで、γはスムージング定数を示す。γの範囲は、限定ではなく、0<γ<1とするとよい。例えば、γを0.9に設定するとよい。目標、もっと正確に言えば、基準ピーク・レベルXref P(l)は、全てのピーク・レベルの加重和であり、次の式によって決定される。
[0039] このように、本発明の例示的実施形態では、基準音声レベルを主に優性チャネルによって指定し、異なる音声信号レベルを、ほぼ同じ信号パワーに適応させる(adapt)。
動的ノイズ低減
[0040] 実例として、動的NR116は、全てのチャネルに対して、等しいパワーおよびスペクトル形状の背景ノイズを得ようとすればよい。図4は、本発明の一実施形態によるNR402のブロック図を示す。NR402は、パワー推定器404およびノイズ推定器406の双方を含むことができ、それぞれ、着信信号をフィルタ処理する(410)ためにフィルタ特性408を決定する。最大減衰は、マイクロフォン毎にそしてサブバンド毎に変動する可能性がある。m番目のマイクロフォン・チャネルにおける推定ノイズ・パワー・スペクトル密度(PSD)を示すΦ~n,m(l,k)を用いると、AGC114後のノイズPSDは、次のようになる。
[0041] NR116には、スペクトル重み付けに基づく異なる特性を選択することができる。例えば、NRフィルタ係数H~m(l,k)は、固定の過大評価係数β、最大過大評価α、および再帰スムージングによって推定された信号全体PSDΦx,m(l,k)を用いて、再帰ウィーナー特性(E. Handler et al.を参照のこと)によって計算することができる。
[0042] 各チャネルにおいて最大の減衰を実現するために、フィルタ係数を個々の動的スペクトル・フロアbm(l,k)によって制限してもよい。
[0043] 全体的なノイズ低減を指定する基準フロアbrefを設定した後、そして共通目標ノイズPSDΦref n(l,k)を推定した後、スペクトル・フロアを次の式で判定することができる。
[0044] ここで、目標ノイズPSDは、式8における目標ピーク・レベルと同様に、優性重みによって、適応的に計算することができる。
[0045] 全てのチャネルにわたるノイズ・レベルおよび色合いの差は、限定ではなく、動的スペクトル・フロアbm(l,k)によって補償することができる。図5(a)は、チャネル間切り替え(NRなし)の後における出力信号を示す。図5(b)は、本発明の一実施形態にしたがって、bref=0.4として得られた、処理後の信号のスペクトル図を示す。種々の実施形態において、可能な限りノイズ低減を行うことは必須ではなく、前述の異なるノイズ特性を補償するために望ましい程度に行えばよい。実例として、NR116の適当な動作のためには、次のような制限を導入することが有利であると考えられる。
[0046] AGCの重みが次の範囲内にある場合、
この処理は通例正しく行われるが、そうでないと残差切り替えの影響が聞こえる場合がある。この処理信号を得るために、数式11からのフィルタ係数を、周波数ドメインにおける複素値信号に適用するとよい。
[0047] その結果、全ての信号は、同様のノイズ特性(例えば、同等のパワーおよび/またはスペクトル形状)、および個々のアクティブな話者チャネル間において滑らかな遷移期間を示すように駆動される。ノイズ信号の強度差は、許容されるが、例えば、1人の話者だけが優性である場合にのみ、ある時間の後表面化する可能性がある。
信号の結合
[0048] 次に、処理後の信号はミキサ122によって結合され、限定ではなく、1つの出力信号を得る。種々の実施形態において、処理後の信号の何らかの結合によって、複数の出力を実現することができる。勿論、信号を結合するための重みは、優性重みとは無関係に選択することができ、種々の異なる方法を適用することができる。ミキサの重みは、限定ではなく、例えば、VAD112からの出力を用いた、発話活動(speech activity)に基づくのでもよい。ハードによる切り替えの方法では、実数値の重みに離散値(discrete value)を適用する。あるいは、チャネル間の切り替えは、ソフト重み(soft weight)によって、もっと円滑に実現することもできる。ソフト重みは、発話活動に応じて、ある速度で増減する。更に洗練されたミキシング方法では、周波数に依存する重みを用い、入力信号に応じて動的に割り当てられる。また、これらの方法は、入力信号の音声成分の位相を整列するために、複素値の重みも含むこともできる。この場合、出力信号は、所望の信号の建設的な重畳により、SNRの向上を得ることができる。
[0049] 種々の実施形態によれば、例えば、1人が話す状況を想定することができ、同じ時間では1人の話者だけがアクティブである場合、実数値の最大帯域重みwm(l)を用いることが適していると考えられる。
[0050] 全てのチャネルにおける異なる信号特性の調節によって、切り替えの影響に全く気付かずに、アクティブな話者間で切り替えることができる(図3参照)。VAD112によって重みwm(l)∈{0, 1}を決定することができ、次の話者がアクティブになるまで保持する。ミキシングのためにソフト重みを使用する場合、ミキサ重みwm(l)は素早く変化しなければならない。例えば、新たな話者(これまではインアクティブであった)が話し始めるときには、多くの音声を失わないために、対応する重みを素早く増大させること(アタック)が必要となる。減衰(解放)は通常もっとゆっくりと行われる。何故なら、アクティブな話者が発話し続ける可能性が高いからである。
[0051] 一般に、当技術分野において知られているミキシング方法はいずれも適用することができる。例えば、周波数依存重みを適用するミキシング方法(例えば、ダイバシティ技法)または複素値重みを適用するミキシング方法(例えば、SNR最適化技法のような方法)であっても、利用することができるが、これは限定ではない。
計算効率的な解決手段
[0052] 計算の手間を省くために、種々の実施形態では、全てのチャネルを完全に処理することはしない。例えば、ノイズ低減および/またはAGCは、N個の最もアクティブなチャネルについてのみ計算すればよい。実例として、ミキサ重みwm(l)が最も大きいチャネルを取り上げることができる(1≦N<M)。他のチャネルは処理されず、対応するミキサ重みは0に設定される。これらは、出力信号には全く寄与しない。N人よりも多い話者が同時にアクティブになる場合、少なくとも1人の話者が最適にカバーされないという問題があり得る。しかしながら、自動車の環境では、この話者の音声信号は、交差結合(cross-coupling)を通じてミキサの出力信号に入ることができる。つまり、彼が完全に抑制されることはない。実際のシナリオでは、これはしばしば発生したり、永続的に発生すべきではない。
評価
[0053] 以上で説明したシステムを、約90km/hおよび130km/hで運転した自動車において、4人が交互に発話し、2人が前の座席におり2人が後ろの座席にいて、各々が専用のマイクロフォンを有する状況で測定した信号を用いて評価した。窓を開いて劣悪なノイズが入るというシナリオも考慮した。主観的な聴取検査を行い、3つの信号結合方法を比較した。即ち、固定のスペクトル・フロアb=0.4としたノイズ低減チャネル信号間におけるハード切り替え、本発明の種々の実施形態による動的信号結合方法(bref=0.4,bmin=0.1,bmax=3)、およびダイバーシティ手法(Freudenberger et al.参照)である。10人の検査官が17組の音声信号を聴取した。各組において、先の3つの異なる方法の各々によって、1つの信号を処理した。課題は、最高(インデックス1)から始まって最低(インデックス3)で終わるように、結果的に得られた信号をそれらの品質で並び替えることであった。被験者は、彼らが好きなだけ頻繁に信号を聴くことが出来た。音声品質、ノイズの音、および全体的な印象を数値化した。
[0054] 図6(a)および図6(b)は、この検査の結果を示す。図6(a)は、平均投票結果を示す。図6(b)は、異なる方法についての格付け分布(rating distribution)を示す。チャネル間の単純なハード切り替えでは、煩わしいノイズ・ジャンプから来ると考えられる貧弱な結果が示されている。他の方法では、実質的に一定の背景ノイズが得られているが、本発明の種々の実施形態による動的信号結合方法が最良の結果を生んでいる。同様に、3つの手法全てにおいて、音声品質も評価した。ダイバシティ方法は、ここでは、不自然に聞こえる(unnatural sounding)背景ノイズを示した。何故なら、これは本来高い音声品質を達成するために設計されたからである。全体的な印象についでも、背景ノイズは極めて重大であると思われる。したがって、以上で説明した本発明の実施形態による手法は、その自然な音響および滑らかなノイズ遷移において有利である。
結論
[0055] ノイズのある環境において様々な話者を支援する、新たな動的信号結合システムおよび方法について紹介した。異なる2組の重みを用いて、これらを独立して制御することができる。即ち、ミキサ重みは、話者が変わった後に発話の開始を取り込むために非常に素早く変化することができ、一方優性重みは、結果的に得られる信号に対して望ましい信号特性を指定するために、それよりもゆっくりと調節することができる。このため、背景ノイズまたは音声レベルがチャネル間で大きく異なっていても、異なる話者のマイクロフォン信号間で、滑らかな遷移を達成することができる。また、紹介したシステムおよび方法は、ソフト重みまたは複素値の重みを用い、これらの重みが完全に独立であるために、他のミキシング手法のためのプリプロセッサとしても使用することができる。
[0056] 本発明では、例えば、前処理モジュール110および/またはミキサ122は、多くの異なる形態で具体化することができる。これらの形態には、プロセッサ(例えば、マイクロプロセッサ、マイクロコントローラ、ディジタル信号プロセッサ、または汎用コンピュータ)と共に用いるコンピュータ・プログラム・ロジック、プログラマブル・ロジック・デバイス(例えば、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のPDL)と共に用いるプログラマブル・ロジック、ディスクリート・コンポーネント、集積回路(例えば、用途特定集積回路(ASIC))、あるいはこれらのあらゆる組み合わせを含む他のあらゆる手段が含まれるが、決してこれらに限定されるのではない。
[0057] 本明細書においてこれまでに説明した機能の全部または一部を実現するコンピュータ・プログラム・ロジックは、種々の形態で具体化することができ、ソース・コードの形態、コンピュータ実行可能な形態、および種々の中間形態(例えば、アセンブラ、コンパイラ、リンカ、またはロケータによって生成される形態)が含まれるが、決してこれらに限定されるのではない。ソース・コードは、種々のオペレーティング・システムまたは動作環境で用いるために、種々のプログラミング言語(例えば、オブジェクト・コード、アセンブリ言語、あるいはフォートラン、C、C++、JAVA、またはHTMLのような上位言語)のいずれかで実現された一連のコンピュータ・プログラム命令を含むことができる。ソース・コードは、種々のデータ構造および通信メッセージを定義し使用することができる。ソース・コードは、コンピュータ実行可能形態(例えば、インタプリタによる)とすることができ、またはソース・コードをコンピュータ実行可能形態に変換してもよい(例えば、トランスレータ(translator)、アセンブラ、またはコンパイラによって)。
[0058] コンピュータ・プログラムは、いずれの形態でも(例えば、ソース・コード形態、コンピュータ実行可能形態、または中間形態)、永続的に、一時的ではなく(non-transitory)、または一時的に、有形記憶媒体に固定することができる。有形記憶媒体とは、半導体メモリ・デバイス(例えば、RAM、ROM、PROM、EEPROM、またはフラッシュ・プログラマブルRAM)、磁気メモリ・デバイス(例えば、ディスケットまたは固定ディスク)、光メモリ・デバイス(例えば、CD‐ROM)、PCカード(例えば、PCMCIAカード)、またはその他のメモリ・デバイスというようなものである。コンピュータ・プログラムは、いずれの形態でも、種々の通信技術のいずれかを用いて、コンピュータに送信可能な信号内に固定することもできる。種々の通信技術には、アナログ技術、ディジタル技術、光技術、ワイヤレス技術、ネットワーキング技術、および相互ネットワーキング技術(internetworking technologies)が含まれるが、決してこれらに限定されるのではない。コンピュータ・プログラムは、印刷した文書または電子文書が付属するリムーバブル記憶媒体というような(例えば、シュリンク・ラップ・ソフトウェアまたは磁気テープ)あらゆる形態で流通させることができ、コンピュータ・システムに予めロードしておくことができ(例えば、システムROM上または固定ディスク上)、あるいはサーバまたは電子掲示板から通信システム(例えば、インターネットまたはワールド・ワイド・ウェブ)を通じて流通させることもできる。
[0059] 本明細書においてこれまでに説明した機能の全てまたは一部を実現するハードウェア・ロジック(プログラマブル・ロジック・デバイスと共に用いるプログラマブル・ロジックを含む)は、従前からの手作業の方法を用いて設計することもでき、あるいはコンピュータ補助設計(CAD)、ハードウェア記述言語(例えば、VHDLまたはAHDL)、またはPLDプログラマブル言語(例えば、PALSM、ABEL、またはCUPL)というような種々のツールを用いて、電子的に設計し、取り込み、シミュレーションし、または文書化することもできる。
[0060] 以上で説明した本発明の実施形態は、単なる例示であることを意図しており、多数の変形や変更は当業者には明白であろう。このような変形および変更は全て、添付した請求項のいずれかに定義されている、本発明の範囲に該当することを意図している。

Claims (29)

  1. 信号処理システムであって、
    複数の信号を受信し、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理し、実質的に同等のノイズ特性を有する前処理信号を生成する前処理モジュールと、
    前記前処理信号の内少なくとも2つを結合するミキサと、
    を備えている、信号処理システム。
  2. 請求項1記載の信号処理システムであって、更に、前記複数の信号を供給する複数のマイクロフォンを備えており、前記マイクロフォンの内少なくとも2つ以上が、車両の異なる乗員室内に位置付けられている、信号処理システム。
  3. 請求項1記載の信号処理システムにおいて、前記ノイズ低減アルゴリズムが、スペクトル形状およびパワーの内少なくとも1つに関して、前記信号の背景ノイズが実質的に同等となるように、前記信号の各々を駆動する、信号処理システム。
  4. 請求項1記載の信号処理システムにおいて、前記ノイズ低減アルゴリズムが、前記信号の信号対ノイズ比が実質的に同等となるように、前記信号の各々を駆動する、信号処理システム。
  5. 請求項1記載の信号処理システムにおいて、各信号がチャネルと関連付けられており、前記ノイズ低減アルゴリズムが、少なくとも部分的にノイズ・パワー・スペクトル密度に基づいて、チャネル毎に動的スペクトル・フロアを決定することを含む、信号処理システム。
  6. 請求項1記載の信号処理システムにおいて、前記前処理モジュールが、更に、前記信号の各々の信号レベルを動的に調節する利得制御モジュールを含む、信号処理システム。
  7. 請求項6記載の信号処理システムにおいて、前記利得制御モジュールが、前記信号の各々の信号レベルを動的に目標レベルに調節する、信号処理システム。
  8. 請求項6記載の信号処理システムにおいて、各信号がチャネルと関連付けられており、前記前処理モジュールが、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを含み、前記利得制御モジュールが、前記信号の各々の信号レベルを、その関連付けられたチャネルの優性重みに少なくとも部分的に基づいて調節する、信号処理システム。
  9. 請求項1記載の信号処理システムにおいて、各信号がチャネルと関連付けられており、前記前処理モジュールが、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを含み、前記ノイズ低減アルゴリズムが、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前記前処理信号を生成する、信号処理システム。
  10. 請求項9記載の信号処理システムにおいて、前記ミキサが、更に、前記前処理信号に重み付けする動的重みを含み、前記動的重みが、前記前処理モジュールと関連付けられた優性重みとは異なる、信号処理システム。
  11. 信号処理方法であって、
    複数の信号を受信するステップと、
    ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理して、実質的に同等なノイズ特性を有する前処理信号を生成するステップと、
    前記前処理信号の内少なくとも2つを結合するステップと、
    を備えている、信号処理方法。
  12. 請求項11記載の方法であって、更に、複数のマイクロフォンによって前記複数の信号を供給するステップを備えており、前記マイクロフォンの内少なくとも2つ以上が、車両の異なる乗員室に位置付けられている、方法。
  13. 請求項11記載の方法において、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理するステップが、スペクトル形状およびパワーの内少なくとも1つに関して、前記信号の背景ノイズが実質的に同等となるように、前記信号の各々を駆動するステップを含む、方法。
  14. 請求項11記載の方法において、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理するステップが、前記信号の信号対ノイズ比が実質的に同等となるように、前記信号の各々を駆動するステップを含む、方法。
  15. 請求項11記載の方法において、各信号がチャネルと関連付けられており、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理するステップが、少なくとも部分的にノイズ・パワー・スペクトル密度に基づいて、チャネル毎に動的スペクトル・フロアを決定するステップを含む、方法。
  16. 請求項11記載の方法であって、更に、前記前処理信号を生成するときに、前記信号の各々の信号レベルを動的に調節するステップを備えている、方法。
  17. 請求項16記載の方法において、前記信号の各々の信号レベルを動的に調節するステップが、前記信号の各々の信号レベルを、動的に目標レベルに調節するステップを含む、方法。
  18. 請求項16記載の方法において、各信号がチャネルと関連付けられており、前記方法が、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するステップを含み、前記前処理信号を生成するときに前記信号の各々の信号レベルを動的に調節するステップが、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前記前処理信号を生成するステップを含む、方法。
  19. 請求項11記載の方法において、各信号がチャネルと関連付けられており、前記方法が、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するステップを含み、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理して、前処理信号を生成するステップが、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前記前処理信号を生成するステップを含む、方法。
  20. 請求項19記載の方法において、前記前処理信号の内少なくとも2つを結合するステップが、更に、前記前処理信号に重み付けするために、動的重み係数を用いるステップを含む、方法。
  21. 請求項20記載の方法において、前記前処理信号を結合することに関連する前記動的重み係数が、前記前処理信号を生成することに関連する前記優性重みとは異なる、方法。
  22. 複数の信号を動的に結合するためのコンピュータ・プログラム生産物であって、前記コンピュータ・プログラム生産物が、コンピュータ読み取り可能プログラム・コードを有するコンピュータ使用可能媒体を備えており、前記コンピュータ読み取り可能プログラム・コードが、
    ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理して、実質的に同等なノイズ特性を有する前処理信号を生成するプログラム・コードと、
    前記前処理信号の内少なくとも2つを結合するプログラム・コードと、
    を含む、コンピュータ・プログラム生産物。
  23. 請求項22記載のコンピュータ・プログラム生産物において、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理するプログラム・コードが、スペクトル形状およびパワーの内少なくとも1つに関して、前記信号の背景ノイズが実質的に同等となるように、前記信号の各々を駆動するプログラム・コードを含む、コンピュータ・プログラム生産物。
  24. 請求項22記載のコンピュータ・プログラム生産物において、各信号がチャネルと関連付けられており、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理するプログラム・コードが、少なくとも部分的にノイズ・パワー・スペクトル密度に基づいて、チャネル毎に動的スペクトル・フロアを決定するプログラム・コードを含む、コンピュータ・プログラム生産物。
  25. 請求項22記載のコンピュータ・プログラム生産物であって、更に、前記前処理信号を生成するときに、前記信号の各々の信号レベルを動的に調節するプログラム・コードを備えている、コンピュータ・プログラム生産物。
  26. 請求項25記載のコンピュータ・プログラム生産物において、各信号がチャネルと関連付けられており、前記コンピュータ・プログラム生産物が、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するプログラム・コードを含み、前記前処理信号を生成するときに、前記信号の各々の信号レベルを動的に調節するプログラム・コードが、チャネル毎に、その関連付けられた優性重みに少なくとも部分的に基づいて、前記前処理信号を生成するプログラム・コードを含む、コンピュータ・プログラム生産物。
  27. 請求項22記載のコンピュータ・プログラム生産物において、各信号がチャネルと関連付けられており、前記コンピュータ・プログラム生産物が、更に、チャネル毎に優性重みを決定する音声活動検出モジュールを適用するプログラム・コードを含み、ノイズ低減アルゴリズムにしたがって前記信号の各々を動的にフィルタ処理して、前処理信号を生成するプログラム・コードが、チャネル毎に、それに関連付けられた優性重みに少なくとも部分的に基づいて、前記前処理信号を生成するプログラム・コードを含む、コンピュータ・プログラム生産物。
  28. 請求項27記載のコンピュータ・プログラム生産物において、前記前処理信号の内少なくとも2つを結合するプログラム・コードが、更に、前記前処理信号に重み付けするために、動的重み係数を用いるステップを含む、コンピュータ・プログラム生産物。
  29. 請求項28記載のコンピュータ・プログラム生産物において、前記前処理信号を結合することに関連する前記動的重み係数が、前記前処理信号を生成することに関連する前記優性重みとは異なる、コンピュータ・プログラム生産物。
JP2013540940A 2010-11-29 2010-11-29 動的マイクロフォン信号ミキサ Expired - Fee Related JP5834088B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2010/058168 WO2012074503A1 (en) 2010-11-29 2010-11-29 Dynamic microphone signal mixer

Publications (2)

Publication Number Publication Date
JP2014502471A true JP2014502471A (ja) 2014-01-30
JP5834088B2 JP5834088B2 (ja) 2015-12-16

Family

ID=46172182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013540940A Expired - Fee Related JP5834088B2 (ja) 2010-11-29 2010-11-29 動的マイクロフォン信号ミキサ

Country Status (6)

Country Link
US (1) US20130325458A1 (ja)
EP (1) EP2647223B1 (ja)
JP (1) JP5834088B2 (ja)
KR (1) KR101791444B1 (ja)
CN (1) CN103299656B (ja)
WO (1) WO2012074503A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016516343A (ja) * 2013-03-13 2016-06-02 コピン コーポレーション 雑音キャンセリングマイクロホン装置
KR20190065424A (ko) * 2016-10-18 2019-06-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 처리 장치 및 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9641933B2 (en) * 2012-06-18 2017-05-02 Jacob G. Appelbaum Wired and wireless microphone arrays
DK2765787T3 (da) * 2013-02-07 2020-03-09 Oticon As Fremgangsmåde til reduktion af ikke-korreleret støj i en audiobehandlingsenhed
WO2015065362A1 (en) * 2013-10-30 2015-05-07 Nuance Communications, Inc Methods and apparatus for selective microphone signal combining
EP3275208B1 (en) 2015-03-25 2019-12-25 Dolby Laboratories Licensing Corporation Sub-band mixing of multiple microphones
US10923132B2 (en) 2016-02-19 2021-02-16 Dolby Laboratories Licensing Corporation Diffusivity based sound processing method and apparatus
KR102423744B1 (ko) * 2016-12-30 2022-07-21 하만 베커 오토모티브 시스템즈 게엠베하 음향 반향 제거
US10491179B2 (en) * 2017-09-25 2019-11-26 Nuvoton Technology Corporation Asymmetric multi-channel audio dynamic range processing
CN107910012B (zh) * 2017-11-14 2020-07-03 腾讯音乐娱乐科技(深圳)有限公司 音频数据处理方法、装置及系统
FR3103618B1 (fr) * 2019-11-21 2021-10-22 Psa Automobiles Sa Dispositif pour mettre en œuvre un assistant personnel virtuel dans un véhicule automobile avec contrôle par la voix d’un utilisateur, et véhicule automobile l’incorporant

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005064968A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 収音方法、その装置、そのプログラム、およびその記録媒体。
JP2007235943A (ja) * 2006-03-01 2007-09-13 Harman Becker Automotive Systems Gmbh 音声信号取得のためのハンドフリーシステム
JP2009171208A (ja) * 2008-01-16 2009-07-30 Fujitsu Ltd 自動音量制御装置及びそれを用いた音声通信装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5598466A (en) * 1995-08-28 1997-01-28 Intel Corporation Voice activity detector for half-duplex audio communication system
US6411927B1 (en) * 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
US6473733B1 (en) * 1999-12-01 2002-10-29 Research In Motion Limited Signal enhancement for voice coding
US6674865B1 (en) * 2000-10-19 2004-01-06 Lear Corporation Automatic volume control for communication system
US8934382B2 (en) * 2001-05-10 2015-01-13 Polycom, Inc. Conference endpoint controlling functions of a remote device
DE602004004503D1 (de) * 2004-04-02 2007-03-15 Suisse Electronique Microtech HF-Mehrbandempfänger mit Vorrichtung zur Reduzierung des Energieverbrauches
DE602004015987D1 (de) * 2004-09-23 2008-10-02 Harman Becker Automotive Sys Mehrkanalige adaptive Sprachsignalverarbeitung mit Rauschunterdrückung
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
WO2006080358A1 (ja) * 2005-01-26 2006-08-03 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US8175874B2 (en) * 2005-11-17 2012-05-08 Shaul Shimhi Personalized voice activity detection
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
US8249271B2 (en) * 2007-01-23 2012-08-21 Karl M. Bizjak Noise analysis and extraction systems and methods
US8447044B2 (en) * 2007-05-17 2013-05-21 Qnx Software Systems Limited Adaptive LPC noise reduction system
JP4580409B2 (ja) * 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
JP4455614B2 (ja) * 2007-06-13 2010-04-21 株式会社東芝 音響信号処理方法及び装置
US8374854B2 (en) * 2008-03-28 2013-02-12 Southern Methodist University Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition
JP5087476B2 (ja) * 2008-06-12 2012-12-05 ルネサスエレクトロニクス株式会社 受信装置およびその動作方法
GB2461082A (en) * 2008-06-20 2009-12-23 Ubidyne Inc Antenna array calibration with reduced interference from a payload signal
US8503694B2 (en) * 2008-06-24 2013-08-06 Microsoft Corporation Sound capture system for devices with two microphones
US8811537B2 (en) * 2008-12-03 2014-08-19 Electronics And Telecommunications Research Institute Signal receiving apparatus and method for wireless communication system using multiple antennas
WO2010091077A1 (en) * 2009-02-03 2010-08-12 University Of Ottawa Method and system for a multi-microphone noise reduction
JP5207479B2 (ja) * 2009-05-19 2013-06-12 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005064968A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 収音方法、その装置、そのプログラム、およびその記録媒体。
JP2007235943A (ja) * 2006-03-01 2007-09-13 Harman Becker Automotive Systems Gmbh 音声信号取得のためのハンドフリーシステム
JP2009171208A (ja) * 2008-01-16 2009-07-30 Fujitsu Ltd 自動音量制御装置及びそれを用いた音声通信装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016516343A (ja) * 2013-03-13 2016-06-02 コピン コーポレーション 雑音キャンセリングマイクロホン装置
US10379386B2 (en) 2013-03-13 2019-08-13 Kopin Corporation Noise cancelling microphone apparatus
KR20190065424A (ko) * 2016-10-18 2019-06-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 처리 장치 및 방법
KR102269396B1 (ko) * 2016-10-18 2021-06-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 처리 장치 및 방법
US11056128B2 (en) 2016-10-18 2021-07-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal using noise suppression filter values
US11664040B2 (en) 2016-10-18 2023-05-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for reducing noise in an audio signal

Also Published As

Publication number Publication date
KR20140032354A (ko) 2014-03-14
KR101791444B1 (ko) 2017-10-30
CN103299656B (zh) 2016-08-10
EP2647223B1 (en) 2019-08-07
CN103299656A (zh) 2013-09-11
WO2012074503A1 (en) 2012-06-07
EP2647223A1 (en) 2013-10-09
US20130325458A1 (en) 2013-12-05
JP5834088B2 (ja) 2015-12-16
EP2647223A4 (en) 2017-01-04

Similar Documents

Publication Publication Date Title
JP5834088B2 (ja) 動的マイクロフォン信号ミキサ
US9792927B2 (en) Apparatuses and methods for multi-channel signal compression during desired voice activity detection
US11631421B2 (en) Apparatuses and methods for enhanced speech recognition in variable environments
KR100860805B1 (ko) 음성 강화 시스템
US8930186B2 (en) Speech enhancement with minimum gating
EP3053356B1 (en) Methods and apparatus for selective microphone signal combining
KR101726737B1 (ko) 다채널 음원 분리 장치 및 그 방법
JP5203933B2 (ja) オーディオ雑音を減少させるシステムおよび方法
US9633670B2 (en) Dual stage noise reduction architecture for desired signal extraction
Schmidt et al. Signal processing for in-car communication systems
US9711162B2 (en) Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event
EP2463856B1 (en) Method to reduce artifacts in algorithms with fast-varying gain
JP2007306553A (ja) マルチチャネルの反響補償
US9532149B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
JP2009503568A (ja) 雑音環境における音声信号の着実な分離
JP2001350498A (ja) 時間領域雑音抑圧
WO2008104446A2 (en) Method for reducing noise in an input signal of a hearing device as well as a hearing device
US9532138B1 (en) Systems and methods for suppressing audio noise in a communication system
EP2490459B1 (en) Method for voice signal blending
JP2004341339A (ja) 雑音抑圧装置
US20060184361A1 (en) Method and apparatus for reducing an interference noise signal fraction in a microphone signal
JP4413205B2 (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
Matheja et al. Dynamic signal combining for distributed microphone systems in car environments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141020

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150119

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151030

R150 Certificate of patent or registration of utility model

Ref document number: 5834088

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees