JP6643336B2 - 一次チャネルと基準チャネルとの間の雑音および音の電力レベル差の決定 - Google Patents
一次チャネルと基準チャネルとの間の雑音および音の電力レベル差の決定 Download PDFInfo
- Publication number
- JP6643336B2 JP6643336B2 JP2017525365A JP2017525365A JP6643336B2 JP 6643336 B2 JP6643336 B2 JP 6643336B2 JP 2017525365 A JP2017525365 A JP 2017525365A JP 2017525365 A JP2017525365 A JP 2017525365A JP 6643336 B2 JP6643336 B2 JP 6643336B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- audio signal
- channel
- primary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 84
- 238000000034 method Methods 0.000 claims description 73
- 238000009499 grossing Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000005352 clarification Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 description 28
- 238000012937 correction Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 12
- 238000007476 Maximum Likelihood Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本願は、米国仮出願第62/078,828号(2014年11月12日出願、名称「Determining Noise Power Level Difference and/or Sound Power Level Difference between Primary and Reference Channels of an Audio Signal」)の利益およびそれに対する優先権を主張し、上記出願は、その全体が参照により本明細書に引用される。
本開示は、オーディオ信号の一次チャネルとオーディオ信号の基準チャネルとの間の雑音および/または音の電力レベルにおける差異を決定する技法に関する。
(1.1 信号モデル)
2つのマイクロホンから着信する時間領域信号は、一次マイクロホンに対してy1と呼ばれ、二次(基準)マイクロホンに対してy2と呼ばれる。信号は、音声信号および雑音擾乱の合計
一次チャネルの事前および事後SNRの推定は、λs1およびλd1の推定を要求する。λd1を推定するための単純な方法は、基準チャネルを使用することである。両方のマイクロホンにおける雑音信号がほぼ同一の強度を有し、基準チャネルにおける音声信号が雑音信号と比較して弱いと仮定すると、λd2の推定値が、信号電力の指数平滑化|Y2 2|を用いて取得され、それをλd1の推定値としても使用する。
FFT領域における信号の差異は、係数Cs(k,m)およびCd(k,m)を用いてモデル化されることができる。これらの周波数依存性係数は、2つのマイクロホンにおける音声または雑音レベルの平均差を説明するために導入される。それらは、経時的に変化し得るが、それらの大きさは、フレームレートよりもはるかに緩慢な速度で変化すると仮定される。FFT領域における信号モデルは、ここでは、
CdN1が、既知であると仮定する。音声FFT係数が平均0および分散λsを伴う複素ガウス分布によってモデル化される場合、CdN1の値を与えられるノイジーFFT係数の確率密度関数(PDF)は、平均CdN1および分散λsを伴う複素ガウス
Csの推定量を導出するために、(8)は、形式
データ駆動雑音分散推定値
本節では、人工および測定された雑音信号によるいくつかの結果が、PLD推定量(14)および(21)の性能を例証するために示される。第1の実施例では、人工デュアルチャネル信号が、構築される。一次クリーン音声信号は、(16kHzにおいてサンプリングされる)TIMITセンテンスであり、単位分散に正規化される。無音フレームは、除去されない。二次チャネルは、5で除算される同一の信号である。これは、20×log10(1/5)=-14dBのSPLDに対応する。一次チャネルにおける雑音は、白色雑音であり、基準チャネルにおける雑音は、適切な全極型フィルタを用いて白色雑音をフィルタ処理することによって取得される音声形状雑音である。両方の雑音信号は、最初に、単位分散に正規化され、次いで、一次チャネルにおけるSNRが5dBに等しくなるように、同一の係数を用いてスケーリングされる。図1は、クリーンおよびノイジー信号の平均スペクトルを示す。平均一次音声スペクトルは、より低い周波数範囲における雑音スペクトルよりも強いが、より高い周波数範囲におけるものよりも強くない。平均基準音声スペクトルは、雑音スペクトルよりもはるかに弱い。
(5.1 雑音分散の補正)
NPLDおよびSPLD推定の問題を掘り下げる主な理由は、基準チャネルから取得される雑音分散推定値(6)を改良することであった。NPLDおよびSPLDスペクトルは、(6)の補正を計算するために使用されることができ、これは、一次チャネルにおける雑音分散に近似するはずである。基準チャネルにおける音声信号が非常に弱い場合では、NPLD補正のみを適用することで十分であろう。NPLD補正は、(6)に推定されたNPLDスペクトルを乗算することによって、容易に実装されることができる。
レベル間差フィルタ(ILDF)は、MMSE利得を、一実施形態では、以下のような一次および基準チャネルの大きさの比率に依存する係数f
雑音分散および後置フィルタ補正とは別に、NPLDおよびSPLDは、いくつかの他の方法において有用であり得る。いくつかの音声処理アルゴリズムが、信号特徴に対して訓練される。例えば、VADならびに音声および話者認識システムである。複数のチャネルが特徴を算出するために使用される場合、これらのアルゴリズムは、PLDベースの特徴補正からそれらの用途において利益を享受し得る。それは、そのような補正が、訓練において見られる特徴と実践において直面するものとの間の差異を減少させ得るからである。
図6は、NPLDおよびSPLDの推定および補正手順と、それらが新規のスペクトル音声増進システムに適合する方法との概観を示す。注記:本図の区分III−Aは、本文書の段落[0050]−[0062]に対応する。
区分III−Bは、段落[0063]−[0071]に対応する。
区分V−Aは、段落[0079]−[0089]に対応する。
区分V−Bは、段落[0090]−[0091]に対応する。
以下の参考文献は、その全体が、参照することによって本明細書に組み込まれる。
Claims (20)
- オーディオデバイスの一次マイクロホンと基準マイクロホンとの間の雑音電力レベル差(NPLD)を推定する方法であって、
オーディオデバイスの一次マイクロホンを用いて、オーディオ信号の一次チャネルを取得することと、
前記オーディオデバイスの基準マイクロホンを用いて、前記オーディオ信号の基準チャネルを取得することと、
前記オーディオ信号の前記基準チャネルの雑音の大きさを推定し、1つ以上の周波数に対する雑音分散推定値を提供することと、
前記オーディオ信号の前記一次チャネルの高速フーリエ変換(FFT)係数の確率密度関数(PDF)をモデル化することと、
前記PDFを最大化し、前記基準チャネルの前記雑音分散推定値と前記一次チャネルの雑音分散推定値との間のNPLDを提供することと、
前記オーディオ信号の前記基準チャネルのFFT係数のPDFをモデル化することと、
前記PDFを最大化し、前記一次チャネルの音声FFT係数と前記基準チャネルの音声FFT係数との間の複素音声電力レベル差(SPLD)係数を提供することと、
前記雑音分散推定値、前記NPLD、および前記SPLD係数に基づいて、前記基準チャネルの補正された雑音の大きさを計算することと
を含む、方法。 - 前記基準チャネルの雑音電力レベルは、前記一次チャネルの雑音電力レベルとは異なる、請求書1に記載の方法。
- 前記基準チャネルの雑音の大きさを推定すること、前記一次チャネルのFFT係数のPDFをモデル化すること、および前記PDFを最大化することは、連続的に行われ、前記NPLDを追跡することをさらに含む、請求書1に記載の方法。
- 前記NPLDを追跡することは、連続した時間フレームにわたる統計の指数平滑化を含む、請求項3に記載の方法。
- 前記連続した時間フレームにわたる統計の指数平滑化は、データ駆動帰納的雑音電力推定を含む、請求項4に記載の方法。
- 音声が前記オーディオ信号の少なくとも前記一次チャネルに存在する可能性を決定することをさらに含む、請求項3に記載の方法。
- 音声が前記オーディオ信号の少なくとも前記一次チャネルに存在する可能性が高い場合、前記追跡することが起こる速度を減速させる、請求項6に記載の方法。
- 前記基準チャネルの雑音の大きさを推定することは、データ駆動帰納的雑音電力推定を含む、請求項1に記載の方法。
- 前記オーディオ信号の前記一次チャネルのFFT係数のPDFをモデル化することは、複素ガウスPDFをモデル化することを含み、前記複素ガウス分布の平均は、前記NPLDに依存する、請求項1に記載の方法。
- 前記オーディオ信号の前記一次チャネルにおける音声と前記オーディオ信号の前記基準チャネルにおける音声との相対強度を決定することをさらに含む、請求項1に記載の方法。
- 前記相対強度を決定することは、経時的に前記相対強度を追跡することを含む、請求項10に記載の方法。
- 前記相対強度を決定することは、データ駆動帰納的雑音電力推定を含む、請求項10に記載の方法。
- 前記NPLDおよび前記SPLD係数を適用することに先立って、最小平均二乗(LMS)フィルタを適用することをさらに含む、請求項10に記載の方法。
- 前記基準チャネルの雑音の大きさを推定すること、前記一次チャネルのFFT係数のPDFをモデル化すること、および前記PDFを最大化することは、前記オーディオ信号の少なくともいくつかのフィルタ処理の前に起こる、請求項1に記載の方法。
- 前記基準チャネルの雑音の大きさを推定すること、前記一次チャネルのFFT係数のPDFをモデル化すること、および前記PDFを最大化することは、前記一次チャネルおよび前記基準チャネルの最小平均二乗誤差(MMSE)フィルタ処理の前に起こる、請求項14に記載の方法。
- 前記基準チャネルのFFT係数のPDFをモデル化することは、複素ガウス分布をモデル化することを含み、前記複素ガウス分布の平均は、前記複素SPLD係数に依存する、請求項1に記載の方法。
- 前記基準チャネルの雑音の大きさを推定すること、前記一次チャネルおよび基準チャネルのFFT係数のPDFをモデル化すること、および前記PDFを最大化することは、オーディオ信号が主要フィルタ処理または明瞭化プロセスを受けた後、前記オーディオ信号のレベル差後処理のために前記基準チャネルの雑音分散をスケーリングすることを含む、請求項1に記載の方法。
- 音声活動および識別可能な話者音声活動のうちの1つ以上のものを検出することにおいて、前記NPLDおよびSPLDを使用することをさらに含む、請求項1に記載の方法。
- 前記NPLDおよびSPLDは、最高の信号対雑音比を達成するために、マイクロホン間の選択において使用される、請求項1に記載の方法。
- オーディオデバイスであって、
オーディオ信号を受信し、前記オーディオ信号の一次チャネルを通信するための一次マイクロホンと、
前記オーディオ信号を前記一次マイクロホンとは異なる状況で受信し、前記オーディオ信号の基準チャネルを通信するための基準マイクロホンと、
前記オーディオ信号をフィルタ処理および/または明瞭化するために前記オーディオ信号を処理する少なくとも1つの処理要素と
を備え、
前記少なくとも1つの処理要素は、オーディオデバイスの一次マイクロホンと基準マイクロホンとの間の雑音電力レベル差(NPLD)を推定する方法を行うためのプログラムを実行するように構成され、
前記方法は、
オーディオデバイスの一次マイクロホンを用いて、オーディオ信号の一次チャネルを取得することと、
前記オーディオデバイスの基準マイクロホンを用いて、前記オーディオ信号の基準チャネルを取得することと、
前記オーディオ信号の前記基準チャネルの雑音の大きさを推定し、1つ以上の周波数に対する雑音分散推定値を提供することと、
前記オーディオ信号の前記一次チャネルの高速フーリエ変換(FFT)係数の確率密度関数(PDF)をモデル化することと、
前記PDFを最大化し、前記基準チャネルの前記雑音分散推定値と前記一次チャネルの雑音分散推定値との間のNPLDを提供することと、
前記オーディオ信号の基準チャネルのFFT係数のPDFをモデル化することと、
前記PDFを最大化し、前記一次チャネルの音声FFT係数と前記基準チャネルの音声FFT係数との間の複素音声電力レベル差(SPLD)係数を提供することと、
前記雑音分散推定値、前記NPLD、および前記SPLD係数に基づいて、前記基準チャネルの補正された雑音の大きさを計算することと
を含む、オーディオデバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462078828P | 2014-11-12 | 2014-11-12 | |
US62/078,828 | 2014-11-12 | ||
US14/938,798 US10127919B2 (en) | 2014-11-12 | 2015-11-11 | Determining noise and sound power level differences between primary and reference channels |
US14/938,798 | 2015-11-11 | ||
PCT/US2015/060323 WO2016077547A1 (en) | 2014-11-12 | 2015-11-12 | Determining noise and sound power level differences between primary and reference channels |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017538344A JP2017538344A (ja) | 2017-12-21 |
JP6643336B2 true JP6643336B2 (ja) | 2020-02-12 |
Family
ID=55913289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017525365A Active JP6643336B2 (ja) | 2014-11-12 | 2015-11-12 | 一次チャネルと基準チャネルとの間の雑音および音の電力レベル差の決定 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10127919B2 (ja) |
EP (1) | EP3218902A4 (ja) |
JP (1) | JP6643336B2 (ja) |
KR (1) | KR102431896B1 (ja) |
CN (1) | CN107408394B (ja) |
WO (1) | WO2016077547A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI573133B (zh) * | 2015-04-15 | 2017-03-01 | 國立中央大學 | 音訊處理系統及方法 |
JP6732944B2 (ja) * | 2016-12-16 | 2020-07-29 | 日本電信電話株式会社 | 目的音強調装置、雑音推定用パラメータ学習装置、目的音強調方法、雑音推定用パラメータ学習方法、プログラム |
GB201719734D0 (en) * | 2017-10-30 | 2018-01-10 | Cirrus Logic Int Semiconductor Ltd | Speaker identification |
US10847173B2 (en) | 2018-02-13 | 2020-11-24 | Intel Corporation | Selection between signal sources based upon calculated signal to noise ratio |
JP2021536692A (ja) * | 2018-09-13 | 2021-12-27 | アリババ グループ ホウルディング リミテッド | ヒューマンマシン音声対話装置及びその操作方法 |
TWI759591B (zh) * | 2019-04-01 | 2022-04-01 | 威聯通科技股份有限公司 | 語音增強方法及系統 |
CN110767245B (zh) * | 2019-10-30 | 2022-03-25 | 西南交通大学 | 基于s型函数的语音通信自适应回声消除方法 |
KR102508413B1 (ko) * | 2019-11-01 | 2023-03-10 | 가우디오랩 주식회사 | 주파수 스펙트럼 보정을 위한 오디오 신호 처리 방법 및 장치 |
CN110853664B (zh) * | 2019-11-22 | 2022-05-06 | 北京小米移动软件有限公司 | 评估语音增强算法性能的方法及装置、电子设备 |
CN113473314A (zh) * | 2020-03-31 | 2021-10-01 | 华为技术有限公司 | 音频信号处理方法以及相关设备 |
CN111627426B (zh) * | 2020-04-30 | 2023-11-17 | 锐迪科微电子科技(上海)有限公司 | 消除语音交互中信道差异的方法及系统、电子设备及介质 |
DE102020209050B4 (de) * | 2020-07-20 | 2022-05-25 | Sivantos Pte. Ltd. | Verfahren zum Betrieb eines Hörsystems, Hörsystem, Hörgerät |
CN112750447B (zh) * | 2020-12-17 | 2023-01-24 | 云知声智能科技股份有限公司 | 一种去除风噪的方法 |
CN113270106B (zh) * | 2021-05-07 | 2024-03-15 | 深圳市友杰智新科技有限公司 | 双麦克风的风噪声抑制方法、装置、设备及存储介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI114247B (fi) * | 1997-04-11 | 2004-09-15 | Nokia Corp | Menetelmä ja laite puheen tunnistamiseksi |
EP2237270B1 (en) * | 2009-03-30 | 2012-07-04 | Nuance Communications, Inc. | A method for determining a noise reference signal for noise compensation and/or noise reduction |
US8737636B2 (en) * | 2009-07-10 | 2014-05-27 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive active noise cancellation |
US9378754B1 (en) * | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
JP5573517B2 (ja) * | 2010-09-07 | 2014-08-20 | ソニー株式会社 | 雑音除去装置および雑音除去方法 |
US8898058B2 (en) * | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
US9330675B2 (en) * | 2010-11-12 | 2016-05-03 | Broadcom Corporation | Method and apparatus for wind noise detection and suppression using multiple microphones |
US9264804B2 (en) * | 2010-12-29 | 2016-02-16 | Telefonaktiebolaget L M Ericsson (Publ) | Noise suppressing method and a noise suppressor for applying the noise suppressing method |
US8903722B2 (en) * | 2011-08-29 | 2014-12-02 | Intel Mobile Communications GmbH | Noise reduction for dual-microphone communication devices |
US8751220B2 (en) * | 2011-11-07 | 2014-06-10 | Broadcom Corporation | Multiple microphone based low complexity pitch detector |
US9094749B2 (en) * | 2012-07-25 | 2015-07-28 | Nokia Technologies Oy | Head-mounted sound capture device |
US20140037100A1 (en) * | 2012-08-03 | 2014-02-06 | Qsound Labs, Inc. | Multi-microphone noise reduction using enhanced reference noise signal |
US9330652B2 (en) | 2012-09-24 | 2016-05-03 | Apple Inc. | Active noise cancellation using multiple reference microphone signals |
US20150262574A1 (en) * | 2012-10-31 | 2015-09-17 | Nec Corporation | Expression classification device, expression classification method, dissatisfaction detection device, dissatisfaction detection method, and medium |
WO2014127543A1 (en) | 2013-02-25 | 2014-08-28 | Spreadtrum Communications(Shanghai) Co., Ltd. | Detecting and switching between noise reduction modes in multi-microphone mobile devices |
US9106989B2 (en) | 2013-03-13 | 2015-08-11 | Cirrus Logic, Inc. | Adaptive-noise canceling (ANC) effectiveness estimation and correction in a personal audio device |
US9338551B2 (en) | 2013-03-15 | 2016-05-10 | Broadcom Corporation | Multi-microphone source tracking and noise suppression |
-
2015
- 2015-11-11 US US14/938,798 patent/US10127919B2/en active Active
- 2015-11-12 EP EP15858291.6A patent/EP3218902A4/en not_active Withdrawn
- 2015-11-12 KR KR1020177015615A patent/KR102431896B1/ko active IP Right Grant
- 2015-11-12 WO PCT/US2015/060323 patent/WO2016077547A1/en active Application Filing
- 2015-11-12 CN CN201580073104.8A patent/CN107408394B/zh active Active
- 2015-11-12 JP JP2017525365A patent/JP6643336B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US10127919B2 (en) | 2018-11-13 |
JP2017538344A (ja) | 2017-12-21 |
WO2016077547A1 (en) | 2016-05-19 |
KR20170082595A (ko) | 2017-07-14 |
CN107408394B (zh) | 2021-02-05 |
EP3218902A4 (en) | 2018-05-02 |
US20160134984A1 (en) | 2016-05-12 |
CN107408394A (zh) | 2017-11-28 |
EP3218902A1 (en) | 2017-09-20 |
KR102431896B1 (ko) | 2022-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6643336B2 (ja) | 一次チャネルと基準チャネルとの間の雑音および音の電力レベル差の決定 | |
JP6694426B2 (ja) | ランニング範囲正規化を利用したニューラルネットワーク音声活動検出 | |
JP5186510B2 (ja) | スピーチ明瞭度強化方法と装置 | |
Gerkmann et al. | Noise power estimation based on the probability of speech presence | |
KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
Gerkmann et al. | Unbiased MMSE-based noise power estimation with low complexity and low tracking delay | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
JP5842056B2 (ja) | 雑音推定装置、雑音推定方法、雑音推定プログラム及び記録媒体 | |
US9548064B2 (en) | Noise estimation apparatus of obtaining suitable estimated value about sub-band noise power and noise estimating method | |
JP6748304B2 (ja) | ニューラルネットワークを用いた信号処理装置、ニューラルネットワークを用いた信号処理方法及び信号処理プログラム | |
US10332541B2 (en) | Determining noise and sound power level differences between primary and reference channels | |
WO2020024787A1 (zh) | 音乐噪声抑制方法及装置 | |
JP2016006536A (ja) | 複素音響共鳴音声分析システム | |
BR112014009647B1 (pt) | Aparelho de atenuação do ruído e método de atenuação do ruído | |
Das et al. | Application of the tuned Kalman filter in speech enhancement | |
Rehr et al. | An analysis of adaptive recursive smoothing with applications to noise PSD estimation | |
Parchami et al. | Model-based estimation of late reverberant spectral variance using modified weighted prediction error method | |
Samui et al. | Two-Stage Temporal Processing for Single-Channel Speech Enhancement. | |
JP2015141335A (ja) | 雑音推定装置、方法及びプログラム | |
US9570095B1 (en) | Systems and methods for instantaneous noise estimation | |
JP6000094B2 (ja) | 話者適応化装置、話者適応化方法、プログラム | |
Moliner et al. | BUDDy: Single-Channel Blind Unsupervised Dereverberation with Diffusion Models | |
Herzog et al. | Blind Single-Channel Dereverberation Using a Recursive Maximum-Sparseness-Power-Prediction-Model | |
JP2017067951A (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6643336 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |