JP6857344B2 - オーディオ信号を処理するための装置および方法 - Google Patents
オーディオ信号を処理するための装置および方法 Download PDFInfo
- Publication number
- JP6857344B2 JP6857344B2 JP2019541884A JP2019541884A JP6857344B2 JP 6857344 B2 JP6857344 B2 JP 6857344B2 JP 2019541884 A JP2019541884 A JP 2019541884A JP 2019541884 A JP2019541884 A JP 2019541884A JP 6857344 B2 JP6857344 B2 JP 6857344B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- value
- noise suppression
- suppression filter
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 302
- 238000000034 method Methods 0.000 title claims description 59
- 238000012545 processing Methods 0.000 title claims description 42
- 230000001629 suppression Effects 0.000 claims description 310
- 230000000694 effects Effects 0.000 claims description 67
- 238000001914 filtration Methods 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 230000007423 decrease Effects 0.000 claims description 11
- 230000009467 reduction Effects 0.000 description 53
- 238000010586 diagram Methods 0.000 description 33
- 230000004044 response Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 15
- 230000003321 amplification Effects 0.000 description 14
- 238000003199 nucleic acid amplification method Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 238000005086 pumping Methods 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 8
- 230000002238 attenuated effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/002—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
、およびオーディオ信号110に含まれるノイズのPSD
に基づいて、例えばウィーナーフィルタのような最適なフィルタに従って推定することができ、
式中、例えばmは、時間フレーム指数であり、kは、スペクトルサブバンド指数である。ウィーナーフィルタHNR,Wiener(m,k)は、上述のように算出された、ノイズのある信号から所望の信号を抽出する。実際には、PSDは、ウィーナーフィルタに対して推定する必要がある。
ウィーナーフィルタHNR,Wiener(m,k)の式は、以下のように再定式化することができる。
したがって、ウィーナーフィルタHNR,Wiener(m,k)は、SNR(m,k)=0に対してゼロの値をとり、大きいSNR値に対して1の値に収束し、これは、所望の信号成分を維持しながらノイズを減衰させるのに望ましい挙動である。あるいは、スペクトル振幅推定量[4]のような異なるタイプのフィルタを、制約のないノイズ抑制フィルタ値を推定するために使用することができる。さらに、制約のないノイズ抑制フィルタ値は、発見的関数に基づくことができる。
、
ここでは、ウィーナーフィルタベースの制約のないノイズ抑制フィルタ値HNR,Wiener(m,k)について説明したが、それに応じて、異なる方法で得られる制約のないノイズ抑制フィルタ値HNR(m,k)にも適用することができる。ノイズ減衰限界glimは、
のように定義することができる。これは、フィルタの最大ノイズ減衰GNR,Wiener(m,k)に対応し、これはまた、スピーチ休止中の所望の量のノイズ減衰、すなわち
として解釈することもできる。典型的には、−20dB〜−10dBの間で選択される。他のフィルタリング規則もウィーナーフィルタの代わりに用いることができるので、上述の式は、以下のように一般化することができる:
式中、HNR(m,k)は、任意のノイズ低減規則に基づく、任意の制約のないノイズ抑制フィルタ値を指す。
これは、ノイズ低減について上述したように、ウィーナーフィルタ
の関数として再定式化することができる:
、
式中、GAGC(m)は、利得値、例えばAGCスケーリングファクタである。
したがって、
の検査から、NRおよびAGCを共同で実行することは、最小ノイズ抑制値、例えばAGC利得に比例するノイズ減衰限界を条件として、ウィーナーフィルタの出力において(またはその入力において等価的に)AGCスケーリングファクタGAGC(m)を適用することと等価であることは明らかである。
が適用され、NRフィルタが得られる
、
式中、
は、所望のノイズ減衰
およびAGC利得の関数としてフレームごとに適応される。上付き文字[UC]は、後で提示される制約のある場合とは対照的に、制約のない場合を指す。
は、
に従って得ることができる。さらなる態様によれば、AGCが信号を減衰させるときにノイズのよりよい減衰を得るために、最小ノイズ抑圧値、例えば制約のないノイズ減衰限界が定義される(すなわちGAGC(m)<1):
。
、例えばノイズ減衰限界を介してNRフィルタ
設計に直接含まれる。
の代わりに時変ノイズ減衰限界
を使用する利点を説明するために、フィルタ全体の応答
は、スピーチ(高SNR)またはノイズ(低SNR)のどちらかが支配的な時間/周波数領域に対して導出される:
・ケース
・ノイズが支配的な低SNR時間/周波数領域では、NRフィルタ
がその最小値
に達し、したがって全体的なシステム応答
が以下のようになると仮定することができる:
、
これは、ノイズが支配的なセグメントが、AGC利得に関係なく、所望の量のノイズ低減によってスケーリングされることを示す。
、したがって全応答が以下のようになると仮定することができる:
、
これは、スピーチが支配的なセグメントが、所望の量のノイズ低減に関係なく、所望通りにAGC利得によってスケーリングされることを示す。
上記と同じ推論を使用して、以下のように書くことができる。
、
、
これは、スピーチセグメントが予想通りにAGC利得GAGC(m)によってスケーリングされ、ノイズが所望の量のノイズ減衰gdesによって少なくとも減衰されることを示す。
に従って適応させることが、AGC利得をプラスにするためにシステム出力でスピーチおよびノイズレベルを完全に制御することは明らかである。したがって、グラフ1250に示すように、一貫したスピーチおよびノイズレベルを達成することができ、ノイズポンピング効果を回避することができる。
から、ノイズが入力と比較して出力で増幅されず、最小量のノイズ減衰が保証されることがわかる。この場合、これは時変AGC減衰によって引き起こされる低レベルの時変ノイズフロアを招くことに注意されたい。しかしながら、実際には、入力スピーチレベルは比較的一定のままであると仮定することができる。VADがスピーチの存在を正確に検出することができる場合、AGC利得は収束後ゆっくりとしか変動せず、システム出力における絶対ノイズレベルはゆっくりとしか変動せず、これはノイズポンピング効果を回避する。
・特にスピーチが最も弱い高周波数でのスピーチ歪み
・背景ノイズが非常に非定常的に着色されていることによって特徴付けられる楽音。
、
式中、上付き文字[DC]は、上付き文字[UC]で示される前述の場合とは対照的に、歪み制約付きの場合を示す。この手法は、図7および図9にさらに詳細に示されている。
、
であり、
これにより、フィルタ全体でNRおよびAGCが実行される:
歪み限界gDL358aは、満たすべき定数
である。これは、システムによって許容されるSNR改善の量としても理解することができる。低い値gDLに設定すると、ノイズ低減アーティファクトから適切に保護されるが、ノイズの減衰量が少なくなる。これはグラフ1260に示されており、ここではスピーチが増幅されるにつれてノイズレベルが増加する。非常に大きい歪み限界gDL358aが基本的に制約を緩和し、
がその制約のない対応物
と等価になることは容易に確認することができる。歪み限界は、典型的には、15dB〜25dBの間で選択される。
それによって、ノイズ抑制フィルタ値364が得られる。ノイズ抑制フィルタ値の上述の下限は、過度に積極的なノイズ低減による歪みを回避するのに有利であり得る。
最後のステップにおいて、最小ノイズ抑制フィルタ値358cは、制約のないノイズ抑制フィルタ値356aと比較され、その結果最大決定630に基づいて、最小ノイズ抑制フィルタ値358cによって下限が定められるノイズ抑制フィルタ値364が得られる。記載の推定は、小さい利得値GAGC(m)が提供されるがノイズ抑制を確実にし、それによって小さい利得値によって達成される全体的な信号減衰を超えてノイズ低減が得られる。
上述のように算出されたノイズ減衰限界の更新規則は、以下のように等価的に定式化することができ
、
図11のグラフに実線で「歪み制約付き」と表示されて示されている。
の算出において考慮されるので、たとえAGC利得が大きく変動しても、ノイズポンピング効果が回避されることが保証される。記載の手法は、大きいAGC利得に対してもノイズ低減を確実にするという利点を有する。さらに、記載の手法は、他の手法が受けるノイズポンピング効果を回避し、これはスピーチオンセット時のノイズフロアの急速な増加およびスピーチオフセット時の急激な減少をもたらす。
要約すると、図10は、例えば装置800に関する「制約なし」と表示されたグラフと、例えば装置900に関する「歪み制約付き」と表示されたグラフとで、ノイズが両方の装置によって増幅されない状況を説明し、入力信号は、ノイズによってのみ特徴付けられる。それによって、不快なノイズ増幅を回避することができる。
比較のために、制約のない場合と制約付きの場合が、それぞれ破線および実線で示されている。歪み制約付きのノイズ減衰限界は、低から中程度のAGC利得
に対してその制約のない対応物のような挙動をとることが観察され得る。AGC利得が増加するにつれて、
は1/gDLまで減少し、
までこのレベルのままである。したがって、歪み制約は、歪み限界gDLまでのAGC利得についてのみ満たされる。それを超えると、ノイズ低減限界は、再び減少し始める。これは、ノイズが入力と比較して出力で増幅されないようにするためであり、低SNRによって特徴付けられるノイズセグメントについて、図10に示される全体的なシステム応答
を導出する場合に明らかになる。この場合、NRフィルタ
がその最小値
に達したと仮定することができる。したがって、全ノイズ応答は、以下のように書くことができる:
AGC利得を増加させると全ノイズ応答が増加することは明らかであるが、ノイズが増幅されないようにするために1未満のままである。全ノイズ応答は、図10においてAGC利得の関数として実線で表されている。図10では、比較のために制約のないノイズ応答が破線で示されている。
1.レベル算出:L(m)で示される信号レベルは、AGC入力(ここではノイズ低減(NR)出力)で算出される。信号レベルの尺度は、単なる変動であり得る。あるいは、スペクトル重み付けを適用して、人間の聴覚系を模倣し、知覚される音量の尺度を得ることができる。
(6)
式中、GAGC(m)は、フレームmで算出されたAGC利得であり、
は、AGC利得を時間的に平滑化するために使用される忘却係数である(
を使用)。
1.オーディオ入力信号を受信する。
b)オーディオ信号がノイズ低減フィルタをオーディオ入力信号に適用することによって得られるノイズ低減オーディオ信号である、
任意選択の音声アクティビティ情報は、スピーチ休止中にAGC利得を任意選択で減少させるために使用される。
1.オーディオ入力信号を受信する。
任意選択の音声アクティビティ情報は、スピーチ休止中にAGC利得を任意選択で減少させるために使用される。
a)所望のノイズ減衰量および現在のAGC利得に基づく、または
b)所望のノイズ減衰量、歪み限界、および現在のAGC利得に基づく。
参考文献
Claims (16)
- オーディオ信号(110)を処理するための装置(100;300;400;800;900)であって、
オーディオ信号を分析して前記オーディオ信号(215;354)の複数の帯域に対する複数のノイズ抑制フィルタ値(260;364、364a〜c)を決定するためのオーディオ信号分析器(130;830;930)であって、
前記オーディオ信号分析器(130;830;930)は、ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値(130b’;240;358c、360a)以上になるように前記ノイズ抑制フィルタ値を決定するように構成され、かつ
前記最小ノイズ抑制フィルタ値が前記オーディオ信号(130c’)の特性に依存するように構成されるオーディオ信号分析器と、
前記オーディオ信号をフィルタリングするためのフィルタ(120;310;410;820)であって、前記フィルタは、前記ノイズ抑制フィルタ値に基づいて調整されるフィルタとを備え、
前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の前記特性として前記オーディオ信号のフレームから利得値を計算するように構成され、
前記オーディオ信号分析器(130;830;930)が、前記最小ノイズ抑制フィルタ値が利得値の増加と共に減少するように前記最小ノイズ抑制フィルタ値を計算するように構成されるか、または、前記オーディオ信号分析器(130;830;930)が、所定のノイズ抑制フィルタ値および所定のノイズ抑制フィルタ値と前記利得値との商に依存する最小決定を使用して前記最小ノイズ抑制フィルタ値を計算するように構成される、装置。 - 前記オーディオ信号分析器(130;830;930)が、複数の制約のないノイズ抑制フィルタ値(220;356a)および前記最小ノイズ抑制フィルタ値に基づく最大決定を使用して前記ノイズ抑制フィルタ値を決定するように構成され、前記最小ノイズ抑制フィルタ値が、前記オーディオ信号の前記複数の帯域に等しい、請求項1に記載の装置。
- 前記オーディオ信号分析器(130;830;930)が、
所定のノイズ抑制フィルタ値、および
前記利得値
に基づいて、前記最小ノイズ抑制フィルタ値を計算するように構成される、請求項1に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、第1の最小決定に従って前記最小ノイズ抑制フィルタ値を決定するように構成され、前記第1の最小決定が、
所定のノイズ抑制フィルタ値、および
第2の最小決定の結果に依存し、前記第2の最小決定の前記結果が、
前記利得値の逆数、および
最大決定の結果に依存し、前記最大決定の前記結果が、
所定の歪み限界値の前記逆数、および
前記所定のノイズ抑制フィルタ値と前記利得値との前記商に依存する、請求項1〜3のいずれか一項に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の前記複数の帯域のうちの1つの帯域を分析し、前記帯域が前記オーディオ信号の第1の特性または前記オーディオ信号の第2の特性を有するかを決定し、前記第1の特性が、前記第2の特性とは異なり、かつ前記第2の特性が前記帯域に対して決定されたときに前記ノイズ抑制フィルタ値を決定するように構成され、
その結果、前記ノイズ抑制フィルタ値が、前記利得値が0〜1であるとき、所定のノイズ抑制フィルタ値と前記利得値との積に等しく、または
その結果、前記ノイズ抑制フィルタ値が、前記利得値が1と、前記所定のノイズ抑制フィルタ値と所定の歪み限界との前記積との間にあるとき、前記所定のノイズ抑制フィルタ値に等しく、または
その結果、前記ノイズ抑制フィルタ値が、前記利得値が1と、前記所定のノイズ抑制フィルタ値と前記所定の歪み限界との前記積との間にあるとき、前記利得値と前記所定の歪み限界との商に等しく、または
その結果、前記ノイズ抑制フィルタ値が、前記利得値が前記所定の歪み限界よりも大きいとき、1に等しい、請求項1〜4のいずれか一項に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の第1のフレームについて、第1の最小ノイズ抑制フィルタ値をもたらす第1の利得値を計算するように構成され、
前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の第2のフレームについて、平滑化されていない第2の最小ノイズ抑制フィルタ値をもたらす第2の利得値を計算するように構成され、
前記第2のフレームが、時間的に前記第1のフレームに続き、
前記オーディオ信号分析器(130;830;930)が、前記平滑化されていない第2の最小ノイズ抑制フィルタ(358c)値および前記第1の最小ノイズ抑制フィルタ値を使用して、前記第2のフレームの平滑化された最小ノイズ抑制フィルタ値(360a)を計算するように構成される、請求項1〜5のいずれか一項に記載の装置。 - 前記装置が、前記オーディオ信号の前記複数の帯域を提供する、前記オーディオ信号の周波数ドメイン表現を提供する第1の時間/周波数変換器(320a)を備え、
前記オーディオ信号分析器(130;830;930)が、
前記オーディオ信号の前記複数の帯域の1つまたは複数の帯域、および
前記最小ノイズ抑制フィルタ値に基づいて、前記オーディオ信号の前記複数の帯域のうちの1つまたは複数の帯域のノイズ抑制フィルタ値を計算するように構成され、前記最小ノイズ抑制フィルタ値が、
前記オーディオ信号の前記複数の帯域の各帯域に等しい所定のノイズ抑制フィルタ値、または前記オーディオ信号の複数の帯域に等しい所定の歪み限界、および
前記オーディオ信号の前記特性から導出された値に基づき、前記値が、前記オーディオ信号の前記複数の帯域の各帯域に等しい、請求項1〜6のいずれか一項に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の振幅情報、および
前記振幅情報および所定の目標値に基づいて、前記オーディオ信号の前記特性として、前記利得値を計算するように構成され、前記オーディオ信号が、前記利得値によって調整される、請求項1〜7のいずれか一項に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、前記振幅情報の計算の前に心理音響フィルタ(342)で前記オーディオ信号をフィルタリングするように構成され、
前記心理音響フィルタが、第1の周波数範囲の第1の減衰値、および
第2の周波数範囲の第2の減衰値、および
第3の周波数範囲の第3の減衰値を含むように構成され、
前記フィルタが、前記第2の周波数範囲が前記第1の周波数範囲と前記第3の周波数範囲との間にあるように構成され、
前記フィルタが、前記第2の減衰値が前記第1の減衰値および前記第3の減衰値よりも小さくなるように構成される、請求項8に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の第1のフレームの第1の音声アクティビティ情報、および前記オーディオ信号の第2のフレームの第2の音声アクティビティ情報を提供する音声アクティビティ検出ユニット(340)と、前の利得値を記憶するメモリユニット(346)とを備え、
前記オーディオ信号分析器(130;830;930)が、
音声が前記第2の音声アクティビティ情報に従って検出された前記オーディオ信号の前記第2のフレームに基づいて、前記利得値を推定し、または
音声が前記第1の音声アクティビティ情報に基づいて前記第1のフレームで検出されたとき、音声アクティビティが前記第2の音声アクティビティ情報に従って前記第2のフレームで検出されなかった場合に前記第1のフレームの前記利得値を保つように構成され、
前記第2のフレームが、時間的に前記第1のフレームに続く、請求項1〜9のいずれか一項に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、
現在のフレームについて計算された前記オーディオ信号の前記特性から導出された値
に基づいて、現在のフレームの前記最小ノイズ抑制フィルタ値を計算するように構成され、
前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の前記特性から導出された前記値を決定するために前記オーディオ信号を分析するように構成され、
前記フィルタが、第1のフィルタ段と、第2のフィルタ段とを含み、
前記第1のフィルタ段が、前記オーディオ信号の前記特性から導出された前記値を使用して調整され、
前記第2のフィルタ段が、前記ノイズ抑制フィルタ値に従って調整される、請求項1に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、
第1のフレームについて計算された、前記オーディオ信号の前記特性から導出された値
に基づいて、第2のフレームの前記最小ノイズ抑制フィルタ値を計算するように構成され、
前記フィルタが、第1のフィルタ段(822)と、第2のフィルタ段(824)とを含み、
前記第1のフィルタ段が、前記ノイズ抑制フィルタ値に従って調整され、
前記第2のフィルタ段が、前記オーディオ信号の前記特性から導出された前記値を使用して調整され、
前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号の前記特性から導出された前記値を決定するために前記第1のフィルタ段の出力を分析するように構成され、
前記第2のフレームが、時間的に前記第1のフレームに続く、請求項1に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、
音声アクティビティ情報および前記オーディオ信号、または前記ノイズ抑制フィルタ値によってフィルタリングされた後の音声アクティビティ情報および前記オーディオ信号に基づいて、前記利得値を決定するように構成され、
前記オーディオ信号分析器(130;830;930)が、前記オーディオ信号に基づいて、前記音声アクティビティ情報を得るように構成され、または前記オーディオ信号分析器(130;830;930)が、前記フィルタによってフィルタリングされた後の前記オーディオ信号に基づいて、前記音声アクティビティ情報を得るように構成され、または前記オーディオ信号分析器(130;830;930)が、スピーチが存在しないことを示す音声アクティビティ情報を使用して前記利得値を減少させるように構成される、請求項1〜12のいずれか一項に記載の装置。 - 前記オーディオ信号分析器(130;830;930)が、時間的に第1のフレームと前記第1のフレームに続く第2のフレームとを備える一連のフレームで前記オーディオ信号を分析し、前記第1のフレームについて、第1の複数のノイズ抑制フィルタ値を決定し、かつ前記第2のフレームについて、第2の複数のノイズ抑制フィルタ値を決定するように構成され、
前記オーディオ信号分析器(130;830;930)が、前記第1の複数のノイズ抑制フィルタ値の前記ノイズ抑制フィルタ値が前記第1のフレームに対して決定された第1の最小ノイズ抑制フィルタ値(130b’;240;358c、360a)以上になるように、かつ前記第1の最小ノイズ抑制フィルタ値が前記オーディオ信号(130c’)の前記第1のフレームの第1の特性に依存するように前記第1の複数のノイズ抑制フィルタ値を決定するように構成され、
前記オーディオ信号分析器(130;830;930)が、前記第2の複数のノイズ抑制フィルタ値の前記ノイズ抑制フィルタ値が前記第2のフレームに対して決定された第2の最小ノイズ抑制フィルタ値(130b’;240;358c、360a)以上になるように、かつ前記第2の最小ノイズ抑制フィルタ値が前記オーディオ信号(130c’)の前記第2のフレームの第2の特性に依存するように前記第2の複数のノイズ抑制フィルタ値を決定するようにさらに構成され、
前記フィルタ(120;310;410;820)が、前記一連のフレームの前記オーディオ信号をフィルタリングするように構成され、前記第1のフレームの第1のフィルタが、前記第1の複数のノイズ抑制フィルタ値に基づいて調整され、前記第2のフレームの第2のフィルタが、前記第2の複数のノイズ抑制フィルタ値に基づいて調整され、
前記フィルタ(120;310;410;820)が、前記第1のフィルタで前記オーディオ信号の前記第1のフレームをフィルタリングし、かつ前記第2のフィルタで前記オーディオ信号の前記第2のフレームをフィルタリングするように構成される、請求項1〜13のいずれか一項に記載の装置。 - オーディオ信号を処理するための方法であって、
オーディオ信号の分析をして前記オーディオ信号の複数の帯域に対する複数のノイズ抑制フィルタ値を決定することと、
ノイズ抑制フィルタ値が最小ノイズ抑制フィルタ値以上になるように、かつ
前記最小ノイズ抑制フィルタ値が前記オーディオ信号の特性に依存するように前記ノイズ抑制フィルタ値を決定することと、
前記ノイズ抑制フィルタ値に基づいて、前記オーディオ信号をフィルタリングすることとを含み、
前記分析が、前記オーディオ信号の前記特性として前記オーディオ信号のフレームから利得値を計算することを含み、
前記分析は、前記最小ノイズ抑制フィルタ値が利得値の増加と共に減少するように前記最小ノイズ抑制フィルタ値を計算することを含むか、または、前記分析は、所定のノイズ抑制フィルタ値および所定のノイズ抑制フィルタ値と前記利得値との商に依存する最小決定を使用して前記最小ノイズ抑制フィルタ値を計算することを含む、方法。 - プログラムコードがコンピュータまたはマイクロコントローラで実行されるときに請求項15に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16194467.3 | 2016-10-18 | ||
EP16194467.3A EP3312838A1 (en) | 2016-10-18 | 2016-10-18 | Apparatus and method for processing an audio signal |
PCT/EP2017/076483 WO2018073253A1 (en) | 2016-10-18 | 2017-10-17 | Apparatus and method for processing an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019537074A JP2019537074A (ja) | 2019-12-19 |
JP6857344B2 true JP6857344B2 (ja) | 2021-04-14 |
Family
ID=57184318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019541884A Active JP6857344B2 (ja) | 2016-10-18 | 2017-10-17 | オーディオ信号を処理するための装置および方法 |
Country Status (11)
Country | Link |
---|---|
US (2) | US11056128B2 (ja) |
EP (2) | EP3312838A1 (ja) |
JP (1) | JP6857344B2 (ja) |
KR (1) | KR102269396B1 (ja) |
CN (1) | CN110036440B (ja) |
BR (1) | BR112019007785A2 (ja) |
CA (1) | CA3040201C (ja) |
ES (1) | ES2845154T3 (ja) |
MX (1) | MX2019004230A (ja) |
RU (1) | RU2725017C1 (ja) |
WO (1) | WO2018073253A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7404664B2 (ja) * | 2019-06-07 | 2023-12-26 | ヤマハ株式会社 | 音声処理装置及び音声処理方法 |
EP3823315B1 (en) * | 2019-11-18 | 2024-01-10 | Panasonic Intellectual Property Corporation of America | Sound pickup device, sound pickup method, and sound pickup program |
CN112242147B (zh) * | 2020-10-14 | 2023-12-19 | 福建星网智慧科技有限公司 | 一种语音增益控制方法及计算机存储介质 |
CN113113046B (zh) * | 2021-04-14 | 2024-01-19 | 杭州网易智企科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07235848A (ja) | 1994-02-22 | 1995-09-05 | Kokusai Denshin Denwa Co Ltd <Kdd> | 自動利得制御増幅器 |
CN1155139A (zh) * | 1995-06-30 | 1997-07-23 | 索尼公司 | 降低语音信号噪声的方法 |
US5975921A (en) | 1997-10-10 | 1999-11-02 | Berg Technology, Inc. | High density connector system |
JP4138290B2 (ja) | 2000-10-25 | 2008-08-27 | 松下電器産業株式会社 | ズームマイクロホン装置 |
JP4256631B2 (ja) | 2002-06-03 | 2009-04-22 | パナソニック株式会社 | オートゲインコントロール装置 |
JP2005184154A (ja) | 2003-12-16 | 2005-07-07 | Sony Corp | 自動利得制御装置及び自動利得制御方法 |
US7454010B1 (en) | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
US7669611B2 (en) | 2005-07-19 | 2010-03-02 | Joe Lomicka | Motorized fluid control valve with safety device |
US7555075B2 (en) * | 2006-04-07 | 2009-06-30 | Freescale Semiconductor, Inc. | Adjustable noise suppression system |
JP2008148179A (ja) | 2006-12-13 | 2008-06-26 | Fujitsu Ltd | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 |
US7742746B2 (en) * | 2007-04-30 | 2010-06-22 | Qualcomm Incorporated | Automatic volume and dynamic range adjustment for mobile audio devices |
US8712762B2 (en) * | 2007-07-27 | 2014-04-29 | Vereniging Voor Christelijk Hoger Onderwijs, Wetenschappelijk Onderzoek En Patiëntenzor | Noise suppression in speech signals |
EP2191466B1 (en) * | 2007-09-12 | 2013-05-22 | Dolby Laboratories Licensing Corporation | Speech enhancement with voice clarity |
US8326617B2 (en) * | 2007-10-24 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement with minimum gating |
US8015002B2 (en) | 2007-10-24 | 2011-09-06 | Qnx Software Systems Co. | Dynamic noise reduction using linear model fitting |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
JP5071346B2 (ja) | 2008-10-24 | 2012-11-14 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5526524B2 (ja) * | 2008-10-24 | 2014-06-18 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US9049503B2 (en) * | 2009-03-17 | 2015-06-02 | The Hong Kong Polytechnic University | Method and system for beamforming using a microphone array |
US8473287B2 (en) * | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
CN103299656B (zh) * | 2010-11-29 | 2016-08-10 | 纽昂斯通讯公司 | 动态麦克风信号混合器 |
EP2629294B1 (en) * | 2012-02-16 | 2015-04-29 | 2236008 Ontario Inc. | System and method for dynamic residual noise shaping |
GB201401689D0 (en) * | 2014-01-31 | 2014-03-19 | Microsoft Corp | Audio signal processing |
US9837102B2 (en) * | 2014-07-02 | 2017-12-05 | Microsoft Technology Licensing, Llc | User environment aware acoustic noise reduction |
JP6252783B2 (ja) | 2014-08-29 | 2017-12-27 | マツダ株式会社 | 車両用歩行者検出装置 |
-
2016
- 2016-10-18 EP EP16194467.3A patent/EP3312838A1/en not_active Withdrawn
-
2017
- 2017-10-17 CN CN201780064337.0A patent/CN110036440B/zh active Active
- 2017-10-17 MX MX2019004230A patent/MX2019004230A/es unknown
- 2017-10-17 ES ES17791008T patent/ES2845154T3/es active Active
- 2017-10-17 JP JP2019541884A patent/JP6857344B2/ja active Active
- 2017-10-17 EP EP17791008.0A patent/EP3529805B1/en active Active
- 2017-10-17 KR KR1020197014083A patent/KR102269396B1/ko active IP Right Grant
- 2017-10-17 CA CA3040201A patent/CA3040201C/en active Active
- 2017-10-17 BR BR112019007785A patent/BR112019007785A2/pt unknown
- 2017-10-17 WO PCT/EP2017/076483 patent/WO2018073253A1/en unknown
- 2017-10-17 RU RU2019114951A patent/RU2725017C1/ru active
-
2019
- 2019-04-11 US US16/381,770 patent/US11056128B2/en active Active
-
2021
- 2021-03-23 US US17/210,415 patent/US11664040B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3312838A1 (en) | 2018-04-25 |
CA3040201A1 (en) | 2018-04-26 |
US11056128B2 (en) | 2021-07-06 |
WO2018073253A1 (en) | 2018-04-26 |
EP3529805A1 (en) | 2019-08-28 |
CN110036440B (zh) | 2023-09-29 |
US20210233551A1 (en) | 2021-07-29 |
KR102269396B1 (ko) | 2021-06-24 |
US20190267022A1 (en) | 2019-08-29 |
CN110036440A (zh) | 2019-07-19 |
ES2845154T3 (es) | 2021-07-26 |
EP3529805B1 (en) | 2020-11-18 |
KR20190065424A (ko) | 2019-06-11 |
MX2019004230A (es) | 2019-07-10 |
BR112019007785A2 (pt) | 2019-07-09 |
RU2725017C1 (ru) | 2020-06-29 |
JP2019537074A (ja) | 2019-12-19 |
CA3040201C (en) | 2021-06-08 |
US11664040B2 (en) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9361901B2 (en) | Integrated speech intelligibility enhancement system and acoustic echo canceller | |
TWI463817B (zh) | 可適性智慧雜訊抑制系統及方法 | |
JP6857344B2 (ja) | オーディオ信号を処理するための装置および方法 | |
EP2244254B1 (en) | Ambient noise compensation system robust to high excitation noise | |
US20090287496A1 (en) | Loudness enhancement system and method | |
JP2007306546A (ja) | 時変拡声器−部屋−マイクロホンシステムにおけるエコー減少 | |
US9137611B2 (en) | Method, system and computer program product for estimating a level of noise | |
JP2023133472A (ja) | ギャップ信頼度を用いた背景雑音推定 | |
EP2490218A1 (en) | Method for interference suppression | |
US9666206B2 (en) | Method, system and computer program product for attenuating noise in multiple time frames | |
CN112437957B (zh) | 用于全面收听的强加间隙插入 | |
US20130054233A1 (en) | Method, System and Computer Program Product for Attenuating Noise Using Multiple Channels | |
KR102718917B1 (ko) | 음성 신호에서의 마찰음의 검출 | |
Jeub et al. | On the application of psychoacoustically-motivated dereverberation for recordings taken in the German parliament |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200703 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201001 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201231 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6857344 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |