JPWO2010146711A1 - 音声信号処理装置及び音声信号処理方法 - Google Patents
音声信号処理装置及び音声信号処理方法 Download PDFInfo
- Publication number
- JPWO2010146711A1 JPWO2010146711A1 JP2011519388A JP2011519388A JPWO2010146711A1 JP WO2010146711 A1 JPWO2010146711 A1 JP WO2010146711A1 JP 2011519388 A JP2011519388 A JP 2011519388A JP 2011519388 A JP2011519388 A JP 2011519388A JP WO2010146711 A1 JPWO2010146711 A1 JP WO2010146711A1
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- spectrum
- noise
- frequency
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 331
- 238000012545 processing Methods 0.000 title claims abstract description 141
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000001228 spectrum Methods 0.000 claims abstract description 329
- 238000004364 calculation method Methods 0.000 claims abstract description 120
- 230000008859 change Effects 0.000 claims abstract description 120
- 238000006243 chemical reaction Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims description 23
- 238000010606 normalization Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000001755 vocal effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 229910019760 S109-No Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/932—Decision in previous or following frames
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
そこで、音声信号の周波数スペクトルを解析することにより、音声信号に含まれる音の種別を判別する技術が開発されている(例えば、特許文献1〜3を参照)。
そこで、バブルノイズを他のノイズとは別個に検出する技術が提案されている(例えば、特許文献4を参照)。
そして、バブルノイズと異なる音声が誤ってバブルノイズと判定されてしまうと、ノイズサプレッサは、適切にノイズを抑制できないので、再生音の音質が低下してしまうおそれがあった。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
この音声信号処理装置は、入力された音声信号の周波数スペクトルの波形の時間変化を調べることにより、バブルノイズが含まれるか否か判定する。そしてこの音声信号処理装置は、バブルノイズが含まれると判定した場合、音声信号に他のノイズが含まれる場合よりも音声信号に含まれるノイズのパワーを低減することで、再生音の音質向上を図る。
このうち、呼制御部10、通信部11、符号化部14、復号部15及び音声信号処理装置16は、それぞれ別個の回路として形成される。あるいはこれらの各部は、その各部に対応する回路が集積された一つの集積回路として電話機1に実装されてもよい。さらに、これらの各部は、電話機1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
符号化部14は、符号化された音声信号を通信部11へ渡す。
音声信号処理装置16は、ノイズ抑制処理が施された音声信号を増幅器17へ出力する。
スピーカ18は、増幅器17から受け取った音声信号を再生する。
図2(a)は、バブルノイズに対する周波数スペクトルの時間変化の一例を表す図であり、図2(b)は、定常ノイズに対する周波数スペクトルの時間変化の一例を表す図である。
図2(a)及び図2(b)において、横軸は周波数を表し、縦軸はノイズの周波数スペクトルの振幅の強度を表す。また図2(a)において、グラフ201は、時刻tにおけるバブルノイズの周波数スペクトルの波形の一例を表す。一方、グラフ202は、時刻tよりも所定時間前の時刻(t-1)におけるバブルノイズの周波数スペクトルの波形の一例を表す。また、図2(b)において、グラフ211は、時刻tにおける定常ノイズの周波数スペクトルの波形の一例を表す。一方、グラフ212は、時刻(t-1)における定常ノイズの周波数スペクトルの波形の一例を表す。
これに対し、定常ノイズの波形は、短期間の間にはあまり変動しない。そのため、図2(b)に示されるように、時刻tにおける定常ノイズの周波数スペクトルの波形211と時刻(t-1)における定常ノイズの周波数スペクトルの波形212はほぼ等しい。例え、ノイズを生じる音源と、音声を集音するマイクロフォン間の距離が時刻tと時刻(t-1)の間に変化したとしても、周波数スペクトルの強度は全体的に強くなるか弱くなるものの、定常ノイズの周波数スペクトルの波形そのものの変化は少ない。
そこで、音声信号処理装置16は、入力された音声信号の周波数スペクトルの波形の時間変化を調べることにより、入力された音声信号に含まれるノイズがバブルノイズか否か判定できる。
時間周波数変換部161は、周波数スペクトルをパワースペクトル算出部162へ渡す。
なお、パワースペクトル算出部162は、次式に従ってパワースペクトルを算出する。
パワースペクトル算出部162は、算出されたパワースペクトルを、ノイズ推定部163、音声信号判別部164及びゲイン算出部165へ出力する。
具体的には、ノイズ推定部163は、フレームの時間順に従って、最新のフレームについて、電話機1に入力された音声信号が含まれる周波数帯域全体のパワースペクトルの平均値pを次式に従って算出する。
なお、ノイズ推定部163は、パワースペクトルの平均値pを算出する代わりに、全てのサブ周波数帯域のパワースペクトルのうちの最大値を求め、その最大値を閾値Thrと比較してもよい。
ノイズ推定部163は、推定ノイズスペクトルをゲイン算出部165へ出力する。また、ノイズ推定部163は、最新のフレームに対する推定ノイズスペクトルを、ノイズ推定部163が有するバッファに記憶する。
スペクトル正規化部171は、正規化パワースペクトルを波形変化量算出部172へ出力する。またスペクトル正規化部171は、正規化パワースペクトルをバッファ173に記憶する。
そこで、波形変化量算出部172は、スペクトル正規化部171から最新のフレームの正規化パワースペクトルS'm(f)を受け取ると、バッファ173から一つ前のフレームの正規化パワースペクトルS'm-1(f)を読み出す。そして波形変化量算出部172は、次式に従って、各サブ周波数帯域における二つの正規化パワースペクトルS'm(f)、S'm-1(f)間の差の絶対値の合計を、波形変化量Δとして算出する。
また、波形変化量算出部172は、波形変化量Δを、各サブ周波数帯域における二つの正規化パワースペクトルS'm(f)、S'm-1(f)間の差の2乗和としてもよい。
波形変化量算出部172は、波形変化量Δを判定部174へ出力する。
上記のように、音声信号にバブルノイズが含まれれば、波形変化量Δは大きく、音声信号にバブルノイズが含まれなければ、波形変化量Δは小さい。
そこで、判定部174は、波形変化量Δが所定の閾値Thwよりも大きい場合、最新のフレームに対する音声信号にバブルノイズが含まれると判定する。一方、判定部174は、波形変化量Δが所定の閾値Thw以下である場合、最新のフレームに対する音声信号にはバブルノイズが含まれないと判定する。なお、所定の閾値Thwは、一人の声の相当する波形変化量に設定されることが好ましい。バブルノイズのピッチ周波数は、一人の声よりもピッチ周波数の短いため、このように閾値Thwが設定されることにより、判定部174はバブルノイズを正確に検出することができる。また、所定の閾値Thwは、実験的に求められた最適値に設定されてもよい。例えば、所定の閾値Thwは、波形変化量Δが各周波数帯域における二つの正規化パワースペクトル間の差の絶対値和である場合、2dB〜3dBの何れかの値とすることができる。また、波形変化量Δが各周波数帯域における二つの正規化パワースペクトル間の差の2乗和である場合には、所定の閾値Thwは、4dB〜9dBの何れかの値とすることができる。
判定部174は、最新のフレームの音声信号に含まれるノイズの種別の判別結果をゲイン算出部165へ通知する。
そこで、最新のフレームの音声信号にバブルノイズが含まれると判定されている場合、ゲイン算出部165は、サブ周波数帯域ごとに、パワースペクトルS(f)が、ノイズスペクトルN(f)にバブルノイズ用バイアス値Bbを加えた値(N(f)+Bb)よりも小さいか否か判定する。そしてゲイン算出部165は、S(f)が(N(f)+Bb)よりも小さいサブ周波数帯域のゲイン値G(f)を、パワースペクトルが減衰する値、例えば16dBに設定する。一方、S(f)が(N(f)+Bb)以上である場合、ゲイン算出部165は、そのサブ周波数帯域の周波数スペクトルの減衰率が小さくなるようにゲイン値G(f)を決定する。例えば、ゲイン算出部165は、S(f)が(N(f)+Bb)以上である場合、ゲイン値G(f)を0dB〜1dBの何れかに設定する。
ゲイン算出部165は、サブ周波数帯域ごとに決定したゲイン値をフィルタ部166へ出力する。
例えば、フィルタ部166は、サブ周波数帯域ごとに、次式に従ってフィルタ処理を実行する。
フィルタ部166は、ノイズが低減された周波数スペクトルを周波数時間変化部167へ出力する。
周波数時間変換部167は、ノイズが低減された音声信号を増幅器17へ出力する。
まず、時間周波数変換部161は、入力された音声信号をフレーム単位で時間周波数変換することにより、その入力音声信号を周波数スペクトルに変換する(ステップS101)。時間周波数変換部161は、周波数スペクトルをパワースペクトル算出部162へ渡す。
次に、パワースペクトル算出部162は、時間周波数変換部161から受け取った周波数スペクトルのパワースペクトルS(f)を算出する(ステップS102)。そしてパワースペクトル算出部162は、算出されたパワースペクトルS(f)を、ノイズ推定部163、音声信号判別部164及びゲイン算出部165へ出力する。
波形変化量算出部172は、最新のフレームの正規化パワースペクトルの波形と、バッファ173から読み込んだ最新のフレームよりも所定数前のフレームの正規化パワースペクトルの波形の差を表す波形変化量Δを算出する(ステップS105)。そして波形変化量算出部172は、波形変化量Δを判定部174へ渡す。
なお、ゲイン算出部165は、ステップS109〜S113の処理を、サブ周波数帯域ごとに実行する。そしてゲイン算出部165は、ゲイン値G(f)をフィルタ部166へ出力する。
周波数時間変換部167は、フィルタ処理された周波数スペクトルを周波数時間変換することにより、その周波数スペクトルを出力音声信号に変換する(ステップS115)。そして周波数時間変換部167は、ノイズが低減された出力音声信号を増幅器17へ出力する。
この音声信号処理装置は、音声信号処理装置が実装された電話機の周囲の音をマイクロフォンにより集音した音声信号の周波数スペクトルの波形の時間変化を調べることにより、電話機の周囲の音にバブルノイズが含まれるか否か判定する。そしてこの音声信号処理装置は、バブルノイズが含まれると判定した場合、別途取得した再生すべき音声信号のパワーを増幅することで、電話機のユーザが再生音を聞き易くする。
電話機2は、音声信号処理装置21が有する音声信号判別部24が、マイクロフォン12により集音された音声にバブルノイズが含まれるか否かを判定し、その判定結果によって音声信号処理装置21が受信した音声信号を増幅する点で、図1に示された電話機1と異なる。そこで以下では、音声信号処理装置21について説明する。電話機2のその他の構成要素については、上述した図1に示した電話機1の説明を参照されたい。
時間周波数変換部22は、入力音声信号の周波数スペクトルをパワースペクトル算出部23へ出力する。
また、時間周波数変換部26は、通信部11を介して受信した音声信号をフレーム単位で時間周波数変換することにより、その受信音声信号を周波数スペクトルに変換する。時間周波数変換部26は、受信音声信号の周波数スペクトルをフィルタ部27へ出力する。
パワースペクトル算出部23は、算出されたパワースペクトルを、音声信号判別部24へ出力する。
スペクトル正規化部241は、正規化パワースペクトルを波形変化量算出部244へ出力する。またスペクトル正規化部241は、正規化パワースペクトルをバッファ242に記憶する。
バッファ242は、最新のフレームから所定数前のフレームまでのパワースペクトル及び正規化パワースペクトルを記憶する。そしてバッファ242は、その所定数よりも過去のパワースペクトル及び正規化パワースペクトルを消去する。
さらに、重み決定部243は、各サブ周波数帯域のパワースペクトルの平均値が大きいフレームほど、重み係数も大きくしてもよい。
本実施形態では、波形変化量算出部244は、次式に従って波形変化量Δを算出する。
波形変化量算出部244は、波形変化量Δを、最新のフレームの正規化パワースペクトルと、最新のフレームから2以上の所定数前のフレームの正規化パワースペクトル間の差の絶対値の合計としてもよい。
あるいは、波形変化量算出部244は、波形変化量Δを、各サブ周波数帯域における二つの正規化パワースペクトルS'm(f)、S'm-1(f)間の差の2乗に重み係数w(f)を乗じた値の和としてもよい。
波形変化量算出部244は、波形変化量Δを判定部245へ出力する。
判定部245は、第1の実施形態による音声信号処理装置16が有する判定部174と同様に、波形変化量Δが所定の閾値Thwよりも大きい場合、最新のフレームの音声信号にバブルノイズが含まれると判定する。一方、判定部245は、波形変化量Δが所定の閾値Thw以下である場合、最新のフレームの音声信号にバブルノイズは含まれないと判定する。
この実施形態においても、所定の閾値Thwは、例えば、一人の声の波形変化量に相当する値、あるいは、実験的に求められた値に設定される。
判定部245は、最新のフレームの音声信号に含まれるノイズの種別の判別結果をゲイン算出部25へ通知する。
そこで、最新のフレームの音声信号にバブルノイズが含まれると判定されている場合、ゲイン算出部25は、全てのサブ周波数帯域に対して一律に、受信音声信号の周波数スペクトルを増幅するように、ゲイン値G(f)の値を決定する。最新のフレームの音声信号にバブルノイズが含まれると判定されている場合、ゲイン算出部25は、例えば、ゲイン値G(f)を10dBに設定する。一方、最新のフレームの音声信号にバブルノイズが含まれないと判定されている場合、ゲイン算出部25は、ゲイン値G(f)を0に設定する。
ゲイン算出部25は、ゲイン値をフィルタ部27へ出力する。
例えば、フィルタ部27は、サブ周波数帯域ごとに、次式に従ってフィルタ処理を実行する。
フィルタ部27は、フィルタ処理により強調された周波数スペクトルを周波数時間変化部28へ出力する。
周波数時間変換部26は、増幅された音声信号を増幅器17へ出力する。
まず、時間周波数変換部22は、入力音声信号をフレーム単位で時間周波数変換することにより、その入力音声信号を周波数スペクトルに変換する(ステップS201)。時間周波数変換部22は、入力音声信号の周波数スペクトルをパワースペクトル算出部23へ渡す。
次に、パワースペクトル算出部23は、時間周波数変換部22から受け取った入力音声信号の周波数スペクトルのパワースペクトルS(f)を算出する(ステップS202)。そしてパワースペクトル算出部23は、算出されたパワースペクトルS(f)を音声信号判別部24へ出力する。そして音声信号判別部24は、受け取ったパワースペクトルS(f)をスペクトル正規化部241へ渡すとともに、バッファ242に記憶する。
また、音声信号判別部24の重み決定部243は、バッファ242から、最新のフレームのパワースペクトルと一つ前のフレームのパワースペクトルを読み込む。そして重み決定部243は、最新のフレームのスペクトルが前のフレームのスペクトルよりも所定のオフセット値以上大きくなるサブ周波数帯域に対する重み係数が大きくなるように重み係数w(f)を決定する(ステップS204)。重み決定部243は、重み係数w(f)を波形変化量算出部244へ出力する。
判定部245は、波形変化量Δが閾値Thwよりも大きいか否か判定する(ステップS206)。そして判定部245は、その判定結果をゲイン算出部25へ通知する。
ステップS207またはS208の後、ゲイン算出部25は、ゲイン値G(f)をフィルタ部27へ出力する。
周波数時間変換部28は、フィルタ処理された受信音声信号の周波数スペクトルを周波数時間変換することにより、その周波数スペクトルを出力音声信号に変換する(ステップS211)。そして周波数時間変換部28は、増幅された出力音声信号を増幅器17へ出力する。
この音声信号処理装置は、第2の実施形態による音声信号処理装置と同様に、音声信号処理装置が実装された電話機の周囲の音をマイクロフォンにより集音した音声信号の周波数スペクトルの波形の時間変化を調べる。そしてこの音声信号処理装置は、波形変化量が大きくなるほど、別途取得した再生すべき音声信号のパワーを増幅することで、再生音の音量を適切に調節する。
音声信号処理装置31が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは音声信号処理装置31が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として音声信号処理装置31に実装されてもよい。さらに、音声信号処理装置31が有するこれらの各部は、音声信号処理装置31が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
図8に示された音声信号処理装置31は、音声信号判別部24が判定部245を有さず、波形変化量をゲイン算出部25へ直接出力する点、及びゲイン算出部25は波形変化量に基づいてゲインを決定する点で、第2の実施形態による音声信号処理装置21と異なる。そこで、以下では、ゲイン値の算出について説明する。
なお、ゲイン決定関数は、非線形関数であってもよい。例えば、ゲイン決定関数は、波形変化量Δが下限値Thwlowから上限値Thwhighの範囲に含まれる場合、波形変化量Δの2乗あるい波形変化量Δの対数に比例してゲイン値G(f)が大きくなる関数であってもよい。
この音声信号処理装置は、音声信号処理装置が実装された電話機の周囲のノイズに対するアクティブノイズコントロールを実行することにより、電話機周囲のノイズを打ち消すように、電話機周囲の音の逆位相音を電話機のスピーカから発生させる。そしてこの音声信号処理装置は、逆位相音を生成する際、バブルノイズが含まれるか否かに応じて、異なるフィルタを用いて逆位相音を生成する。そしてこの音声信号処理装置は、その逆位相音を受信音声と重畳してスピーカに再生させることにより、電話機周囲のノイズがバブルノイズであっても、適切にノイズを打ち消す。
音声信号処理装置41が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは音声信号処理装置41が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として音声信号処理装置41に実装されてもよい。さらに、音声信号処理装置41が有するこれらの各部は、音声信号処理装置41が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
図9に示された音声信号処理装置41は、逆位相音生成部29が、入力音声信号の逆位相音を生成し、フィルタ部27が、その逆位相音を受信音声信号に重畳する点で、第2の実施形態による音声信号処理装置21と異なる。そこで、以下では、逆位相音生成部29及びフィルタ部30について説明する。
ここで、フィルタα[i]は、入力音声信号にバブルノイズが含まれると判定されたときに使用されるフィルタであり、一方、フィルタβ[i]は、入力音声信号にバブルノイズが含まれないと判定されたときに使用されるフィルタである。フィルタα[i]は、フィルタα[i]を用いて生成される逆位相音d[n]の絶対値が、フィルタβ[i]を用いて生成される逆位相音d[n]の絶対値よりも小さくなるように設計されることが好ましい。入力音声信号x[n]の位相及び振幅と完全に反転する逆位相音d[n]を生成するようにフィルタが設計されると、急激に入力音声信号が変化したときにd[n]の振幅がx[n]の振幅よりも大きくなり、この逆位相音がユーザにとって異音となるおそれがある。そこで、逆位相音生成部29は、短期間に音の特性が変動するバブルノイズに対しては、逆位相音d[n]を、フィルタβ[i]を用いて生成される逆位相音d[n]よりも小さくすることで、逆位相音に起因する異音の発生を防止できる。なお、逆位相音が小さければ、バブルノイズは完全に打ち消されないこともある。しかしながら、逆位相音によりバブルノイズの一部でも打ち消されれば、ユーザは受信音声信号を聞き取り易くなる。
ここで、入力音声信号にバブルノイズが含まれている場合、図2(a)及び図2(b)に関して説明したように、入力音声信号の周波数スペクトルの波形は短期間で大きく変動する。すなわち、入力音声信号の強さ、周波数の高さなどの特性が短期間で変動する。そこで、逆位相音生成部29は、音声信号判別部24により入力音声信号にバブルノイズが含まれると判定されている場合、FIR型適応フィルタのタップ数を、入力音声信号にバブルノイズが含まれないと判定されている場合の逆位相音よりも短くすることが好ましい。例えば、入力音声信号にバブルノイズが含まれると判定されている場合のFIR型適応フィルタのタップ数は、入力音声信号にバブルノイズが含まれないと判定されている場合のFIR型適応フィルタのタップ数の半分に設定される。これにより、逆位相音生成部29は、入力音声信号にバブルノイズが含まれている場合も、適切なFIR型適応フィルタを作成できる。
逆位相音生成部29は、生成した逆位相音をフィルタ部30へ出力する。
さらに、第1の実施形態による音声信号処理装置のゲイン算出部は、第3の実施形態による音声信号処理装置と同様に、波形変化量が大きくなるにつれてゲイン値も大きな値となるように、ゲイン値を決定してもよい。この場合、パワースペクトルがノイズ成分か否か判定するための基準値を求めるために、推定ノイズスペクトルに加算されるバイアス値は、バブルノイズ用バイアス値Bbまたはバイアス値Bcの何れか一方のみが使用される。
また、上記の各実施形態による音声信号処理装置は、入力された音声信号が複数のチャネルを有する場合、各チャネルごとに上記のノイズ低減処理、受信音声増幅処理あるいはノイズキャンセル処理を実行してもよい。
10 呼制御部
11 通信部
12 マイクロフォン
13、17 増幅器
14 符号化部
15 復号部
16、21、31、41 音声信号処理装置
18 スピーカ
161、22、26 時間周波数変換部
162、23 パワースペクトル算出部
163 ノイズ推定部
164、24 音声信号判別部
165、25 ゲイン算出部
166、27、30 フィルタ部
167、28 周波数時間変換部
29 逆位相音生成部
171、241 スペクトル正規化部
173、242 バッファ
243 重み決定部
172、244 波形変化量算出部
174、245 判定部
Claims (15)
- 音声信号をフレーム単位で時間周波数変換することにより、該音声信号の周波数スペクトルを算出する時間周波数変換部と、
第1のフレームの周波数スペクトルと、前記第1のフレームよりも前の第2のフレームの周波数スペクトルから、前記第1のフレームの周波数スペクトルと前記第2のフレーム間の周波数スペクトルの変化量を算出するスペクトル変化量算出部と、
前記スペクトル変化量に応じて前記第1のフレームの音声信号に含まれるノイズの種別を判定する判定部と、
を有する音声信号処理装置。 - 各フレームの前記周波数スペクトルから、前記周波数スペクトルの振幅の最大値あるいは平均値が所定値となるように正規化された正規化スペクトルを算出するスペクトル正規化部をさらに有し、
前記スペクトル変化量算出部は、前記第1のフレームの正規化スペクトルと、前記第2のフレームの正規化スペクトルから、前記周波数スペクトルの変化量を算出する請求項1に記載の音声信号処理装置。 - 前記スペクトル変化量算出部は、周波数帯域を複数に分割したサブ周波数帯域ごとに前記周波数スペクトルの変化量を算出する請求項1または2に記載の音声信号処理装置。
- 前記スペクトル変化量算出部は、各サブ周波数帯域の前記第1のフレームの正規化スペクトルと前記第2のフレームの正規化スペクトルとの差の絶対値の合計から前記周波数スペクトルの変化量を算出する請求項3に記載の音声信号処理装置。
- 周波数帯域を複数に分割したサブ周波数帯域のうち、前記第1のフレームの周波数スペクトルの振幅が前記第2のフレームの周波数スペクトルの振幅よりも大きいサブ周波数帯域の重み係数を、前記第1のフレームの周波数スペクトルの振幅が前記第2のフレームの周波数スペクトルの振幅以下であるサブ周波数帯域の重み係数よりも大きく設定する重み決定部をさらに有し、
前記波形変化量算出部は、前記サブ周波数帯域ごとに前記重み係数を対応する前記差の絶対値に乗じた値を合計することにより、前記波形変化量を算出する、請求項4に記載の音声信号処理装置。 - 前記第1のフレームの周波数スペクトルの振幅の平均値が第1の値よりも大きい場合、前記各サブ周波数帯域の重み係数を、前記第1のフレームの周波数スペクトルの振幅の平均値が前記第1の値よりも小さい第2の値以下である場合の前記各サブ周波数帯域の重み係数よりも大きく設定する重み決定部をさらに有し、
前記波形変化量算出部は、前記サブ周波数帯域ごとに前記重み係数を対応する前記差の絶対値に乗じた値を合計することにより、前記波形変化量を算出する、請求項4に記載の音声信号処理装置。 - 前記判定部は、前記波形変化量が一人の声に対する波形変化量に相当する閾値よりも大きい場合、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズであると判定する、請求項1から6の何れか一項に記載の音声信号処理装置。
- 前記音声信号に含まれるノイズ成分のパワースペクトルを推定するノイズ推定部と、
ノイズ成分のパワースペクトルと前記周波数スペクトルのパワースペクトルに応じてゲインを算出するゲイン算出部と、
前記ゲインを前記周波数スペクトルに乗算することでノイズ低減スペクトルを算出するフィルタ部と、
前記ノイズ低減スペクトルを時間信号に変換することにより出力信号を算出する周波数時間変換部とをさらに有し、
前記ゲイン算出部は、前記判定部により、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズであると判定された場合のゲインを、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズでないと判定された場合のゲインよりも大きくする請求項1から7の何れか一項に記載の音声信号処理装置。 - 前記音声信号に含まれるノイズ成分のパワースペクトルを推定するノイズ推定部と、
前記周波数スペクトルのパワースペクトルとノイズ成分のパワースペクトルとの差と所定の閾値との比較に応じてゲインを算出するゲイン算出部と、
前記ゲインを前記周波数スペクトルに乗算することでノイズ低減スペクトルを算出するフィルタ部と、
前記ノイズ低減スペクトルを時間信号に変換することにより出力信号を算出する周波数時間変換部とをさらに有し、
前記ゲイン算出部は、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズであると判定された場合の前記閾値は、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズでないと判定された場合の前記閾値よりも大きくする、請求項1から7の何れか一項に記載の音声信号処理装置。 - 第2の音声信号をフレーム単位で時間周波数変換することにより、該第2の音声信号の周波数スペクトルを算出する第2の時間周波数変換部と、
ノイズの判定結果に基づいて入力信号を増幅する帯域毎のゲインを算出するゲイン算出部と、
帯域毎のゲインを第2の音声信号の周波数スペクトルに乗算し、強調スペクトルを算出するフィルタ部と、
前記強調スペクトルを時間信号に変換し出力信号を算出する周波数時間変換部をさらに有し、
前記ゲイン算出部は、前記判定部により、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズであると判定された場合のゲインを、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズでないと判定された場合のゲインよりも大きく設定する、
請求項1から7の何れか一項に記載の音声信号処理装置。 - 前記音声信号に予め設定したフィルタを畳み込むことで、前記音声信号の逆位相音を生成する逆位相音生成部と、
前記逆位相音を第2の音声信号に重畳するフィルタ部とをさらに有し、
前記逆位相音生成部は、予め設定された複数のフィルタを保持し、前記判定部により、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズであると判定された場合とそれ以外の場合で、フィルタを切り換えて使用する、請求項1から7の何れか一項に記載の音声信号処理装置。 - 前記音声信号にフィルタを畳み込むことで、前記音声信号の逆位相音を生成する逆位相音生成部と、
誤差信号に基づいて前記フィルタを更新するフィルタ更新部と、
前記逆位相音を第2の音声信号に重畳するフィルタ部とをさらに有し、
前記逆位相音生成部は、複数のフィルタを保持し、前記判定部により、前記第1のフレームの音声信号に含まれるノイズの種別が複数の人の声が合成されたノイズであると判定された場合とそれ以外の場合で、前記フィルタを切り換えて使用し、
前記フィルタ更新部は、前記逆位相音生成部により使用されるフィルタを更新する、請求項1から7の何れか一項に記載の音声信号処理装置。 - 前記波形変化量が大きいほどゲインを大きく設定するゲイン算出部と、
前記ゲインが大きいほど、前記音声信号と別個に入力された第2の音声信号を大きくするフィルタ処理を実行するフィルタ部と、
をさらに有する請求項1に記載の音声信号処理装置。 - 音声信号をフレーム単位で時間周波数変換することにより、該音声信号の周波数スペクトルを算出し、
第1のフレームの周波数スペクトルと、前記第1のフレームよりも前の第2のフレームの周波数スペクトルから、前記第1のフレームの周波数スペクトルと前記第2のフレーム間の周波数スペクトルの変化量を算出し、
前記スペクトル変化量に応じて前記第1のフレームの音声信号に含まれるノイズの種別を判定する、
ことを含む音声信号処理方法。 - 各フレームの前記周波数スペクトルから、前記周波数スペクトルの振幅の最大値あるいは平均値が所定値となるように正規化された正規化スペクトルを算出することをさらに含み、
前記周波数スペクトルの変化量を算出することは、前記第1のフレームの正規化スペクトルと、前記第2のフレームの正規化スペクトルから、前記周波数スペクトルの変化量を算出する請求項14に記載の音声信号処理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2009/061221 WO2010146711A1 (ja) | 2009-06-19 | 2009-06-19 | 音声信号処理装置及び音声信号処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010146711A1 true JPWO2010146711A1 (ja) | 2012-11-29 |
JP5293817B2 JP5293817B2 (ja) | 2013-09-18 |
Family
ID=43356049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011519388A Active JP5293817B2 (ja) | 2009-06-19 | 2009-06-19 | 音声信号処理装置及び音声信号処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8676571B2 (ja) |
EP (1) | EP2444966B1 (ja) |
JP (1) | JP5293817B2 (ja) |
CN (1) | CN102804260B (ja) |
WO (1) | WO2010146711A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9313359B1 (en) | 2011-04-26 | 2016-04-12 | Gracenote, Inc. | Media content identification on mobile devices |
WO2010146711A1 (ja) * | 2009-06-19 | 2010-12-23 | 富士通株式会社 | 音声信号処理装置及び音声信号処理方法 |
US10986399B2 (en) | 2012-02-21 | 2021-04-20 | Gracenote, Inc. | Media content identification on mobile devices |
US20130282372A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
JP6182895B2 (ja) * | 2012-05-01 | 2017-08-23 | 株式会社リコー | 処理装置、処理方法、プログラム及び処理システム |
JP2014123011A (ja) * | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
KR101981487B1 (ko) * | 2013-01-23 | 2019-05-24 | 에스케이텔레콤 주식회사 | 주파수대역별 역동범위처리장치 및 주파수대역별 역동범위처리장치의 동작 방법 |
US9530430B2 (en) * | 2013-02-22 | 2016-12-27 | Mitsubishi Electric Corporation | Voice emphasis device |
JP6284003B2 (ja) * | 2013-03-27 | 2018-02-28 | パナソニックIpマネジメント株式会社 | 音声強調装置及び方法 |
DE102014202609B4 (de) | 2014-02-13 | 2020-06-04 | tooz technologies GmbH | Aminkatalysierte Thiolhärtung von Epoxidharzen |
CN104882145B (zh) * | 2014-02-28 | 2019-10-29 | 杜比实验室特许公司 | 使用音频对象的时间变化的音频对象聚类 |
US9721580B2 (en) * | 2014-03-31 | 2017-08-01 | Google Inc. | Situation dependent transient suppression |
KR101834913B1 (ko) * | 2014-04-30 | 2018-04-13 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 복수의 입력 오디오 신호를 잔향제거하기 위한 신호 처리 장치, 방법 및 컴퓨터가 판독 가능한 저장매체 |
CN105336344B (zh) | 2014-07-10 | 2019-08-20 | 华为技术有限公司 | 杂音检测方法和装置 |
AU2014204540B1 (en) * | 2014-07-21 | 2015-08-20 | Matthew Brown | Audio Signal Processing Methods and Systems |
US10366703B2 (en) | 2014-10-01 | 2019-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio signal including shock noise |
US10347273B2 (en) * | 2014-12-10 | 2019-07-09 | Nec Corporation | Speech processing apparatus, speech processing method, and recording medium |
US10783899B2 (en) * | 2016-02-05 | 2020-09-22 | Cerence Operating Company | Babble noise suppression |
JP6729186B2 (ja) * | 2016-08-30 | 2020-07-22 | 富士通株式会社 | 音声処理プログラム、音声処理方法及び音声処理装置 |
CN110168640B (zh) * | 2017-01-23 | 2021-08-03 | 华为技术有限公司 | 用于增强信号中需要分量的装置和方法 |
CN106846803B (zh) * | 2017-02-08 | 2023-06-23 | 广西交通科学研究院有限公司 | 基于音频的交通事件检测装置及方法 |
EP3688754A1 (en) * | 2017-09-26 | 2020-08-05 | Sony Europe B.V. | Method and electronic device for formant attenuation/amplification |
JP7013789B2 (ja) * | 2017-10-23 | 2022-02-01 | 富士通株式会社 | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 |
CN108391190B (zh) * | 2018-01-30 | 2019-09-20 | 努比亚技术有限公司 | 一种降噪方法、耳机及计算机可读存储介质 |
CN110070884B (zh) * | 2019-02-28 | 2022-03-15 | 北京字节跳动网络技术有限公司 | 音频起始点检测方法和装置 |
CN110427817B (zh) * | 2019-06-25 | 2021-09-07 | 浙江大学 | 一种基于空泡图像定位与声纹理分析的水翼空化特征提取方法 |
CN110970050B (zh) * | 2019-12-20 | 2022-07-15 | 北京声智科技有限公司 | 语音降噪方法、装置、设备及介质 |
TWI783215B (zh) * | 2020-03-05 | 2022-11-11 | 緯創資通股份有限公司 | 信號處理系統及其信號降噪的判定方法與信號補償方法 |
CN113035222B (zh) * | 2021-02-26 | 2023-10-27 | 北京安声浩朗科技有限公司 | 语音降噪方法、装置、滤波器的确定方法、语音交互设备 |
JP2022156943A (ja) * | 2021-03-31 | 2022-10-14 | 富士通株式会社 | 雑音判定プログラム、雑音判定方法及び雑音判定装置 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58176698A (ja) * | 1982-04-09 | 1983-10-17 | 株式会社日立製作所 | パターンマッチング装置 |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
JPH0454960A (ja) * | 1990-06-26 | 1992-02-21 | Osamu Shibayama | サヤ付きズーム吸引チューブ |
JPH05291971A (ja) | 1992-03-25 | 1993-11-05 | Gs Syst Inc | 信号処理装置 |
US5369701A (en) * | 1992-10-28 | 1994-11-29 | At&T Corp. | Compact loudspeaker assembly |
SE501981C2 (sv) * | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
PL174216B1 (pl) * | 1993-11-30 | 1998-06-30 | At And T Corp | Sposób redukcji w czasie rzeczywistym szumu transmisji mowy |
US5644596A (en) * | 1994-02-01 | 1997-07-01 | Qualcomm Incorporated | Method and apparatus for frequency selective adaptive filtering |
US6885752B1 (en) * | 1994-07-08 | 2005-04-26 | Brigham Young University | Hearing aid device incorporating signal processing techniques |
US8085959B2 (en) * | 1994-07-08 | 2011-12-27 | Brigham Young University | Hearing compensation system incorporating signal processing techniques |
GB2317084B (en) * | 1995-04-28 | 2000-01-19 | Northern Telecom Ltd | Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals |
JPH0990974A (ja) * | 1995-09-25 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 信号処理方法 |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
DE69716266T2 (de) * | 1996-07-03 | 2003-06-12 | British Telecommunications P.L.C., London | Sprachaktivitätsdetektor |
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP2000163099A (ja) * | 1998-11-25 | 2000-06-16 | Brother Ind Ltd | 雑音除去装置、音声認識装置および記憶媒体 |
GB9918611D0 (en) * | 1999-08-07 | 1999-10-13 | Sibelius Software Ltd | Music database searching |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
JP4221537B2 (ja) * | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
KR100367700B1 (ko) * | 2000-11-22 | 2003-01-10 | 엘지전자 주식회사 | 음성부호화기의 유/무성음정보 추정방법 |
CA2349041A1 (en) * | 2001-05-28 | 2002-11-28 | Alireza Karimi Ziarani | System and method of extraction of sinusoids of time-varying characteristics |
US6996241B2 (en) * | 2001-06-22 | 2006-02-07 | Trustees Of Dartmouth College | Tuned feedforward LMS filter with feedback control |
CA2413714C (en) * | 2001-12-07 | 2011-11-15 | Ecole De Technologie Superieure | Adjustable electronic duplexer |
JP4054960B2 (ja) * | 2001-12-25 | 2008-03-05 | 三菱瓦斯化学株式会社 | ニトリル化合物の製造方法 |
WO2004009007A1 (en) * | 2002-07-19 | 2004-01-29 | The Penn State Research Foundation | A linear independent method for noninvasive online secondary path modeling |
US7242763B2 (en) * | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
JP2004240214A (ja) | 2003-02-06 | 2004-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号判別方法、音響信号判別装置、音響信号判別プログラム |
JP2004354589A (ja) | 2003-05-28 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号判別方法、音響信号判別装置、音響信号判別プログラム |
JP4023806B2 (ja) * | 2003-09-30 | 2007-12-19 | 株式会社東芝 | コンテンツ再生システム及びコンテンツ再生プログラム |
JP4520732B2 (ja) | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
KR101160529B1 (ko) * | 2004-03-08 | 2012-06-28 | 케이비 세렌 가부시키가이샤 | 직편물, 스피커용 진동판 및 스피커 |
JP4456504B2 (ja) * | 2004-03-09 | 2010-04-28 | 日本電信電話株式会社 | 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム |
US8712768B2 (en) * | 2004-05-25 | 2014-04-29 | Nokia Corporation | System and method for enhanced artificial bandwidth expansion |
KR100677126B1 (ko) * | 2004-07-27 | 2007-02-02 | 삼성전자주식회사 | 레코더 기기의 잡음 제거 장치 및 그 방법 |
KR100640865B1 (ko) * | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 품질 향상 방법 및 장치 |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
JP4423300B2 (ja) * | 2004-10-28 | 2010-03-03 | 富士通株式会社 | 雑音抑圧装置 |
US7917358B2 (en) * | 2005-09-30 | 2011-03-29 | Apple Inc. | Transient detection by power weighted average |
US8744844B2 (en) * | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
WO2008028484A1 (en) * | 2006-09-05 | 2008-03-13 | Gn Resound A/S | A hearing aid with histogram based sound environment classification |
US20080091415A1 (en) * | 2006-10-12 | 2008-04-17 | Schafer Ronald W | System and method for canceling acoustic echoes in audio-conference communication systems |
FR2908003B1 (fr) * | 2006-10-26 | 2009-04-03 | Parrot Sa | Procede de reduction de l'echo acoustique residuel apres supression d'echo dans un dispositif"mains libres" |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
CN101627428A (zh) * | 2007-03-06 | 2010-01-13 | 日本电气株式会社 | 抑制杂音的方法、装置以及程序 |
US7912567B2 (en) * | 2007-03-07 | 2011-03-22 | Audiocodes Ltd. | Noise suppressor |
US7873114B2 (en) * | 2007-03-29 | 2011-01-18 | Motorola Mobility, Inc. | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate |
US7856353B2 (en) * | 2007-08-07 | 2010-12-21 | Nuance Communications, Inc. | Method for processing speech signal data with reverberation filtering |
US8175871B2 (en) * | 2007-09-28 | 2012-05-08 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
US8175291B2 (en) * | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
US8194882B2 (en) * | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
JP4950930B2 (ja) * | 2008-04-03 | 2012-06-13 | 株式会社東芝 | 音声/非音声を判定する装置、方法およびプログラム |
JP5291971B2 (ja) | 2008-04-08 | 2013-09-18 | 花王株式会社 | メソポーラスシリカ粒子の製造方法 |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
US8380497B2 (en) * | 2008-10-15 | 2013-02-19 | Qualcomm Incorporated | Methods and apparatus for noise estimation |
US8660281B2 (en) * | 2009-02-03 | 2014-02-25 | University Of Ottawa | Method and system for a multi-microphone noise reduction |
JP5293329B2 (ja) * | 2009-03-26 | 2013-09-18 | 富士通株式会社 | 音声信号評価プログラム、音声信号評価装置、音声信号評価方法 |
FR2944640A1 (fr) * | 2009-04-17 | 2010-10-22 | France Telecom | Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal. |
WO2010146711A1 (ja) * | 2009-06-19 | 2010-12-23 | 富士通株式会社 | 音声信号処理装置及び音声信号処理方法 |
-
2009
- 2009-06-19 WO PCT/JP2009/061221 patent/WO2010146711A1/ja active Application Filing
- 2009-06-19 EP EP09846204.7A patent/EP2444966B1/en active Active
- 2009-06-19 JP JP2011519388A patent/JP5293817B2/ja active Active
- 2009-06-19 CN CN200980159921.XA patent/CN102804260B/zh active Active
-
2011
- 2011-12-19 US US13/330,100 patent/US8676571B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2444966B1 (en) | 2019-07-10 |
CN102804260A (zh) | 2012-11-28 |
CN102804260B (zh) | 2014-10-08 |
US8676571B2 (en) | 2014-03-18 |
WO2010146711A1 (ja) | 2010-12-23 |
EP2444966A4 (en) | 2016-08-31 |
JP5293817B2 (ja) | 2013-09-18 |
EP2444966A1 (en) | 2012-04-25 |
US20120095755A1 (en) | 2012-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293817B2 (ja) | 音声信号処理装置及び音声信号処理方法 | |
US8521530B1 (en) | System and method for enhancing a monaural audio signal | |
KR101121489B1 (ko) | 복수의 노이즈 억제 기술을 이용하는 노이즈 억제 회로 및 방법 | |
JP4836720B2 (ja) | ノイズサプレス装置 | |
JP5923994B2 (ja) | 音声処理装置及び音声処理方法 | |
US9197181B2 (en) | Loudness enhancement system and method | |
JP4649546B2 (ja) | 補聴器 | |
JP4018571B2 (ja) | 音声強調装置 | |
JP2014232331A (ja) | アダプティブ・インテリジェント・ノイズ抑制システム及び方法 | |
US9124708B2 (en) | Far-end sound quality indication for telephone devices | |
AU2017405291B2 (en) | Method and apparatus for processing speech signal adaptive to noise environment | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
JP2013059064A (ja) | 移動体オーディオデバイスのための自動的な音量およびダイナミックレンジの調整 | |
JPWO2006046293A1 (ja) | 雑音抑圧装置 | |
CN112019967B (zh) | 一种耳机降噪方法、装置、耳机设备及存储介质 | |
WO2018148095A1 (en) | Soft-talk audio capture for mobile devices | |
JP2008309955A (ja) | ノイズサプレス装置 | |
KR20150096090A (ko) | 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치 | |
JP4317222B2 (ja) | ネットワークにおける通信リンクの送話品質の測定 | |
JP7043344B2 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム | |
JP4838282B2 (ja) | ハンズフリー通話装置及びハンズフリー通話方法 | |
JP4479625B2 (ja) | 騒音抑圧装置 | |
Shruthi et al. | Speech intelligibility prediction and near end listening enhancement for mobile appliciation | |
JP2010124207A (ja) | 音量調整装置、その方法、そのプログラム、その記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5293817 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |