JP2008052117A - 雑音除去装置、方法及びプログラム - Google Patents
雑音除去装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2008052117A JP2008052117A JP2006229341A JP2006229341A JP2008052117A JP 2008052117 A JP2008052117 A JP 2008052117A JP 2006229341 A JP2006229341 A JP 2006229341A JP 2006229341 A JP2006229341 A JP 2006229341A JP 2008052117 A JP2008052117 A JP 2008052117A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- spectrum
- noise removal
- mask
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 43
- 238000001228 spectrum Methods 0.000 claims abstract description 46
- 230000006870 function Effects 0.000 claims description 38
- 238000004458 analytical method Methods 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 14
- 230000005236 sound signal Effects 0.000 claims description 10
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 3
- 238000004364 calculation method Methods 0.000 abstract description 19
- 238000005311 autocorrelation function Methods 0.000 description 7
- 230000036961 partial effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】 少ない演算量、処理量で、雑音成分を適切に除去できる雑音除去装置を提供する。
【解決手段】 本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去装置に関する。そして、上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段とを有することを特徴とする。
【選択図】 図2
【解決手段】 本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去装置に関する。そして、上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段とを有することを特徴とする。
【選択図】 図2
Description
本発明は、雑音の含まれる音声信号から雑音成分を除去する雑音除去装置、方法及びプログラムに関するものである。
電話、携帯電話を利用して音声を入力する機会は非常に多い。しかし、雑音(例えば、交差点の雑音、オフィスの雑音など)が含まれ、目的とする音声が伝わり難かったり、音声認識装置の誤認識を起こしたりする場合が多い。そのため、不要な雑音を除去する処理が必要となる。雑音除去の方法は従来からも提案されている。
非特許文献1では、無相関性雑音の除去を目的とした音声処理方式として、SPAC(Speach Processing system by use of Auto correlation function)方式を提案している。
周期波の自己相関関数ψは、原信号と同じ周波数成分からなり、周期の検出も容易である。一方、ランダム雑音の自己相関関数ψは、その原点付近に振幅成分が集中する。SPAC方式は、このような自己相関関数ψの性質を利用し、音声の短時間自己相関関数を波形とみなし、その1周期の波形を接続して音声信号を再生する方式であり、雑音と信号との相関関数の違いを利用し、雑音レベルの低減やSN比の改善を行うことができる。量子化された信号について、SPAC方式による雑音低減処理を行うと、ポーズの雑音が大幅に抑圧され、非常に聞きやすくなる。
非特許文献2は、音声が存在していない区間での入力を平均化して雑音のスペクトルとして保持し、音声区間中に入力された雑音を含む音声のスペクトルからこの雑音のスペクトルを差し引いて音声のスペクトルとする方法を記載している。
高杉敏男,鈴木誠史,田中良二,"自己相関関数を利用した音声処理方式(SPAC)の機能と基本特性",信学論,J62−A,No.3,pp.175−182,1979年3月 S.F.Boll,"Suppression of Acoustic Noise in Speech Using Spectral Subtraction",IEEE Trans. ASSP−27,No.2,pp.113−120,1979
高杉敏男,鈴木誠史,田中良二,"自己相関関数を利用した音声処理方式(SPAC)の機能と基本特性",信学論,J62−A,No.3,pp.175−182,1979年3月 S.F.Boll,"Suppression of Acoustic Noise in Speech Using Spectral Subtraction",IEEE Trans. ASSP−27,No.2,pp.113−120,1979
しかしながら、非特許文献1の方法では、多くの演算を必要とする自己相関関数を求めなければいけない。また、自己相関関数を用いて音声を生成しているため、音声の周波数特性が元の音声の周波数スペクトラムの二乗になってしまい、音声に歪を生じてしまう。音声の周波数特性が二乗になる回避策としては、音声を複数の帯域に分割して、それぞれの帯域ごとに周波数特性のルート処理を予め取る手法が提案されているが、帯域に分割するための処理、ルートを取る処理に多くの演算を必要とする。
非特許文献2の方法では、周囲の雑音が定常的であることを仮定しており、定常雑音の場合、又は、雑音が小さい場合は効果があるが、比較的大きなレベルの非定常雑音の環境下では雑音の成分を適切に除去することができないという欠点がある。
また、雑音除去装置として、本来の音声を捕捉するマイクロフォンの他に、雑音成分を捕捉するためのマイクロフォンを設け、これら2本のマイクロフォンの捕捉信号から雑音を除去するものもあるが、処理量が多いものである。
そのため、少ない演算量、処理量で、雑音成分を適切に除去できる雑音除去装置、方法及びプログラムが望まれている。
第1の本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去装置において、(1)上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、(2)上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段とを有することを特徴とする。
第2の本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去方法において、(0)ピーク検出手段及びマスク処理手段を有し、(1)上記ピーク検出手段は、上記音声信号のスペクトルから、そのピーク位置を検出し、(2)上記マスク処理手段は、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得ることを特徴とする。
第3の本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去プログラムであって、コンピュータを、(1)上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、(2)上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段として機能させることを特徴とする。
本発明の雑音除去装置、方法及びプログラムによれば、少ない演算量、処理量で、雑音成分を適切に除去することができる。
(A)主たる実施形態
以下、本発明による雑音除去装置、方法及びプログラムの一実施形態を、図面を参照しながら説明する。この実施形態の雑音除去装置の用途は限定されるものではないが、例えば、音声認識装置の前処理装置として雑音除去装置が搭載されたり、携帯電話などのハンズフリー電話の捕捉音声の初期処理段に設けたりするものである。
以下、本発明による雑音除去装置、方法及びプログラムの一実施形態を、図面を参照しながら説明する。この実施形態の雑音除去装置の用途は限定されるものではないが、例えば、音声認識装置の前処理装置として雑音除去装置が搭載されたり、携帯電話などのハンズフリー電話の捕捉音声の初期処理段に設けたりするものである。
(A−1)実施形態の構成
図1は、実施形態の雑音除去装置の全体構成を示すブロック図であり、図2は、その各部の詳細構成を示すブロック図である。なお、図2は、各部の処理及び処理の流れを示す図面としてみることもできる。
図1は、実施形態の雑音除去装置の全体構成を示すブロック図であり、図2は、その各部の詳細構成を示すブロック図である。なお、図2は、各部の処理及び処理の流れを示す図面としてみることもできる。
図1において、この実施形態の雑音除去装置1は、大きくは、分析部10、雑音除去部20及び生成部30を有する。これら分析部10、雑音除去部20及び生成部30はそれぞれ、専用のハードウェア(例えば半導体チップ)で構成されても良く、また、プロセッサ(CPU)を有する装置に、プロセッサに分析部10、雑音除去部20又は生成部30としての機能を実行させるためのプログラムを搭載することによって実現するようにしても良い。
分析部10は、雑音の混在したディジタル音声信号を入力し、FFT(高速フーリエ変換)処理により周波数分析を行うものである。雑音除去部20は、分析部10からの出力を入力として雑音成分を除去するものである。生成部30は、雑音除去部20からの出力に対して逆FFT処理して出力音声を生成するものである。
分析部10は、詳細には、図2に示すように、窓処理部101及びFFT処理部102を有する。
分析部10に入力されるディジタル音声信号をx(n)とする。但し、nは、n番目のデータ(サンプル)を表している。ディジタル音声信号x(n)は、例えば、マイクロフォンなどの音声入力装置から入力されたアナログ音声信号を、アナログ/ディジタル変換し、標本化周期T毎に標本化することにより得られるものである。標本化周期Tは、通常31.25マイクロ秒〜125マイクロ秒程度である。N個の連続するx(n)を1つの分析単位(フレーム)として、各部での処理が行われる。ここでは、一例としてN=512とする。処理対象分析単位に対する当該雑音除去装置10の一連の処理が終了すると、x(n)のうち後半のN/2個のデータを前半にシフトし、新たに連続するN/2個のデータを入力し、後半に接続することにより、新たなN個の連続するx(n)を生成し、1つの分析単位として新たな処理を行い、このような処理対象分析単位の切り替えを繰り返すようになされている。
なお、入力ディジタル音声信号はマイクロフォンが捕捉してアナログ/ディジタル変換されたものに限定されない。例えば、記録媒体などから読み出されたものであっても良く、また、他の装置から通信によって与えられたものであっても良い。
窓処理部101は、N個の連続するx(n)に対し、分析精度をあげるために窓関数をかける。窓処理部101の出力b(n)は、窓関数をw(n)とすると、(1)式で得られる。なお、窓関数w(n)としては、各種の窓関数を適用可能であるが、例えば、(2)式に示すようなハミング窓を適用する。窓処理は、後述するように生成部30における分析単位の接続処理を考慮してなされる処理である。
ただし、窓関数をかけることは好ましいが、必須ではなく、窓処理部101を省略することができる。
なお、周波数分析方法は、FFTに限定されず、DFT(離散フーリエ変換)などの他の周波数分析方法を適用するようにしても良い。また、実施形態の雑音除去装置1が搭載される装置によっては、他の目的の処理装置における分析部構成を、この雑音除去装置1の構成として流用するようにしても良い。例えば、当該雑音除去装置1が搭載される装置がIP電話の場合には、このような流用が可能である。IP電話の場合、IPパケットのペイロードにはFFT出力を符号化したものを挿入するが、そのFFT出力を、上述した分析部10の出力として流用することができる。
雑音除去部20は、詳細には、図2に示すように、振幅特性算出処理部201、ピーク検出処理部202及びマスク処理部203を有する。
振幅特性算出処理部201は、FFT処理部102からの出力C(m)の振幅特性を算出するものである。FFT処理部102からの出力C(m)は複素数であり、振幅特性算出処理部201は、その出力C(m)に対し、(4)式に示すように、絶対値演算、対数演算を行い、振幅特性D(m)を得る。対数演算処理は、聴感上のリニアリティを考慮してなされる処理である。
雑音除去部20の処理は、スペクトルC(m)の性質C(m)=C*(N−m)(ただし、1≦m≦N/2−1、C*(N−m)はC(N−m)の共役複素数を表す)から、0≦m≦N/2の範囲で行えば良い。
ピーク検出処理部202は、振幅特性D(m)のピークを検出する。すなわち、ピーク検出処理部202は、振幅特性D(m)がmに対して局所的に最大になるピークポイントmpを探索するものである。
雑音による影響を少なく、かつ、振幅特性D(m)のピーク(極大値)を強調する目的で、一般的な音声信号のスペクトルのピーク付近の平均形状に近い部分比較関数E(m)を用い、振幅特性D(m)と部分比較関数E(m)との非類似度F(m)を(5)式に従って算出して、非類似度F(m)が閾値を下回り(言い換えると、類似度合が大きく)、かつ、極小値を与える位置をピークポイントmpとする。部分比較関数E(m)は、ピーク検出処理部202が予め保持しているものである。(5)式におけるM1とM2は、部分比較関数E(m)が値を持つ範囲の始めと終わりである。
マスク処理部203は、複数個のピークポイントmpの中で、大きな振幅特性D(mm)を与えるピークポイントmmから順に、以下のようなマスク処理を行うものである。
マスク処理部203には、予め聴覚のマスキング特性を考慮して作成したマスク関数M(s,mm,D(mm))をテーブル化して格納しておく(後述する図4参照)。マスク処理部203は、振幅特性D(m)とマスク関数M(s,mm,D(mm))との間に(6)式の関係を満足する、ポイントs(sは0≦s≦N/2の範囲)に対して、FFT処理部102の出力C(m)を0に置き換える処理(マスク)を行う。マスク処理部203は、全てのピークポイントmpに対して、マスク処理を実施する。
0≦m≦N/2の範囲で求められた雑音除去スペクトルG(m)に対して、G(m)=G*(N−m)(ただし、N/2+1≦m≦N−1)によって、0≦m≦N−1の範囲の雑音除去スペクトルG(m)を求める。その結果得られた雑音除去スペクトルG(m)を生成部30に与える。
生成部30は、詳細には、図2に示すように、逆FFT処理部301及び接続処理部302を有する。
逆FFT処理部301は、雑音除去スペクトルG(m)をN点逆FFT処理し、雑音除去信号g(n)を得るものである。なお、上述したFFT処理部102に代えて、DFT処理部を適用している場合には、この逆FFT処理部301も逆DFT処理部に置き換えられる。
接続処理部302は、(7)式に示すように、現在の処理対象分析単位についての雑音除去信号g(n)の前半のN/2個のデータと、直前の分析単位についての雑音除去信号g’(n)の後半のN/2個のデータを加算して、出力y(n)を得るものである
ここで、相前後する分析単位で半数のデータ(サンプル)を重複させるように、N/2個のデータをシフトしながら、上述した処理を行うのは、波形接続を円滑に行うためであり、この手法は良く用いられている。1つの分析単位に対し、分析部10から当該生成部30までの上述した一連の処理に許される時間は、NT/2となる。
なお、雑音除去装置の用途によっては、生成部30を省略したり、他の装置が有する生成部を流用したりすることができる。例えば、雑音除去装置が音声認識装置に利用される場合であれば、雑音除去スペクトルG(m)を認識用特徴量として用いるようにして生成部30を省略することができる。また例えば、雑音除去装置がIP電話機に利用される場合であれば、IP電話機が生成部を有するので、その生成部を流用するようにしても良い。
(A−2)実施形態の動作
次に、上述した構成を有する実施形態の雑音除去装置1の動作(実施形態の雑音除去方法)を、図3及び図4をも参照しながら説明する。
次に、上述した構成を有する実施形態の雑音除去装置1の動作(実施形態の雑音除去方法)を、図3及び図4をも参照しながら説明する。
分析部10に入力されたN個の連続するデータx(n)に対し、窓処理部101によって窓処理が施され、窓処理後のデータb(n)に対し、FFT処理部102によって、N点FFT処理が実行される。
FFT処理部102で得られるスペクトルC(m)は、雑音除去部20に与えられる。雑音除去部20の処理は、スペクトルC(m)の性質C(m)=C*(N−m)(ただし、1≦m≦N/2−1、C*(N−m)はC(N−m)の共役複素数を表す)から、0≦m≦N/2の範囲で行えば良い。
雑音除去部20においては、振幅特性算出処理部201によって、スペクトルC(m)の振幅特性が算出される。図3(a)は、振幅特性算出処理部201からの出力D(m)の一例を示している。振幅特性D(m)には、概ね30〜100個程度のピークポイントが含まれている。
次に、ピーク検出処理部202によって、図3(b)に示すような部分比較関数E(m)が利用され、振幅特性D(m)のピークが検出される。すなわち、図3(a)に示す振幅特性D(m)と図3(b)に示す部分比較関数E(m)との非類似度F(m)が算出され、この非類似度F(m)が閾値を下回って、かつ、極小値を与える位置をピークポイントmpとして検出する。図3(c)は、図3(a)に示す振幅特性D(m)に対して図3(b)に示す部分比較関数E(m)を適用した場合の非類似度F(m)を示しており、この非類似度F(m)から、図3(d)に示すようなピークポイントmpが検出される。
マスク処理部203においては、まず、ピークポイントmpの中から最も大きな振幅特性D(mm)を与えるピークポイントmmが認識され、予め作成して格納されているマスク関数M(s,mm,D(mm))のテーブルから、認識されたピークポイントmmについてのマスク関数M(s,mm,D(mm))が取り出され、振幅特性D(m)とマスク関数M(s,mm,D(mm))との間に(6)式の関係を満足する、ポイントs(sは0≦s≦N/2の範囲)に対して、FFT処理部102の出力C(m)が0に置き換えられる。
このような処理が、ピークポイントmpの大きい方から順に、全てのピークポイントmpに対して繰返し実行される。
図4は、マスク関数M(s,mm,D(mm))の例を示している。実線曲線(黒菱形を連結した曲線)は、マスク関数M(s,38,100)を示しており、破線曲線(黒四角形を連結した曲線)は、マスク関数M(s,28,100)を示している。周波数が高いピークポイントほど、マスクし易く近傍範囲が広くなっている。
図3(e)は、マスク処理部203から出力された雑音除去スペクトルG(m)を示している。雑音除去スペクトルG(m)は、振幅特性D(m)と比較すると、振幅特性D(m)のピーク(極大値)近傍を強調されたものとなっている。振幅特性D(m)で値が小さい周波数成分は雑音成分とみなすことができ、この実施形態ではこれを除去することとした。振幅特性D(m)で値が大きい周波数成分はSN比が非常に良好な成分であり、雑音成分の排除を行わなくても聴感上問題とならない。また、雑音成分とみなせる周波数成分を除去しても、人間の周波数を連続的に処理する認知力が優っており、違和感を伴うことがない。この実施形態では、このような点に着目し、振幅特性D(m)におけるピークポイントを基準としたマスク処理によって雑音を除去することとした。
0≦m≦N/2の範囲で求められた雑音除去スペクトルG(m)に対して、G(m)=G*(N−m)(ただし、N/2+1≦m≦N−1)によって、0≦m≦N−1の範囲の雑音除去スペクトルG(m)を求める。
雑音除去スペクトルG(m)は、生成部30の逆FFT処理部301によって、N点逆FFT処理が施され、雑音除去信号g(n)に変換され、さらに、接続処理部302によって、分析単位の雑音除去信号g(n)が接続されて出力信号y(n)が得られる。
(A−3)実施形態の効果
上記実施形態によれば、周波数特性上で雑音除去するようにしたので、他の方式に比較して極めて少ない処理量、演算量で雑音を除去することができる。また、マイクロフォンを2本利用するような従来装置に比較すると、構成又は処理を簡易なものとすることができる。
上記実施形態によれば、周波数特性上で雑音除去するようにしたので、他の方式に比較して極めて少ない処理量、演算量で雑音を除去することができる。また、マイクロフォンを2本利用するような従来装置に比較すると、構成又は処理を簡易なものとすることができる。
(B)他の実施形態
上記実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記実施形態では、相前後する分析単位がデータの1/2ずつをオーバーラップするものを示したが、相前後する分析単位のデータが完全に切り分けられているようにしても良い。このようにした場合には、プロセッサに処理能力が低い場合や、他に処理能力を使いたい場合等であっても、雑音除去を行うことができる。なお、この場合には、窓処理を実行しない方が良い。
振幅特性算出処理部201における演算を、上記実施形態より簡略化する方法として、以下の2つの方法を挙げることができる。
第1は、振幅特性算出処理部201において、対数演算を省略して、振幅特性D(m)を(8)式で算出する方法であり、上記実施形態とほぼ同様の効果を得ることができる。第2は、振幅特性算出処理部201において、対数演算と絶対値演算に必要な平方根処理を省略して、振幅特性D(m)を(9)式で算出する方法であり、上記実施形態とほぼ同様の効果を得ることができる。ただし、いずれの方法でも、マスク関数M(s,mm,D(mm))は、新たな振幅特性D(m)に合わせて変換する必要がある。
また、上記実施形態より、ピーク検出処理部202の演算を簡略化する方法として、振幅特性D(m)をm−KからB+K(Kは任意の数)までの区間平均化してピークを求める方法を挙げることができる。
さらに、マスク関数M(s,mm,D(mm))も、実施形態のようなスペクトラムの全域に有効な値を有するものを適用する代りに、(10)式に示すような極めて簡略化されたマスク関数M(s,mm,D(mm))を適用するようにしても良い。Pをピークポイントmpの平均的な間隔に設定すると、(10)式に示すマスク関数は、ピークポイントmpからPまで隔てた振幅特性でH(Hは予め定められた定数)以上減衰しているFFT処理部102の出力C(s)をマスクする作用を持っている。
さらにまた、マスク関数M(s,mm,D(mm))として、パラメータs及びmmが同じ場合には同じ曲線のマスク関数を適用し、D(mm)によって、それを上下して適用するようにしても良い。
なお、マスク処理によって置き換わる値は0に限定されない。例えば、振幅特性D(m)を減衰させた値を用いても良い。
また、本発明の雑音除去装置は他の雑音除去装置と併用しても良い。例えば、本発明の雑音除去装置の前段に、2本のマイクロフォンを利用して複数話者の音声を分離する独立成分分析(Independent Component Analysis:ICA)による音源分離装置を設けて、分離した音声信号に対し、本発明の雑音除去装置を適用して残っている雑音を除去するようにしても良い。
1…雑音除去装置、
10…分析部、101…窓処理部、102…FFT処理部、
20…雑音除去部、201…振幅特性算出処理部、202…ピーク検出処理部、203…マスク処理部、
30…生成部、301…逆FFT処理部、302…接続処理部。
10…分析部、101…窓処理部、102…FFT処理部、
20…雑音除去部、201…振幅特性算出処理部、202…ピーク検出処理部、203…マスク処理部、
30…生成部、301…逆FFT処理部、302…接続処理部。
Claims (7)
- 雑音の混入した音声信号から雑音成分を除去する雑音除去装置において、
上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、
上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段と
を有することを特徴とする雑音除去装置。 - 上記音声信号が入力され、そのスペクトルを得る周波数分析手段をさらに有することを特徴とする請求項1に記載の雑音除去装置。
- 上記雑音除去スペクトルを、音声信号に変換する信号生成処理手段をさらに有することを特徴とする請求項1又は2に記載の雑音除去装置。
- 雑音の混入した音声信号から雑音成分を除去する雑音除去方法において、
ピーク検出手段及びマスク処理手段を有し、
上記ピーク検出手段は、上記音声信号のスペクトルから、そのピーク位置を検出し、
上記マスク処理手段は、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得る
ことを特徴とする雑音除去方法。 - 周波数分析手段をさらに有し、この周波数分析手段が、入力された上記音声信号のスペクトルを得ることを特徴とする請求項4に記載の雑音除去方法。
- 信号生成処理手段をさらに有し、この信号生成処理手段が、上記雑音除去スペクトルを、音声信号に変換することを特徴とする請求項4又は5に記載の雑音除去方法。
- 雑音の混入した音声信号から雑音成分を除去する雑音除去プログラムであって、
コンピュータを、
上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、
上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段として
機能させることを特徴とする雑音除去プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006229341A JP2008052117A (ja) | 2006-08-25 | 2006-08-25 | 雑音除去装置、方法及びプログラム |
CNA2007100973519A CN101131819A (zh) | 2006-08-25 | 2007-05-11 | 噪声除去装置、方法以及程序 |
US11/806,316 US7917359B2 (en) | 2006-08-25 | 2007-05-31 | Noise suppressor for removing irregular noise |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006229341A JP2008052117A (ja) | 2006-08-25 | 2006-08-25 | 雑音除去装置、方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008052117A true JP2008052117A (ja) | 2008-03-06 |
Family
ID=39129068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006229341A Pending JP2008052117A (ja) | 2006-08-25 | 2006-08-25 | 雑音除去装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7917359B2 (ja) |
JP (1) | JP2008052117A (ja) |
CN (1) | CN101131819A (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8391212B2 (en) | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
CN108604452B (zh) * | 2016-02-15 | 2022-08-02 | 三菱电机株式会社 | 声音信号增强装置 |
US11137318B2 (en) * | 2018-06-19 | 2021-10-05 | Palo Alto Research Center Incorporated | Model-based diagnosis in frequency domain |
CN109341848B (zh) * | 2018-09-26 | 2021-07-13 | 南京棠邑科创服务有限公司 | 一种隧道运营阶段的安全监测系统 |
CN109461447B (zh) * | 2018-09-30 | 2023-08-18 | 厦门快商通信息技术有限公司 | 一种基于深度学习的端到端说话人分割方法及系统 |
US11409512B2 (en) * | 2019-12-12 | 2022-08-09 | Citrix Systems, Inc. | Systems and methods for machine learning based equipment maintenance scheduling |
CN112259068B (zh) * | 2020-10-21 | 2023-04-11 | 上海协格空调工程有限公司 | 一种主动降噪空调系统及其降噪控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0934494A (ja) * | 1995-07-15 | 1997-02-07 | Nec Corp | 音声信号処理回路 |
JPH09171397A (ja) * | 1995-12-20 | 1997-06-30 | Oki Electric Ind Co Ltd | 背景雑音消去装置 |
JPH103297A (ja) * | 1996-06-14 | 1998-01-06 | Oki Electric Ind Co Ltd | 背景雑音消去装置 |
JP2002050967A (ja) * | 1993-05-31 | 2002-02-15 | Sony Corp | 信号記録媒体 |
WO2005024788A1 (ja) * | 2003-09-02 | 2005-03-17 | Nippon Telegraph And Telephone Corporation | 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体 |
JP2006154314A (ja) * | 2004-11-29 | 2006-06-15 | Kobe Steel Ltd | 音源分離装置,音源分離プログラム及び音源分離方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
DE60033826T2 (de) * | 1999-07-28 | 2007-11-08 | Clear Audio Ltd. | Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank |
US20050288923A1 (en) * | 2004-06-25 | 2005-12-29 | The Hong Kong University Of Science And Technology | Speech enhancement by noise masking |
-
2006
- 2006-08-25 JP JP2006229341A patent/JP2008052117A/ja active Pending
-
2007
- 2007-05-11 CN CNA2007100973519A patent/CN101131819A/zh active Pending
- 2007-05-31 US US11/806,316 patent/US7917359B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002050967A (ja) * | 1993-05-31 | 2002-02-15 | Sony Corp | 信号記録媒体 |
JPH0934494A (ja) * | 1995-07-15 | 1997-02-07 | Nec Corp | 音声信号処理回路 |
JPH09171397A (ja) * | 1995-12-20 | 1997-06-30 | Oki Electric Ind Co Ltd | 背景雑音消去装置 |
JPH103297A (ja) * | 1996-06-14 | 1998-01-06 | Oki Electric Ind Co Ltd | 背景雑音消去装置 |
WO2005024788A1 (ja) * | 2003-09-02 | 2005-03-17 | Nippon Telegraph And Telephone Corporation | 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体 |
JP2006154314A (ja) * | 2004-11-29 | 2006-06-15 | Kobe Steel Ltd | 音源分離装置,音源分離プログラム及び音源分離方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080052067A1 (en) | 2008-02-28 |
US7917359B2 (en) | 2011-03-29 |
CN101131819A (zh) | 2008-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105788607B (zh) | 应用于双麦克风阵列的语音增强方法 | |
JP5007442B2 (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
JP2008052117A (ja) | 雑音除去装置、方法及びプログラム | |
US9721584B2 (en) | Wind noise reduction for audio reception | |
Karam et al. | Noise removal in speech processing using spectral subtraction | |
CN109523999B (zh) | 一种提升远场语音识别的前端处理方法和系统 | |
US8615394B1 (en) | Restoration of noise-reduced speech | |
JP2004502977A (ja) | サブバンド指数平滑雑音消去システム | |
JP5272920B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
KR102191736B1 (ko) | 인공신경망을 이용한 음성향상방법 및 장치 | |
JP2010122617A (ja) | ノイズゲート、及び収音装置 | |
US10176824B2 (en) | Method and system for consonant-vowel ratio modification for improving speech perception | |
CN110148426B (zh) | 一种啸叫检测方法及其设备、存储介质、电子设备 | |
US20150071463A1 (en) | Method and apparatus for filtering an audio signal | |
TWI767696B (zh) | 自我語音抑制裝置及方法 | |
JP4568193B2 (ja) | 収音装置とその方法とそのプログラムとその記録媒体 | |
KR101547344B1 (ko) | 음성복원장치 및 그 방법 | |
JP6314475B2 (ja) | 音声信号処理装置及びプログラム | |
EP3456067B1 (en) | Noise detection and noise reduction | |
JP7144078B2 (ja) | 信号処理装置、音声通話端末、信号処理方法および信号処理プログラム | |
JP5113096B2 (ja) | 音源分離方法、装置およびプログラム | |
KR100744375B1 (ko) | 음성 처리 장치 및 방법 | |
KR20080082857A (ko) | 위상차이와 스펙트럼의 에너지를 이용한 잡음제거 방법 및장치 | |
Upadhyay et al. | A perceptually motivated stationary wavelet packet filterbank using improved spectral over-subtraction for enhancement of speech in various noise environments | |
Chokkarapu et al. | Implementation of spectral subtraction noise suppressor using DSP processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110726 |