JP2009110011A - 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム - Google Patents

雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム Download PDF

Info

Publication number
JP2009110011A
JP2009110011A JP2008309260A JP2008309260A JP2009110011A JP 2009110011 A JP2009110011 A JP 2009110011A JP 2008309260 A JP2008309260 A JP 2008309260A JP 2008309260 A JP2008309260 A JP 2008309260A JP 2009110011 A JP2009110011 A JP 2009110011A
Authority
JP
Japan
Prior art keywords
frame
samples
noise suppression
latest
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008309260A
Other languages
English (en)
Other versions
JP4697984B2 (ja
Inventor
Sumitaka Sakauchi
澄宇 阪内
Suehiro Shimauchi
末廣 島内
Yoichi Haneda
陽一 羽田
Akitoshi Kataoka
章俊 片岡
Kenichi Furuya
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008309260A priority Critical patent/JP4697984B2/ja
Publication of JP2009110011A publication Critical patent/JP2009110011A/ja
Application granted granted Critical
Publication of JP4697984B2 publication Critical patent/JP4697984B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Noise Elimination (AREA)

Abstract

【課題】雑音抑圧性能を保持したまま処理遅延時間を削減することができる雑音抑圧方法及び装置を提供する。
【解決手段】入力信号を最新のものから所定のサンプル数記憶する手段と、記憶したサンプルの中の最新のサンプル数が予め定めた所定値Mに達する毎に、最新のものからL個のサンプルによる変換フレームを生成する手段と、生成された変換フレームを周波数領域係数に変換する手段と、周波数領域係数の雑音抑制処理を行う手段と、雑音抑圧済信号を時間領域に変換する手段と、時間領域に変換された信号の最新のものから2M個のサンプルに時間窓を掛けたものを加算フレームとして生成する手段と、、生成された加算フレーム中の最新でない側のM個のサンプルと1フレーム前の加算フレーム中の最新側のM個のサンプルを対応するサンプル毎に加算してサンプル数M個の出力信号を生成する手段と、を備える。
【選択図】図1

Description

この発明は、雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラムに関わり、例えばマイクロホンを用いた音声通信において、音声に重畳してマイクロホンに入力される雑音を抑圧し、音声品質を向上させる技術に関する。
音声信号に雑音信号の重畳した入力信号から、雑音を抑圧し音声信号を強調する従来の技術について特許文献1で提案された方法を例に挙げて説明する。図11においてマイクロホン11に入力された入力信号15はアナログデジタル(A/D)変換器21によってデジタル信号に変換された後、周波数帯域分割部22で複数の帯域に分割される。
その後、入力信号パワー計算部24で入力信号パワーが計算され、これと平行して雑音パワー推定部31で雑音パワーが推定される。次いで、損失値計算部32において、入力信号パワーと雑音パワーから帯域信号中に占める各帯域の雑音比率を求め、この比率に基づいて帯域毎の損失値を決める。次いで、損失値挿入部33において前記損失を挿入し、雑音を低減した帯域出力信号を得た後、これを時間領域変換部28で時間信号に変換し、次いで、デジタルアナログ(D/A)変換器29でアナログ信号に変換し、雑音の低減した出力信号17を得る。
一方、特願2002−104363で提案した音声処理方法では周波数領域での反響抑圧において、フレームシフト毎に一定数、2Nサンプル(Nは2以上の整数)からなるフレーム毎に各フレームのデータを時間領域に変換し、2Nサンプルの前半部分に窓関数の後半部分を掛け、前フレームの2Nサンプルの後半部分に窓関数の前半部分を掛けて足し合わせてオーバーラップ窓掛け演算処理済みの信号を出力する技術が提案されている。
図12を用いて先願で説明されている周波数領域への変換のためのフレーム生成方法及び周波数領域から時間領域へ逆変換後のオーバーラップ加算処理の概要を説明する。
図12に示すINPUTは周波数領域変換処理ステップFFTの前段で実行されるフレーム生成ステップ、OUTPUTは窓掛け演算処理ステップWINの後段で実行されるオーバーラップ加算処理ステップを示す。入力信号INSigはデジタル信号列を示す。デジタル信号列INSigは例えば512サンプル分の記憶容量を持つメモリに記憶される。メモリは最新のサンプルデータを書き込む際は、その書き込み位置が最も古いサンプルデータが記憶されているアドレスに選定される。従って、メモリに記憶されているサンプルデータは常時最新の512個サンプルのデータである。図12に示すNO.1は最も新しいサンプルデータの番号を示し、NO.512は512個前にメモリに記憶されたサンプルデータを示す。Kは1回目のフレーム生成ステップ、K+1は2回目のフレーム生成処理ステップを示す。
前回NO.768〜NO.256までの512個のサンプルデータがメモリに記憶された時点で、これらNO.768〜NO.256までの512個のデータを読み出し、1フレーム分のサンプルデータとして周波数領域変換ステップFFTに引き渡す、周波数領域変換ステップFFTでは512個分のサンプルデータを周波数領域係数に変換し、雑音抑圧ステップNRで雑音抑圧処理を施し、時間領域変換ステップIFFTと窓掛け演算処理ステップWINを至て窓掛け演算された信号S1が出力される。
メモリから1フレーム分のサンプルデータが読み出された後、メモリには引き続いて例えば16KHzの速度でサンプルデータの書き込みが続けられる。最初の1フレーム分のサンプルデータが読み出された時点から更に256個分のサンプルデータNO.256〜NO.1が書き込まれると、メモリの半分の領域のデータが書き換えられる。この時点で2回目の読み出しが実行され、周波数領域変換ステップFFTには前回送られて来たNO.512〜NO.256までのデータに続いてNO.256〜NO.1にまでの512個のサンプルデータが送り込まれる。2回目に送り込まれた512個のサンプルデータは周波数領域変換ステップFFTと、雑音抑圧ステップNRと、時間領域逆変換ステップIFFTを至て窓掛け演算処理ステップWINでは前回時間領域逆変換ステップIFFTから出力されたデータの後半部のデータを使って1フレーム分のデータを生成し、その1フレーム分のデータに窓掛け演算を施し、窓掛け演算処理された信号S2を出力する。
信号S1とS2は1回目のサンプルデータの後半の256個分のデータと、2回目のサンプルデータの前半の256個分のデータとが重ね合わされ加算されて加算処理された信号OUTSigとして出力される。信号OUTSigはその後D/A変換器でアナログ信号に変換されて音声信号に再現される。
上述したように、従来は入力側ではメモリに256個のサンプルとデータが書き込まれる毎に1フレーム分のサンプルデータが周波数領域変換処理ステップFFTに送り出されるから、処理遅延は256個のサンプルデータを取り込む時間となる。
更に、出力側では256個分のデータが出力される毎に前回処理された信号の後半の256個データを使って1フレーム分のデータが揃い、この1フレーム分のデータに窓掛け演算を施すから、出力側でも256個分の処理遅延が発生することになる。
結局、従来は入力側と出力側の双方で256個分のデータを処理する時間が掛かることになり、合計で512個分のデータを処理する時間が処理遅延時間となる。サンプリング周波数を16KHzとすれば512個分のサンプルデータを処理する時間は約32msとなる。
特開平9−258792号公報
従来の方法は、周波数領域毎の雑音抑圧処理であり、各帯域における雑音の比率に見合った損失を挿入して雑音を低減するため、時間領域の処理に比べて精度のよい雑音抑圧が可能である。その代わり、周波数領域に変換するためにフレーム単位の処理を行う必要がある。
すなわち、周波数領域への変換を高速フーリエ変換を用いる場合FFT点数に対応するフレーム長Lは、時間及び周波数分解能のトレードオフから、16KHzのサンプリングの場合で512〜1024サンプル程度(この値を以後Loptとする)が最も良く、その場合には512〜1024サンプルを蓄積するに要する時間32ms〜64ms程度の遅延時間が発生することになる。
しかし、例えば、最近利用が拡大しているIP網を用いた音声通信の音声入力において上記の雑音抑圧を用いる場合、ネットワークの伝送遅延を含めた一巡遅延が増大し通話品質の劣化を引き起こす。また、TV会議等のハンズフリー通話において上述の雑音抑圧を併用する場合にも同様に、一巡遅延を増大させるためにエコーが検知されやすくなるという問題も生じる。
処理遅延を少なくするには、周波数領域に変換する際のフレーム長を短くする方法がある。しかし、この方法では周波数分解能が低下し、音声と雑音の分離性能が劣化するために、音声のゆがみや抑圧量の低下が生じる。図13は、フレーム長(L=FFT点数)を短くした場合の雑音抑圧処理の性能を比較した計算機シミュレーションの結果である。曲線aがマイクロホン入力信号(未処理)、曲線bがFFT点数L=512(最適値)、曲線cがFFT点数L=64で処理した出力信号のパワーを表わす。
前半約1.2秒までの定常部分が雑音区間、後半の山になった部分が音声区間である。FFT点数L=512の出力信号(曲線b)は、雑音区間において約15dB程度の抑圧量が確認できる。音声区間ではマイクロホン入力信号(曲線a)と処理遅延分(32ms)の時間的なずれはあるが、パワーの損失(音声歪み)もほぼ無いことが分かる。これに対し、FFT点数L=64とフレーム長Lを短くした場合(曲線C)は、雑音区間において抑圧量が約10dB程度に低下している。さらに、音声区間では、パワーに約5dB程度の差異があり、実際に聴取すると、音声に歪みが発生している。
以上の結果から、フレーム長Lを短くして処理遅延を削減する方法によっては性能劣化を招く欠点がある。
本出願人はこれらの欠点を解消するために、特願2002−254075号で1フレームの中の極わずかなサンプル(例えば32個)が更新される毎に、その更新されたサンプルを含む1フレーム分のサンプルを周波数領域係数に変換する処理を施し、わずかなサンプルの個数が更新される時間間隔で周波数領域係数への変換処理を繰り返すことにより処理遅延時間を短くすることができる雑音抑圧方法、雑音抑圧装置、及び雑音抑圧プログラムを提案した。
この先に提案した雑音抑圧方法によれば周波数領域係数への変換処理時間間隔が短くなることにより、処理速度が向上し、処理遅延時間を短くすることが出来た。然し乍ら、その反面、周波数領域係数への変換処理回数が増大する欠点が生じる。
図14を用いてその様子を説明する。図中X(0)、X(1)、X(2)…X(N)はそれぞれ、上記した32個のサンプルで構成されるデータのブロックを示す。1ブロック分のサンプルが更新される毎に周波数領域係数に変換処理を施す場合、1フレームにN個のブロックが存在すると、各ステップ毎にN回の乗算と加算を実行しなければならない。周波数領域への変換処理が全て完了するにはLogNステップの処理を繰り返さなくてはならない。LogNステップの演算を実行すると、その演算総量はNLogNとなる。因みに処理遅延を従来の1/8にすると演算総量は8倍になる。演算量の増加は電力消費量の増大と、装置実装において小型化、経済化の弊害となる。
この発明の目的は雑音抑圧性能を保持したまま処理遅延を削減することができる雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラムを提案しようとするものである。
この発明の請求項1では、入力信号を最新のものから所定のサンプル数記憶する入力信号記憶ステップと、入力信号記憶ステップで記憶したサンプルの中の最新のサンプル数が予め定めたサンプル数Mに達する毎に、記憶した最新のものからL個(2M<L)のサンプルによる変換フレームを生成する変換フレーム生成ステップと、変換フレーム生成ステップで生成された変換フレームを周波数領域係数に変換する周波数領域変換ステップと、周波数領域係数の雑音抑圧処理を行う雑音抑圧ステップと、雑音抑圧処理された雑音抑圧済信号を時間領域に変換する時間領域変換ステップと、時間領域に変換された信号の最新のものから2M個のサンプルに時間窓を掛けたものを加算フレームとして生成する加算フレーム生成ステップと、加算フレームを記憶する加算フレーム記憶ステップと、加算フレーム生成ステップで生成された加算フレーム中の最新でない側のM個のサンプルと、加算フレーム記憶ステップで記憶した1フレーム前の加算フレーム中の最新側のM個のサンプルを対応するサンプル毎に加算してサンプル数M個の出力信号を生成する出力信号生成ステップとからなる雑音抑圧方法を提案する。
この発明の請求項2では、請求項1記載の雑音抑圧方法において、M=L/16であることを特徴とする雑音抑圧方法を提案する。
この発明の請求項3では、入力信号を最新のものから所定のサンプル数記憶する入力信号記憶手段と、入力信号記憶手段に記憶したサンプルの中の最新のサンプル数が予め定めた所定値Mに達する毎に、入力信号記憶手段に記憶した最新のものからL個(2M<L)のサンプルによる変換フレームを生成する変換フレーム生成手段と、変換フレーム生成手段が生成した変換フレームを周波数領域係数に変換する周波数領域変換手段と、周波数領域係数の雑音抑制処理を行う雑音抑制手段と、雑音抑圧処理された雑音抑圧済信号を時間領域に変換する時間領域変換手段と、時間領域に変換された信号の最新のものから2M個のサンプルに時間窓を掛けたものを加算フレームとして生成する加算フレーム生成手段と、加算フレーム生成手段が生成した加算フレームを記憶する加算フレーム記憶手段と、加算フレーム生成手段が生成した加算フレーム中の最新でない側のM個のサンプルと加算フレーム記憶手段に記憶した1フレーム前の加算フレーム中の最新側のM個のサンプルを対応するサンプル毎に加算してサンプル数M個の出力信号を生成する出力信号生成手段と、を備えた構成としたことを特徴とする雑音抑圧装置を提案する。
この発明の請求項4では、請求項3記載の雑音抑圧装置において、M=L/16であることを特徴とする雑音抑圧装置を提案する。
この発明の請求項5では、コンピュータが読み取り可能な符号によって記述され、コンピュータに請求項1又は2の何れかに記載の雑音抑圧方法を実行させる雑音抑圧プログラムを提案する。
この発明によれば雑音抑圧性能を保持したまま処理遅延が短い雑音抑圧装置を提供することができる。この結果、例えばIP網を用いた音声通信の通話品質を向上させることができる。
この発明では変換フレーム生成手段は入力信号記憶手段に記憶されている所定のサンプル数のサンプルの中の最新のサンプル数が予め定めた数Mに達する毎に入力信号を周波数領域係数に変換するための変換フレームを生成する。
最新のサンプル数MをM=32とすれば変換フレーム生成手段は入力信号記憶手段に記憶されている、512サンプルの中の最新のサンプル数が32サンプルに達する毎に512サンプルで構成される変換フレームを生成する。つまり、変換フレーム生成手段は入力信号記憶手段に32個のサンプルが取り込まれる毎に512サンプルで構成される1フレーム分の変換フレームを生成する。32個のサンプルを蓄積する時間は約2msであるから、ここでの処理時間は2msで済むことになる。
2msの時間間隔で生成された変換フレームの各サンプルデータは周波数領域係数に変換され、周波数領域で雑音抑圧処理が施される。雑音抑圧処理した後の信号を時間領域に逆変換し、次いで加算フレーム生成手段で時間領域に変換した処理済信号の最新(先頭)の値から2Nサンプル(64サンプル)過去までの値を切り取る。その切り取ったフレームに長さ64点の時間窓(例えばハニング窓)を掛ける。
次に出力信号生成手段で加算フレーム記憶手段に記憶した長さ32サンプルの1処理ブロック前の加算フレームと、今回生成した現加算フレームの最新の値から32サンプル過去までの値(長さ32サンプル)をオーバーラップさせて加算し、出力信号として出力する。今回生成した現加算フレームの後半の32サンプル分は加算フレーム記憶手段に記憶し、次回のオーバーラップ加算処理に利用する。このオーバーラップ加算処理は32サンプル分の遅延(2ms)となり、合計して4msで済むことになる。
このように、この発明によれば周波数領域に変換する際にMサンプルを蓄積するに要する時間と、Mサンプル分のデータをオーバーラップ加算処理するに要する時間の和はMサンプルの数を「32」とした場合、「4ms」となり、従来の処理遅延時間「32ms」と比較して約1/8に削減することができる。
然も、この発明では周波数領域に変換するステップでは512サンプルを1フレームとして周波数領域変換手段に投入するから、周波数分解能を充分保ったまま雑音抑圧処理を施すことができる。
更に、この発明によれば周波数領域係数への変換の際に、現変換フレームにおいて新しく更新されたサンプル数Mのサンプルを用いて計算する必要のある変換処理過程のデータだけを新規に計算し、1フレーム処理前の変換処理過程で計算済みのデータのうち現変換処理過程で計算するデータと重複するデータについては1フレーム前のデータを用いる演算方法を採るから、演算総量を低減することができる。
図1にこの発明で提案する雑音抑圧方法を実現するための雑音抑圧装置の実施例を示す。図中100はこの発明で提案する雑音抑圧装置を示す。入力端101に入力された入力信号はA/D変換手段102でデジタル信号に変換される。ここではこのA/D変換手段102がサンプリング周波数16KHzで動作するものとして説明する。
A/D変換手段102でデジタル信号に変換された入力信号はこの発明による雑音抑圧装置100に入力される。この発明による雑音抑圧装置100は入力信号記憶手段103と、変換フレーム生成手段104と、周波数領域変換手段105と、雑音抑圧手段106と、時間領域変換手段107と、加算フレーム生成手段108と、出力信号生成手段109と、加算フレーム記憶手段110とによって構成される。
入力信号記憶手段103はメモリで構成され、従来の技術の項で説明したように最新の、例えば512個のサンプルデータを記憶する。
変換フレーム生成手段104は入力信号記憶手段103に予め定めたM個のサンプルデータを含むN個のサンプルデータを1フレームとする変換フレームを生成する。図2に入力信号記憶手段103と、変換フレーム生成手段104の動作を説明するフローチャートを示す。ステップSP1とSP2で入力信号記憶手段103の処理が実行される。ステップSP3で更新されたサンプル数を計数する。ステップSP4でその計数値counterがMに達したか否かを判定する。計数値がMに達するまでステップSP1〜SP4を繰り返す。計数値がMに達すると、ステップSP5に分岐し、メモリに記憶されているデータを変換フレームとして周波数変換手段105に出力する。出力後、計数値counterを0に戻し、ステップSP1に戻る。
図3に変換フレームの様子を示す。F1は前回に生成された変換フレーム、F2は現在生成された変換フレームを示す。前回生成された変換フレームF1と現在生成された変換フレームF2は共に、その生成時点で最新のM個のサンプルデータを先頭に具備している。図3に示す例ではM=32とした場合を示す。つまり、変換フレーム生成手段104は入力信号記憶手段103に32個のサンプルデータが書き込まれる毎に、その32個のサンプルデータに続く全てのサンプルデータ(この例では512個のサンプルデータ)を入力信号記憶手段103から取り込み変換フレームF1、F2、…を生成する。
尚、ここでは先頭から256個目までのサンプルデータはそのまま入力信号の値で変換フレーム生成手段104に取り込み、それ以下のサンプルデータには「0」を代入した場合を示す。つまり、入力信号を512サンプル全てを変換フレームに用いると信号の冗長性の悪影響が発生するため、ここでは半分以下の長さには「0」を代入する。
変換フレーム生成手段104で生成された変換フレームF1、F2、…は32サンプルの処理遅延時間(この例では2ms)の時間間隔で周波数領域変換手段105に引き渡され周波数領域係数に変換される。周波数領域変換手段105は例えば高速フーリエ変換を用いることができる。
図4にこの発明で提案する演算量を削減することができる周波数領域変換手段105の機能構成図を示す。この図では、例として処理フレーム長(FFT点数)をN、フレームシフト幅M=N/16の場合を示す。
時間領域のサンプリングデータを周波数領域の離散フーリエ係数にするために、LogNステップの変換処理過程を経る。本発明では、フレームのシフト幅がM(<N)であることに着目し、1フレーム前に乗算をしたデータを再利用することにより、乗算回数の削減を行う。変換フレームが生成されたとき、そのサンプル中で新規の分はM個だけで、残りのN−M個はシフトしただけで同じデータである。すなわち、1フレーム処理前に乗算して生成した値(データ)をメモリに記憶しておき、乗算せずにコピーして用いる。すると、第1変換処理過程(第1ステップ)ではN−M回、第2ステップではN−2M回、第3ステップではN−4M回という割合で乗算回数の削減が可能となる。
つまり、図4に示す通り、第1ステップでは、32回、第2ステップでは64回、第3ステップでは128回第4ステップでは256回、第5ステップ以降は512回の乗算を行なう。この乗算回数は先願の(特願2002−254075)方式に比べて第1〜第4ステップでの乗算回数を削減することができる。
次に、雑音抑圧手段106で雑音を抑圧する。この雑音抑圧手段としては例えば先に説明した特許文献1に開示された雑音抑圧処理方法を或はその他既存の雑音抑圧方法を適用することができる。本発明は雑音抑圧処理に要する処理遅延時間の削減を主題とし、その一例を図11を用いて説明したから、ここでは雑音抑圧処理方法に関する説明は省略することにする。
時間領域変換手段107は雑音抑圧処理した後の信号を時間領域に逆変換する。
次いで加算フレーム生成手段108は時間領域に変換した処理済信号の最新(先頭)の値から64サンプル過去までの値を切り取る。その切り取ったフレームに長さ64点の時間窓(例えばハニング窓)を掛ける。
図5を用いてその様子を説明する。図5に示すオーバーラップ加算処理ステップOUTPUTにおいて、DAT1−1とDAT1−2は加算フレーム生成手段108の処理により前フレームの先頭から64サンプルを切り取ったフレームに64点のハニング窓を掛けて生成した加算フレームを示す。またDAT2−1とDAT2−2はそれぞれ自己のフレームと次のフレームの処理が終了するまで加算フレーム記憶手段110に記憶される。
出力信号生成手段109では、今回加算フレーム生成手段108が生成した加算フレームの中の前半の加算フレームDAT2−1と前フレームで生成された後半の加算フレームDAT1−2とを加算し、出力信号として出力する。今回生成された加算フレームDAT2−2は次フレームで生成される加算フレームとの加算処理に使用される。
このオーバーラップ加算処理時に、ここでは32サンプル分の処理遅延が発生する。加算処理された出力信号d(K)(図1参照)はD/A変換手段111でアナログ信号に変換し、出力端子112から出力される。
以上の説明から明らかなように、この発明によれば入力信号記憶手段103に予め定めた32サンプルが取り込まれる間の時間(2ms)と、出力側で行われるオーバーラップ加算処理により発生する処理遅延(2ms)との和(4ms)が全ての処理遅延時間となる。この結果、512サンプルを単位として処理する場合と比較して処理遅延は1/8に削減することができる。上述では予め定めたNサンプルの値を32サンプルとした場合を説明したが、この発明では32サンプルに限られるものでなく1サンプルまで削減することができる。然も、周波数領域への変換は512サンプル毎に処理する場合と同じであるため、音声歪みの発生や雑音抑圧量の低下も殆ど見られない。尚、処理遅延時間の削減は、単位サンプル時間に対する演算処理量とのトレーとオフの関係にある。
図6は本発明による雑音抑圧方法を実行した場合の計算機シミュレーションの実験結果である。図中点線で示す曲線aは変換フレームF1、F2、…(図3参照)の512個のサンプルの全てに入力信号の値を用いて処理した場合(この処理条件を条件Iとする)の雑音区間の特性と音声及び雑音区間の特性を示す。
曲線bは変換フレームF1、F2、…の最新側の半分のサンプル(256個)だけに入力信号の値を用い、過去の半分のサンプル(256個)に「0」を代入して処理した場合(この条理条件を条件IIとする)を示す。
また、曲線cはマイクロホンの生の入力信号、曲線dは従来の雑音抑圧方法(1フレーム512サンプル)で処理した特性を示す。尚、曲線aとbは音声区間では共に重なり合っており、図では曲線bの線種のみを表示している。
図6から分かることは曲線a及びbは共にマイクロホン入力信号との時間的なずれはなく、現実には4msの遅れがあるものの、曲線dで示す従来の方法と比較すると明らかなようにマイクロホン入力信号によく追従していることが分かる。
また音声区間においては曲線a及びbはパワーがマイクロホン入力信号とほぼ一致し、聴取においても音声歪みは殆ど発生していない。しかし、雑音区間において曲線aは抑圧量が僅かに低下しており、聴取の結果、残留雑音に高周波が重畳していることが確認された。これに対し曲線bは、従来方式と抑圧量も同等であり、聴取においても残留雑音に対して不自然さの発生もなかった。以上の結果から、曲線bが得られる処理条件IIが音声品質と雑音抑圧性能を保持したまま、処理遅延を削減していることが確認できる。
上述したこの発明による雑音抑圧方法はコンピュータが読み取り可能な記号によって記述されたプログラムによってコンピュータ上で実行される。プログラムは磁気記録媒体或はCD−ROMのようなコンピュータが読み取り可能な記録媒体からコンピュータにインストールされるか、或は通信回線を通じてコンピュータにインストールされ、CPUの解読によってこの発明の雑音抑圧方法が実行される。
図7乃至図10に、この発明の実用例を示す。図7はこの発明を雑音抑圧機能付き音声通信システムに応用した場合を示す。A地点の話者の音声には周囲雑音が重畳しマイクロホン202に入力される。この入力信号を本発明による雑音抑圧装置200(ここでは図1に示したA/D変換手段102とD/A変換手段111を含む)に入力し雑音を抑圧して出力し、コーデック203に入力する。次いでネットワーク通信機能204を介しネットワーク205に接続し、B地点、C地点、D地点の話者に雑音を抑圧した音声を送信することが可能となる。
図8はこの発明を雑音抑圧機能付きハンズフリー通話装置に適用した場合を示す。ライン入力207に受信した相手側の音声はスピーカ201から拡声されエコーとなりマイクロホン202に収音される。エコーはエコーキャンセラ301で消去し、周囲雑音は雑音抑圧装置200で抑圧し、ライン出力208からはエコーや雑音のない音声を相手側に送信可能となる。
図9はこの発明を音声認識システムに適用した応用例を示す。この場合には話者が話した認識すべき音声にノイズが重畳し、マイクロホン202に入力される。この入力信号をこの発明による雑音抑圧装置200に入力し、雑音を抑圧して音声認識処理装置205に入力する。雑音を抑圧することにより認識音声の話頭切り出し、認識率の向上が可能となる。
図10はこの発明を補聴器に適用した応用例を示す。この場合には話者が話した音声に雑音が重畳し、マイクロホン202に入力される。この入力信号を本発明による雑音抑圧装置200に入力し、雑音を抑圧して出力し、補聴処理部209に入力し、イヤホン210を駆動する。雑音を抑圧することにより、SN比の改善された明瞭で大音量の音声が受聴可能となる。
この発明の一実施例を説明するためのブロック図。 図1に示した入力信号記憶手段と変換フレーム生成手段の動作を説明するためのフローチャート。 この発明の要部の動作を説明するための図。 この発明の更に他の要部の動作を説明するための図。 この発明の更に他の要部の動作を説明するための図。 この発明の効果を説明するためのグラフ。 この発明を雑音抑圧機能付き音声通信システムに適用した例を示すブロック図。 この発明をハンズフリー通話装置に応用した例を示すブロック図。 この発明を音声認識システムに応用した例を示すブロック図。 この発明を補聴器に適用した場合を示すブロック図。 従来の雑音抑圧装置を説明するためのブロック図。 従来の雑音抑圧装置の処理遅延量を説明するための流れ図。 図11に示した従来の雑音抑圧装置の雑音抑圧特性を説明するためのグラフ。 従来の周波数領域変換手段の演算量を説明するための図。
符号の説明
100 雑音抑圧装置 107 時間領域変換手段
101 入力端 108 加算フレーム生成手段
102 A/D変換手段 109 出力信号生成手段
103 入力信号記憶手段 110 加算フレーム記憶手段
104 変換フレーム生成手段 111 D/A変換手段
105 周波数領域変換手段 112 出力端
106 雑音抑圧手段 F1、F2 変換フレーム

Claims (5)

  1. 入力信号を最新のものから所定のサンプル数記憶する入力信号記憶ステップと、
    前記入力信号記憶ステップで記憶したサンプルの中の最新のサンプル数が予め定めたサンプル数Mに達する毎に、記憶した最新のものからL個(2M<L)のサンプルによる変換フレームを生成する変換フレーム生成ステップと、
    前記変換フレーム生成ステップで生成された変換フレームを周波数領域係数に変換する周波数領域変換ステップと、
    前記周波数領域係数の雑音抑圧処理を行う雑音抑圧ステップと、
    前記雑音抑圧処理された雑音抑圧済信号を時間領域に変換する時間領域変換ステップと、
    前記時間領域に変換された信号の最新のものから2M個のサンプルに時間窓を掛けたものを加算フレームとして生成する加算フレーム生成ステップと、
    前記加算フレームを記憶する加算フレーム記憶ステップと、
    前記加算フレーム生成ステップで生成された加算フレーム中の最新でない側のM個のサンプルと、前記加算フレーム記憶ステップで記憶した1フレーム前の加算フレーム中の最新側のM個のサンプルを対応するサンプル毎に加算してサンプル数M個の出力信号を生成する出力信号生成ステップと、
    からなる雑音抑圧方法。
  2. 請求項1記載の雑音抑圧方法において、M=L/16であることを特徴とする雑音抑圧方法。
  3. 入力信号を最新のものから所定のサンプル数記憶する入力信号記憶手段と、
    前記入力信号記憶手段に記憶したサンプルの中の最新のサンプル数が予め定めた所定値Mに達する毎に、前記入力信号記憶手段に記憶した最新のものからL個(2M<L)のサンプルによる変換フレームを生成する変換フレーム生成手段と、
    前記変換フレーム生成手段が生成した変換フレームを周波数領域係数に変換する周波数領域変換手段と、
    前記周波数領域係数の雑音抑制処理を行う雑音抑制手段と、
    前記雑音抑圧処理された雑音抑圧済信号を時間領域に変換する時間領域変換手段と、
    前記時間領域に変換された信号の最新のものから2M個のサンプルに時間窓を掛けたものを加算フレームとして生成する加算フレーム生成手段と、
    前記加算フレーム生成手段が生成した加算フレームを記憶する加算フレーム記憶手段と、
    前記加算フレーム生成手段が生成した加算フレーム中の最新でない側のM個のサンプルと前記加算フレーム記憶手段に記憶した1フレーム前の加算フレーム中の最新側のM個のサンプルを対応するサンプル毎に加算してサンプル数M個の出力信号を生成する出力信号生成手段と、
    を備えた構成としたことを特徴とする雑音抑圧装置。
  4. 請求項3記載の雑音抑圧装置において、M=L/16であることを特徴とする雑音抑圧装置。
  5. コンピュータが読み取り可能な符号によって記述され、コンピュータに請求項1又は2の何れかに記載の雑音抑圧方法を実行させる雑音抑圧プログラム。
JP2008309260A 2002-08-30 2008-12-04 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム Expired - Fee Related JP4697984B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008309260A JP4697984B2 (ja) 2002-08-30 2008-12-04 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002254075 2002-08-30
JP2002254075 2002-08-30
JP2008309260A JP4697984B2 (ja) 2002-08-30 2008-12-04 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003297748A Division JP4253232B2 (ja) 2002-08-30 2003-08-21 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム

Publications (2)

Publication Number Publication Date
JP2009110011A true JP2009110011A (ja) 2009-05-21
JP4697984B2 JP4697984B2 (ja) 2011-06-08

Family

ID=40778488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008309260A Expired - Fee Related JP4697984B2 (ja) 2002-08-30 2008-12-04 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム

Country Status (1)

Country Link
JP (1) JP4697984B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08211110A (ja) * 1995-02-07 1996-08-20 Tech Res & Dev Inst Of Japan Def Agency 2段階高速フーリエ変換方法
JPH09258792A (ja) * 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 雑音低減方法および装置
JPH10133689A (ja) * 1996-10-30 1998-05-22 Kyocera Corp 雑音除去装置
JPH1138999A (ja) * 1997-07-16 1999-02-12 Olympus Optical Co Ltd 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JP2000010567A (ja) * 1998-06-22 2000-01-14 Yamaha Corp 楽音波形分析方法、楽音波形分析装置および楽音波形分析合成方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08211110A (ja) * 1995-02-07 1996-08-20 Tech Res & Dev Inst Of Japan Def Agency 2段階高速フーリエ変換方法
JPH09258792A (ja) * 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 雑音低減方法および装置
JPH10133689A (ja) * 1996-10-30 1998-05-22 Kyocera Corp 雑音除去装置
JPH1138999A (ja) * 1997-07-16 1999-02-12 Olympus Optical Co Ltd 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JP2000010567A (ja) * 1998-06-22 2000-01-14 Yamaha Corp 楽音波形分析方法、楽音波形分析装置および楽音波形分析合成方法

Also Published As

Publication number Publication date
JP4697984B2 (ja) 2011-06-08

Similar Documents

Publication Publication Date Title
JP4567655B2 (ja) 音声信号中の暗騒音を抑制する方法及び装置、並びに反響消去を伴う対応する装置
RU2616557C1 (ru) Устройство и способ обработки речевого/аудио сигнала
US7620172B2 (en) Method and system for eliminating noises and echo in voice signals
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
KR20120094892A (ko) 손상된 오디오 신호의 복구
CN108076239B (zh) 一种改善ip电话回声的方法
KR20080061747A (ko) 오디오 배속 재생 방법 및 장치
JP5130895B2 (ja) 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法
JP3507020B2 (ja) 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
US20230199386A1 (en) Apparatus, methods and computer programs for reducing echo
WO2018167960A1 (ja) 音声処理装置、音声処理システム、音声処理方法、および音声処理プログラム
JPWO2013098885A1 (ja) 音声信号復元装置および音声信号復元方法
JP4448464B2 (ja) 雑音低減方法、装置、プログラム及び記録媒体
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
CN115175063A (zh) 啸叫抑制方法、装置、音响及扩音系统
JP2008309955A (ja) ノイズサプレス装置
JP5232121B2 (ja) 信号処理装置
JP2005010621A (ja) 音声帯域拡張装置及び帯域拡張方法
US5687243A (en) Noise suppression apparatus and method
JP2003284183A (ja) 反響抑圧装置、反響抑圧方法及びプログラム
JP4253232B2 (ja) 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム
Kawamura et al. A new noise reduction method using linear prediction error filter and adaptive digital filter
KR20160034942A (ko) 공간 효과를 갖는 사운드 공간화
JP4697984B2 (ja) 雑音抑圧方法、雑音抑圧装置、雑音抑圧プログラム
JP3724705B2 (ja) 反響抑圧方法・反響抑圧装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090709

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110228

R150 Certificate of patent or registration of utility model

Ref document number: 4697984

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees