JP4172530B2 - 雑音抑圧の方法及び装置並びにコンピュータプログラム - Google Patents

雑音抑圧の方法及び装置並びにコンピュータプログラム Download PDF

Info

Publication number
JP4172530B2
JP4172530B2 JP2007505297A JP2007505297A JP4172530B2 JP 4172530 B2 JP4172530 B2 JP 4172530B2 JP 2007505297 A JP2007505297 A JP 2007505297A JP 2007505297 A JP2007505297 A JP 2007505297A JP 4172530 B2 JP4172530 B2 JP 4172530B2
Authority
JP
Japan
Prior art keywords
frequency domain
signal
noise
suppression
domain signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007505297A
Other languages
English (en)
Other versions
JPWO2007026691A1 (ja
Inventor
昭彦 杉山
正徳 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Application granted granted Critical
Publication of JP4172530B2 publication Critical patent/JP4172530B2/ja
Publication of JPWO2007026691A1 publication Critical patent/JPWO2007026691A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Description

本発明は、所望の音声信号に重畳されている雑音を抑圧するための雑音抑圧の方法及び装置、並びに雑音抑圧の信号処理に用いるコンピュータプログラムに関する。
ノイズサプレッサ(雑音抑圧システム)は、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムであり、一般的に、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、この推定パワースペクトルを入力信号から差し引くことにより、所望の音声信号に混在する雑音を抑圧するように動作する。雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用することができる。従来のノイズサプレッサは、例えば、特許文献1(特開2002−204175号公報)に記載されている。
通常、音波を収集するマイクロフォンの出力信号をアナログ−ディジタル(AD)変換したディジタル信号が、入力信号としてノイズサプレッサに供給される。主として、マクロフォンにおける集音やAD変換の際に付加される低周波成分を抑圧する目的で、一般的にAD変換とノイズサプレッサの間には高域通過フィルタを配置する。このような構成の例は、例えば特許文献2(米国特許5,659,622号)に開示されている。
図1に、特許文献1のノイズサプレッサに特許文献2の高域通過フィルタを適用した構成を示す。
入力端子11には、劣化音声信号(所望音声信号と雑音の混在する信号)が、サンプル値系列として供給される。劣化音声信号サンプルは、高域通過フィルタ17に供給され、低域成分が抑圧された後、フレーム分割部1に供給される。低域成分の抑圧は、入力される劣化音声の線形性を保ち、十分な信号処理性能を発揮するために、実用上不可欠な処理である。フレーム分割部1は、劣化音声信号サンプルを特定の数を単位としたフレームに分割し、窓掛け処理部2へ伝達する。窓掛け処理部2は、フレームに分割された劣化音声サンプルと窓関数を乗算し、その結果をフーリエ変換部3へ伝達する。
フーリエ変換部3は、窓掛けされた劣化音声サンプルにフーリエ変換を施して複数の周波数成分に分割し、振幅値を多重化して、推定雑音計算部52、雑音抑圧係数生成部82、及び多重乗算部16へ供給する。位相は逆フーリエ変換部9に伝達される。推定雑音計算部52は、供給された複数の周波数成分それぞれに対して雑音を推定し、雑音抑圧係数生成部82へ伝達する。雑音推定の一例として、過去の信号対雑音比で劣化音声を重み付けて雑音成分とする方式があり、その詳細は特許文献1に記載されている。
雑音抑圧係数生成部82では、劣化音声に乗算することによって雑音が抑圧された強調音声を求めるため、雑音抑圧係数を、複数の周波数成分それぞれに対して生成する。雑音抑圧係数生成の一例としては、強調音声の平均二乗パワーを最小化する最小平均二乗短時間スペクトル振幅法が広く用いられており、その詳細は特許文献1に記載されている。
周波数別に生成した雑音抑圧係数は多重乗算部16に供給される。多重乗算部16は、フーリエ変換部3から供給された劣化音声と雑音抑圧係数生成部82から供給された雑音抑圧係数を、各周波数毎に乗算し、その積を強調音声の振幅として逆フーリエ変換部9に伝達する。逆フーリエ変換部9は、多重乗算部16から供給された強調音声振幅とフーリエ変換部3から供給された劣化音声の位相を合わせて逆フーリエ変換を行い、強調音声信号サンプルとして、フレーム合成部10に供給する。このフレーム合成部10では、隣接フレームの強調音声サンプルを用いて当該フレームの出力音声サンプルを合成し、出力端子12に供給する。
高域通過フィルタ17は、直流近傍の周波数成分を抑圧するものであり、通常、100Hzから120Hzの周波数以上の成分は抑圧せずにそのまま通過させる。高域通過フィルタ17の構成は、有限インパルス応答(FIR)型または無限インパルス応答(IIR)型のフィルタとすることができるが、鋭い通過帯域端特性が必要であるために、通常は後者を用いる。IIR型フィルタはその伝達関数が有利関数で表され、分母係数の感度が極めて高いことが知られている。従って、高域通過フィルタ17を有限語長演算で実現する際には、十分な精度を達成するために、倍精度演算を多用しなければならず、演算量が多くなるという問題があった。一方、演算量低減のために高域通過フィルタ17を除去すると、入力信号の線形性を保つことが困難となり、高品質な雑音抑圧が不可能になる。
また、推定雑音計算部52では、フーリエ変換部3から供給された全ての周波数成分に対して雑音を推定し、それらに対応した雑音抑圧係数を雑音抑圧係数生成部82で求めていた。このため、周波数分解能を向上させるためにフーリエ変換のブロック長(フレーム長)を長くすると、各ブロックを構成するサンプル数が多くなり、演算量が増大するという問題があった。
本発明の目的は、少ない演算量で高品質な雑音抑圧を達成することのできる雑音抑圧の方法及び装置を提供することである。
本発明に係る雑音抑圧方法は、入力信号を周波数領域信号に変換し、該周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて推定雑音を求め、該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけしている。
一方、本発明に係る雑音抑圧装置は、入力信号を周波数領域信号に変換する変換部と、該周波数領域信号の帯域を統合して統合周波数領域信号を求める帯域統合部と、該統合周波数領域信号を用いて推定雑音を求める雑音推定部と、該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、該抑圧係数で前記振幅補正信号を重みづけする乗算部と、を有している。
更に、本発明に係る雑音抑圧の信号処理を行うコンピュータプログラムは、入力信号を周波数領域信号に変換する処理と、該周波数領域信号の帯域を統合して統合周波数領域信号を求める処理と、該統合周波数領域信号を用いて推定雑音を求める処理と、該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、該抑圧係数で前記周波数領域信号を重みづけする処理とを、コンピュータに実行させる。
特に、本発明の雑音抑圧の方法及び装置並びにコンピュータプログラムでは、低域成分の抑圧をフーリエ変換後の信号に対して実行することを特徴とする。より具体的には、フーリエ変換出力の振幅に対して低域成分を抑圧するための振幅補正部と、フーリエ変換出力の位相に対して低域成分の振幅変形に対応した位相補正を行う位相補正部とを備えていることを特徴とする。
また、雑音推定と雑音抑圧係数の生成は、複数の周波数成分に対して共通に行うことを特徴とする。より具体的には、複数の周波数成分の一部を統合するための帯域統合部を備えていることを特徴とする。
本発明によれば、周波数領域に変換された信号の振幅に定数を乗算し、位相に定数を加算するので、単精度演算による実現が可能となり、少ない演算量で高品質の雑音抑圧を達成することができる。更に、本発明によれば、雑音推定と雑音抑圧係数生成を、フーリエ変換の各ブロックを構成するサンプル数よりも少ない数の周波数成分に対して行うので、演算量を削減することができる。
従来の雑音抑圧装置の構成例を示すブロック図である。 本発明の第1の実施の形態を示すブロック図である。 本発明の第1の実施の形態に含まれる振幅補正部の構成を示すブロック図である。 本発明の第1の実施の形態に含まれる位相補正部の構成を示すブロック図である。 周波数サンプルの統合を説明する図である。 本発明の第1の実施の形態に含まれる多重乗算部の構成を示すブロック図である。 本発明の第2の実施の形態を示すブロック図である。 本発明の第3の実施の形態を示すブロック図である。 本発明の第3の実施の形態に含まれる多重乗算部の構成を示すブロック図である。 本発明の第3の実施の形態に含まれる重みつき劣化音声計算部の構成を示すブロック図である。 図10に含まれる周波数別SNR計算部の構成を示すブロック図である。 図10に含まれる多重非線形処理部の構成を示すブロック図である。 非線形処理部における非線形関数の一例を示す図である。 本発明の第3の実施の形態に含まれる推定雑音計算部の構成を示すブロック図である。 図11に含まれる周波数別推定雑音計算部の構成を示すブロック図である。 図12に含まれる更新判定部の構成を示すブロック図である。 本発明の第3の実施の形態に含まれる推定先天的SNR計算部の構成を示すブロック図である。 図14に含まれる多重値域限定処理部の構成を示すブロック図である。 図14に含まれる多重重みつき加算部の構成を示すブロック図である。 図16に含まれる重みつき加算部の構成を示すブロック図である。 本発明の第3の実施の形態に含まれる雑音抑圧係数生成部の構成を示すブロック図である。 本発明の第3の実施の形態に含まれる抑圧係数補正部の構成を示すブロック図である。 図22に含まれる周波数別抑圧係数補正部の構成を示すブロック図である。
符号の説明
1 フレーム分割部
2,20 窓がけ処理部
3 フーリエ変換部
4,5049 カウンタ
5,52 推定雑音計算部
6,1402 周波数別SNR計算部
7 推定先天的SNR計算部
8,82 雑音抑圧係数生成部
9 逆フーリエ変換部
10 フレーム合成部
11 入力端子
12 出力端子
13,16,161,704,705,1404 多重乗算部
14 重みつき劣化音声計算部
15 抑圧係数補正部
17 高域通過フィルタ
18 振幅補正部
19 位相補正部
21 音声非存在確率記憶部
22 オフセット除去部
53 帯域統合部
54 推定雑音補正部
501,502,1302,1303,1422,1423,1495,1502,1503,1602,1603,1801,1901,7013,7072,7074 分離部
503,1304,1424,1475,1504,1604,1803,1903,7014,7075 多重化部
5040〜504M-1 周波数別推定雑音計算部
520 更新判定部
701 多重値域限定処理部
702 後天的SNR記憶部
703 抑圧係数記憶部
706 重み記憶部
707 多重重みつき加算部
708,5046,7092,7094 加算器
811 MMSE STSA ゲイン関数値計算部
812 一般化尤度比計算部
814 抑圧係数計算部
921 瞬時推定SNR
9210〜921M-1 周波数帯域別瞬時推定SNR
922 過去の推定SNR
9220〜922M-1 過去の周波数帯域別推定SNR
923 重み
924 推定先天的SNR
9240〜924M-1 周波数帯域別推定先天的SNR
13010〜1301K-1,1597,7091,7093 乗算器
1401,5042 推定雑音記憶部
1405 多重非線形処理部
14210〜1421M-1 5048 除算部
14850〜1485M-1 非線形処理部
15010〜1501M-1 周波数別抑圧係数補正部
1591,70120〜7012M-1 最大値選択部
1592 抑圧係数下限値記憶部
1593,5204,5206 閾値記憶部
1594,5203,5205 比較部
1595,5044 スイッチ
1596 修正値記憶部
18020〜1802K-1 重み付け処理部
19020〜1902K-1 位相回転部
5041 レジスタ長記憶部
5045 シフトレジスタ
5047 最小値選択部
5201 論理和計算部
5207 閾値計算部
7011 定数記憶部
70710〜7071M-1 重みつき加算部
7095 定数乗算器
図2は、本発明の第1の実施の形態を示すブロック図である。
図2に示す構成と従来例である図1に示した構成とは、高域通過フィルタ17、振幅補正部18、位相補正部19、窓がけ処理部20、帯域統合部53、推定雑音補正部54、多重乗算部161を除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。
図2では、図1の高域通過フィルタ17と多重乗算部16とを削除し、代わりに振幅補正部18、位相補正部19、窓がけ処理部20、帯域統合部53、推定雑音補正部54、多重乗算部161を加えている。
振幅補正部18と位相補正部19は、高域通過フィルタの周波数応答を周波数領域に変換された信号に対して適用するために設けられている。即ち、図2では、図1の高域通過フィルタ17の伝達関数にz=exp(j・2πf)を適用して得られるfの関数の絶対値(振幅周波数応答)を振幅補正部18で入力信号に適用し、位相(位相周波数応答)を位相補正部19で入力信号に適用する。これらの操作により、図1の高域通過フィルタ17を入力信号に適用したときと同等の効果を得ることができる。すなわち、高域通過フィルタ17の伝達関数を時間領域で入力信号と畳み込む代わりに、フーリエ変換部3で周波数領域信号に変換した後に周波数応答を乗算することになる。
振幅補正部18の出力は帯域統合部53と多重乗算部161に供給される。帯域統合部53は、複数の周波数成分に対応した信号サンプルを統合して総数を削減し、推定雑音計算部52と雑音抑圧係数生成部82へ伝達する。統合に際しては、複数の信号サンプルを加算し、加算したサンプル数で除することによって平均値を求める。推定雑音補正部54は、推定雑音計算部52から供給された推定雑音を補正して雑音抑圧係数生成部82へ伝達する。
推定雑音補正部54における補正の最も基本的な動作は、全周波数成分に同じ定数を乗じることである。定数を周波数毎に異なったものとすることも可能である。この特殊な場合が、特定の周波数に対する定数を1.0に設定することであり、定数1.0が適用された周波数におけるデータには補正が行われず、それ以外の周波数のデータに対して補正が行われる。すなわち、周波数に対して選択的な補正が可能となる。このほかにも、周波数毎に異なった値を加算したり、非線形処理したりするなどの補正が可能である。
このような補正を行うことによって、帯域統合によって生じた推定雑音値の真値からのずれを低減し、出力である強調音声の音質を高く保つことが可能となる。後述の帯域統合法に対しては、8kHzサンプリングにおいて、1000Hz相当以上の帯域の推定雑音に定数0.7を乗じることが適切であることが、非公式な主観評価によって明らかになっている。
位相補正部19の出力は、逆フーリエ変換部9に伝達される。これ以降の動作は、図1を用いて説明した通りである。窓がけ処理部20は、特許文献3(特開2003-131689号公報)に開示されているように、フレーム境界における断続音を抑圧するために装備されている。
図3に、図2の振幅補正部18の構成例を示す。ここでは、独立なフーリエ変換出力成分の個数をKとする。フーリエ変換部3から供給された多重化劣化音声振幅スペクトルは、分離部1801に伝達される。分離部1801は、多重化された劣化音声振幅スペクトルを各周波数成分に分解して、重み付け処理部18020〜1802K-1に伝達する。重み付け処理部18020〜1802K-1はそれぞれ、各周波数成分に分解された劣化音声振幅スペクトルを、対応する振幅周波数応答で重み付けして、多重化部1803に伝達する。多重化部1803は、重み付け処理部18020〜1802K-1から伝達された信号を多重化し、補正劣化音声振幅スペクトルとして出力する。
図4に、図2の位相補正部19の構成例を示す。フーリエ変換部3から供給された多重化劣化音声位相スペクトルは、分離部1901に伝達される。分離部1901は、多重化された劣化音声位相スペクトルを各周波数成分に分解して、位相回転部19020〜1902K-1に伝達する。位相回転部19020〜1902K-1はそれぞれ、各周波数成分に分解された劣化音声位相スペクトルを対応する位相周波数応答に応じて回転させ、多重化部1903に伝達する。多重化部1903は、位相回転部19020〜1902K-1から伝達された信号を多重化して補正劣化音声位相スペクトルとして出力する。
図5は、図2の帯域統合部53において複数の周波数サンプルが統合される様子を説明するための図である。ここでは、8kHzサンプリング、すなわち帯域が4kHzである信号を、ブロック長Lでフーリエ変換する場合を示している。特許文献1では、フーリエ変換された劣化音声信号サンプルは、フーリエ変換のブロック長Lと等しい数だけ生じるが、このうち互いに独立なものはその半分のL/2である。
本発明では、これらL/2サンプルを部分的に統合し、独立な周波数成分の数を削減する。その際に、高周波領域でより多くのサンプルを1つのサンプルに統合する。すなわち、高域成分ほどたくさんの周波数成分を1つに統合することになり、不等分割されることになる。このような不等分割の例としては、低域側に向かって2のべき乗で帯域が狭くなるオクターブ分割、人間の聴覚特性に基づいて帯域分割された臨界帯域などが知られている。臨界帯域の詳細に関しては、非特許文献1(1999年1月、サイコアクースティクス、第2版、スプリンガー(PSYCHOACOUSTICS, 2ND ED., SPRINGER, JAN. 1999) 158〜164ページ)を参照することができる。
特に、臨界帯域に従った帯域分割は、人間の聴覚特性と整合性が高いために、広く用いられている。4kHz帯域では、臨界帯域は全部で18の帯域から構成される。一方、図5に示すように、本発明では、特に低域で臨界帯域よりも細分化することによって、雑音抑圧特性の劣化を防いでいる。1156Hzより高い周波数から4kHzまでは、臨界帯域と同じ帯域分割を採用するが、それよりも低域ではさらに帯域を細分化することに特徴がある。
図5には、L=256の例を示している。直流から13番目の周波数成分までは、統合せずにそのまま独立に取り扱う。これらに続く14成分は2成分ずつの7グループに統合する。さらに続く6成分は3成分ずつの2グループに統合する。この後、4成分で1グループに統合し、それ以上は臨界帯域に一致するように成分を統合する。
このように周波数成分を統合することによって、独立な周波数成分の数を、128から32に低減することができる。フーリエ変換後の128周波数成分と統合後の32周波数成分の対応を表1に示す。周波数成分一つあたり4000/128=31.25Hzとなるので、これを用いて計算した対応周波数が一番右の欄に示されている。
Figure 0004172530
帯域統合部53の動作においては、400Hz程度以下の周波数で周波数成分の統合を行わないことが重要である。この周波数領域で周波数成分の統合を行うと、分解能が低下し、音質の低下をもたらす。一方、1156Hz程度以上の周波数では、臨界帯域に従って周波数成分を統合してもよい。また、入力信号の帯域が広くなったときには、フーリエ変換のブロック長Lを長くして、音質を保つ必要がある。これは、上記400Hz以下の周波数成分の統合を行わない帯域で、一つの周波数成分あたりの帯域が増加し、分解能が劣化するためである。例えば、L=256、帯域4kHzを基準にすると、フーリエ変換のブロック長Lを、L>fs/31.25で求めることによって、広帯域信号でも4kHz帯域のときと同程度の音質を維持することができる。この法則に従って、Lを2のべき乗に選ぶと、8kHz<fs≦16kHzでL=512、16kHz<fs≦32kHzでL=1024、32kHz<fs≦64kHzでL=2048となる。表1に対応したfs=16kHzの例を表2に示す。表2は一例であり、帯域統合の境界が少しだけ異なるものは同等の効果を有する。
Figure 0004172530
図6に、多重乗算部161の構成例を示す。多重乗算部161は、乗算器16010〜1601K-1、分離部1602、1603、多重化部1604を有する。多重化された状態で図2の振幅補正部18から供給された補正劣化音声振幅スペクトルは、分離部1602において周波数別のKサンプルに分離され、それぞれ乗算器16010〜1601K-1に供給される。多重化された状態で図2の雑音抑圧係数生成部82から供給された雑音抑圧係数は、分離部1603において周波数別に分離され、乗算器16010〜1601K-1に供給される。
周波数別に分離された雑音抑圧係数の数は、帯域統合部53において統合された帯域の数に等しい。すなわち、帯域統合部53で統合されたサブバンドのそれぞれに対応した雑音抑圧係数が、分離部1603において分離されることになる。
図5の例では、分離された雑音抑圧係数の数は、32となる。分離された雑音抑圧係数は、帯域統合部53における帯域統合パターンに対応した乗算器に供給される。図5の例では、表1に従って、複数の乗算器に同一の雑音抑圧係数が供給される。
表1の例では、K=128なので、乗算器160127〜160129、乗算器160130〜160132、乗算器160133〜160136、乗算器160137〜160142、乗算器160143〜160148、乗算器160149〜160156、乗算器160157〜160165、乗算器160166〜160175、乗算器160176〜160187、乗算器160188〜1601101、乗算器1601102〜1601119、乗算器1601120〜1601128には、それぞれ共通の雑音抑圧係数が伝達される。乗算器16010〜160126には、それぞれ独立の雑音抑圧係数が伝達される。乗算器16010〜1601K-1は、それぞれ入力された補正劣化音声スペクトルと雑音抑圧係数を乗算し、多重化部1604に伝達する。多重化部1604は、入力された信号を多重化し、強調音声振幅スペクトルとして出力する。
図7は、本発明の第2の実施の形態を示すブロック図である。第1の実施の形態を示す図2の構成との違いは、オフセット除去部22である。オフセット除去部22は、窓がけ処理された劣化音声に対してオフセットを除去して出力する。オフセット除去の最も簡単な方式は、フレーム毎に劣化音声の平均値を求めてオフセットとし、これを当該フレーム内の全サンプルから差し引くことである。また、フレーム毎の平均値を複数フレームに渡って平均化し、その平均値をオフセットとして差し引いてもよい。オフセット除去によって、次に続くフーリエ変換部における変換精度が向上し、出力における強調音声の音質を改善することができる。
図8は、本発明の第3の実施の形態を示すブロック図である。入力端子11には、劣化音声信号が、サンプル値系列として供給される。劣化音声信号サンプルは、フレーム分割部1に供給され、K/2サンプル毎のフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化音声信号サンプルは、窓がけ処理部2に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1)に対するw(t)で窓がけされた信号yn(t)バーは、次式で与えられる。
Figure 0004172530
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1に対して、
Figure 0004172530
で得られるyn(t)バー (t=0, 1, ..., K-1)が、窓がけ処理部2の出力となる。実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、抑圧係数を1に設定したときの入力信号と出力信号が、計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば次式に示すハニング窓を用いることができる。
Figure 0004172530
このほかにも、ハミング窓、ケイザー窓、ブラックマン窓など、様々な窓関数が知られている。窓がけされた出力yn(t)バーは、オフセット除去部22に供給されて、オフセットを除去される。オフセット除去の詳細に関しては、図7を用いて説明した通りである。オフセット除去後の信号はフーリエ変換部3に供給され、劣化音声スペクトルYn(k)に変換される。劣化音声スペクトルYn(k)は位相と振幅に分離され、劣化音声位相スペクトルarg Yn(k)は、位相補正部19を経て、逆フーリエ変換部9に、劣化音声振幅スペクトル|Yn(k)|は、振幅補正部18を経て、多重乗算部13と多重乗算部16に供給される。位相補正部19と振幅補正部18の動作については、図2を用いて説明した通りである。
多重乗算部13は、振幅補正された劣化音声振幅スペクトルを用いて劣化音声パワースペクトルを計算し、帯域統合部53に伝達する。帯域統合部53は、劣化音声パワースペクトルを部分的に統合して独立な周波数成分の数を削減した後、推定雑音計算部5、周波数別SNR(信号対雑音比)計算部6及び重みつき劣化音声計算部14に伝達する。帯域統合部53の動作については、図2を用いて説明した通りである。重みつき劣化音声計算部14は、多重乗算部13から供給された劣化音声パワースペクトルを用いて重みつき劣化音声パワースペクトルを計算し、推定雑音計算部5に伝達する。推定雑音計算部5は、劣化音声パワースペクトル、重みつき劣化音声パワースペクトル、及びカウンタ4から供給されるカウント値を用いて雑音のパワースペクトルを推定し、推定雑音パワースペクトルとして周波数別SNR計算部6に伝達する。
周波数別SNR計算部6は、入力された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて周波数帯域別にSNRを計算し、後天的SNRとして推定先天的SNR計算部7と雑音抑圧係数生成部8に供給する。
推定先天的SNR計算部7は、入力された後天的SNR、及び抑圧係数補正部15から供給された補正抑圧係数を用いて先天的SNRを推定し、推定先天的SNRとして、雑音抑圧係数生成部8に伝達する。雑音抑圧係数生成部8は、入力として供給された後天的SNR、推定先天的SNR及び音声非存在確率記憶部21から供給される音声非存在確率を用いて雑音抑圧係数を生成し、抑圧係数として抑圧係数補正部15に伝達する。
抑圧係数補正部15は、入力された推定先天的SNRと抑圧係数を用いて抑圧係数を補正し、補正抑圧係数Gn(k)バーとして多重乗算部161に供給する。多重乗算部161は、フーリエ変換部3から振幅補正部18を経て供給された補正劣化音声振幅スペクトルを、抑圧係数補正部15から供給された補正抑圧係数Gn(k)バーで重み付けすることによって強調音声振幅スペクトル|Xn(k)|バーを求め、逆フーリエ変換部9に伝達する。|Xn(k)|バーは、次式で与えられる。
Figure 0004172530
ここで、Hn(k)は、振幅補正部18における補正利得であり、高域通過フィルタ17の振幅周波数応答を近似する特性を有する。
逆フーリエ変換部9は、多重乗算部161から供給された強調音声振幅スペクトル|Xn(k)|バーとフーリエ変換部3から位相補正部19を経て供給された補正劣化音声位相スペクトル arg Yn(k) + arg Hn(k)を乗算して、強調音声Xn(k)バーを求める。すなわち、
Figure 0004172530
を実行する。ここで、arg Hn(k)は、位相補正部19における補正位相であり、高域通過フィルタ17の位相周波数応答を近似する特性を有する。
得られた強調音声Xn(k)バーに逆フーリエ変換を施し、1フレームがKサンプルから構成される時間領域サンプル値系列xn(t)バー (t=0, 1, ..., K-1)として、窓がけ処理部20に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけされた信号xn(t)バーは、次式で与えられる。
Figure 0004172530
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1に対して、
Figure 0004172530
で得られるyn(t)バー (t=0, 1, ..., K-1)が、窓がけ処理部20の出力となり、フレーム合成部10に伝達される。フレーム合成部10は、xn(t)バーの隣接する2フレームからK/2サンプルずつを取り出して重ね合わせ、
Figure 0004172530
によって、強調音声xn(t)ハットを得る。得られた強調音声xn(t)ハット (t=0, 1, ..., K-1)が、フレーム合成部10の出力として、出力端子12に伝達される。
図9は、図8に示した多重乗算部13の構成を示すブロック図である。多重乗算部13は、乗算器13010〜1301K-1、分離部1302、1303、多重化部1304を有する。多重化された状態で図8の振幅補正部18から供給された補正劣化音声振幅スペクトルは、分離部1302及び1303において周波数別のKサンプルに分離され、それぞれ乗算器13010〜1301K-1に供給される。乗算器13010〜1301K-1は、それぞれ入力された信号を2乗し、多重化部1304に伝達する。多重化部1304は、入力された信号を多重化し、劣化音声パワースペクトルとして出力する。
図10は重みつき劣化音声計算部14の構成を示すブロック図である。重みつき劣化音声計算部14は、推定雑音記憶部1401、周波数別SNR計算部1402、多重非線形処理部1405、及び多重乗算部1404を有する。推定雑音記憶部1401は、図8の推定雑音計算部5から供給される推定雑音パワースペクトルを記憶し、1フレーム前に記憶された推定雑音パワースペクトルを周波数別SNR計算部1402へ出力する。周波数別SNR計算部1402は、推定雑音記憶部1401から供給される推定雑音パワースペクトルと図8の帯域統合部53から供給される劣化音声パワースペクトルを用いてSNRを各周波数帯域毎に求め、多重非線形処理部1405に出力する。
多重非線形処理部1405は、周波数別SNR計算部1402から供給されるSNRを用いて重み係数ベクトルを計算し、重み係数ベクトルを多重乗算部1404に出力する。多重乗算部1404は、図8の帯域統合部53から供給される劣化音声パワースペクトルと、多重非線形処理部1405から供給される重み係数ベクトルの積を周波数帯域毎に計算し、重みつき劣化音声パワースペクトルを図8の推定雑音記憶部5に出力する。多重乗算部1404の構成は、図9を用いて説明した多重乗算部13に等しいので、詳細な説明は省略する。
図11は、図10に示した周波数別SNR計算部1402の構成を示すブロック図である。周波数別SNR計算部1402は、除算部 14210〜1421M-1、分離部1422、1423、多重化部1424を有する。図8の帯域統合部53から供給される劣化音声パワースペクトルは、分離部1422に伝達される。図10の推定雑音記憶部1401から供給される推定雑音パワースペクトルは、分離部1423に伝達される。劣化音声パワースペクトルは分離部1422において、推定雑音パワースペクトルは分離部1423において、それぞれ周波数成分に対応したMサンプルに分離され、それぞれ除算部14210〜1421M-1に供給される。これらのMサンプルは、帯域統合部53において統合された周波数成分から構成されるサブバンドに対応している。除算部14210〜1421M-1では、次式に従って、供給された劣化音声パワースペクトルを推定雑音パワースペクトルで除算して周波数別SNR γn(k)ハットを求め、多重化部1424に伝達する。
Figure 0004172530
ここで、λn-1(k)は1フレーム前に記憶された推定雑音パワースペクトルである。多重化部1424は、伝達されたM個の周波数別SNRを多重化して、図10の多重非線形処理部1405へ伝達する。
次に、図12を参照しながら、図10の多重非線形処理部1405の構成と動作について詳しく説明する。図12は、重みつき劣化音声計算部14に含まれる多重非線形処理部1405の構成を示すブロック図である。多重非線形処理部1405は、分離部1495、非線形処理部14850〜1485M-1及び多重化部1475を有する。分離部1495は、図10の周波数別SNR計算部1402から供給されるSNRを周波数帯域別のSNRに分離し、非線形処理部14850〜1485M-1に伝達する。非線形処理部14850〜1485M-1は、それぞれ入力値に応じた実数値を出力する非線形関数を有する。
図13に非線形関数の例を示す。f1を入力値としたとき、図13に示される非線形関数の出力値f2は、
Figure 0004172530
で与えられる。但し、aとbは任意の実数である。
図12の非線形処理部14850〜1485M-1は、分離部1495から供給される周波数帯域別SNRを、非線形関数によって処理して重み係数を求め、多重化部1475に出力する。すなわち、非線形処理部14850〜1485M-1はSNRに応じた1から0までの重み係数を出力する。SNRが小さい時は1を、大きい時は0を出力する。多重化部1475は、非線形処理部14850〜1485M-1から出力された重み係数を多重化し、重み係数ベクトルとして多重乗算部1404に出力する。
図10の多重乗算部1404で劣化音声パワースペクトルと乗算される重み係数は、SNRに応じた値になっており、SNRが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられるが、推定雑音の更新に用いる劣化音声パワースペクトルに対して、SNRに応じた重みづけを行うことで、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができ、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に非線形関数を用いた例を示したが、非線形関数以外にも線形関数や高次多項式など、他の形で表されるSNRの関数を用いる事も可能である。
図14は、図8に示した推定雑音計算部5の構成を示すブロック図である。雑音推定計算部5は、分離部501、502、多重化部503、及び周波数別推定雑音計算部5040〜504M-1を有する。分離部501は、図8の重みつき劣化音声計算部14から供給される重みつき劣化音声パワースペクトルを周波数帯域別の重みつき劣化音声パワースペクトルに分離し、周波数別推定雑音計算部5040〜504M-1にそれぞれ供給する。分離部502 は、図8の帯域統合部53から供給される劣化音声パワースペクトルを周波数帯域別の劣化音声パワースペクトルに分離し、周波数別推定雑音計算部5040〜504M-1にそれぞれ出力する。
周波数別推定雑音計算部5040〜504M-1は、分離部501から供給される周波数帯域別重みつき劣化音声パワースペクトル、分離部502から供給される周波数帯域別劣化音声パワースペクトル、及び図8のカウンタ4から供給されるカウント値から周波数別推定雑音パワースペクトルを計算し、多重化部503へ出力する。多重化部503は、周波数別推定雑音計算部5040〜504M-1から供給される周波数別推定雑音パワースペクトルを多重化し、推定雑音パワースペクトルを図8の周波数別SNR計算部6と重みつき劣化音声計算部14へ出力する。周波数別推定雑音計算部5040〜504M-1の構成と動作の詳細な説明は、図15を参照しながら行う。
図15は、図14に示した周波数別推定雑音計算部5040〜504M-1の構成を示すブロック図である。周波数別推定雑音計算部504は、更新判定部520、レジスタ長記憶部5041、推定雑音記憶部5042、スイッチ5044、シフトレジスタ5045、加算器5046、最小値選択部5047、除算部5048、カウンタ5049を有する。スイッチ5044には、図14の分離部501から、周波数別重みつき劣化音声パワースペクトルが供給されている。スイッチ5044が回路を閉じたときに、周波数別重みつき劣化音声パワースペクトルは、シフトレジスタ5045に伝達される。シフトレジスタ5045は、更新判定部520から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部5041に記憶されている値に等しい。シフトレジスタ5045の全レジスタ出力は、加算器5046に供給される。加算器5046は、供給された全レジスタ出力を加算して、加算結果を除算部5048に伝達する。
一方、更新判定部520には、カウント値、周波数別劣化音声パワースペクトル及び周波数別推定雑音パワースペクトルが供給されている。更新判定部520は、カウント値が予め設定された値に到達するまでは常に“1”を、到達した後は入力された劣化音声信号が雑音であると判定されたときに“1”を、それ以外のときに“0”を出力し、カウンタ5049、スイッチ5044、及びシフトレジスタ5045に伝達する。スイッチ5044は、更新判定部520から供給された信号が“1”のときに回路を閉じ、“0”のときに開く。カウンタ5049は、更新判定部520から供給された信号が“1”のときにカウント値を増加し、“0”のときには変更しない。シフトレジスタ5045は、更新判定部520から供給された信号が“1”のときにスイッチ5044から供給される信号サンプルを1サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部5047には、カウンタ5049の出力とレジスタ長記憶部5041の出力が供給されている。
最小値選択部5047は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部5048に伝達する。除算部5048は、加算器5046から供給された周波数別劣化音声パワースペクトルの加算値をカウント値又はレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλn(k)として出力する。Bn(k)(n=0, 1, ..., N-1)をシフトレジスタ5045に保存されている劣化音声パワースペクトルのサンプル値とすると、λn(k)は
Figure 0004172530
で与えられる。ただし、Nはカウント値とレジスタ長のうちの小さい方の値である。カウント値はゼロから始まって単調に増加するので、最初はカウント値で除算が行なわれ、後にはレジスタ長で除算が行なわれる。レジスタ長で除算が行なわれることは、シフトレジスタに格納された値の平均値を求めることになる。最初は、シフトレジスタ5045に十分多くの値が記憶されていないために、実際に値が記憶されているレジスタの数で除算する。実際に値が記憶されているレジスタの数は、カウント値がレジスタ長より小さいときはカウント値に等しく、カウント値がレジスタ長より大きくなるとレジスタ長と等しくなる。
図16は、図15に示した更新判定部520の構成を示すブロック図である。更新判定部520は、論理和計算部5201、比較部5203及び5205、閾値記憶部5204及び5206、閾値計算部5207を有する。図8のカウンタ4から供給されるカウント値は、比較部5203に伝達される。閾値記憶部5204の出力である閾値も、比較部5203に伝達される。比較部5203は、供給されたカウント値と閾値を比較し、カウント値が閾値より小さいときに“1”を、カウント値が閾値より大きいときに“0”を、論理和計算部5201に伝達する。一方、閾値計算部5207は、図15の推定雑音記憶部5042から供給される周波数別推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部5206に出力する。
最も簡単な閾値の計算方法は、周波数別推定雑音パワースペクトルを定数倍する方法である。その他に、高次多項式や非線形関数を用いて閾値を計算することも可能である。閾値記憶部5206は、閾値計算部5207から出力された閾値を記憶し、1フレーム前に記憶された閾値を比較部5205へ出力する。比較部5205は、閾値記憶部5206から供給される閾値と図14の分離部502から供給される周波数別劣化音声パワースペクトルを比較し、周波数別劣化音声パワースペクトルが閾値よりも小さければ“1”を、大きければ“0”を論理和計算部5201に出力する。すなわち、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部5201は、比較部5203の出力値と比較部5205の出力値との論理和を計算し、計算結果を図15のスイッチ5044、シフトレジスタ5045及びカウンタ5049に出力する。
このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部520は“1”を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数毎に行われるため、各周波数毎に推定雑音の更新を行うことができる。
図17は、図8に示した推定先天的SNR計算部7の構成を示すブロック図である。推定先天的SNR計算部7は、多重値域限定処理部701、後天的SNR記憶部702、抑圧係数記憶部703、多重乗算部704及び705、重み記憶部706、多重重みつき加算部707、加算器708を有する。図8の周波数別SNR計算部6から供給される後天的SNR γn(k)(k=0, 1, ..., M-1)は、後天的SNR記憶部702と加算器708に伝達される。後天的SNR記憶部702は、第nフレームにおける後天的SNR γn(k)を記憶すると共に、第n-1フレームにおける後天的SNR γn-1(k)を多重乗算部705に伝達する。
図8の抑圧係数補正部15から供給される補正抑圧係数Gn(k)バー(k=0, 1, ..., M-1)は、抑圧係数記憶部703に伝達される。抑圧係数記憶部703は、第nフレームにおける補正抑圧係数Gn(k)バーを記憶すると共に、第n-1フレームにおける補正抑圧係数Gn-1(k)バーを多重乗算部704に伝達する。多重乗算部704は、供給されたGn(k)バーを2乗してG2n-1(k)バーを求め、多重乗算部705に伝達する。多重乗算部705は、G2n-1(k)バーとγn-1(k)をk=0, 1,..., M-1に対して乗算してG2n-1(k)バーγn-1(k)を求め、結果を多重重みつき加算部707に過去の推定SNR 922として伝達する。多重乗算部704及び705の構成は、図9を用いて説明した多重乗算部13に等しいので詳細な説明は省略する。
加算器708の他方の端子には−1が供給されており、加算結果γn(k)-1が多重値域限定処理部701に伝達される。多重値域限定処理部701は、加算器708から供給された加算結果γn(k)-1に値域限定演算子P[・]による演算を施し、結果であるP[γn(k)-1]を多重重みつき加算部707に瞬時推定SNR 921として伝達する。ただし、P[x]は次式で定められる。
Figure 0004172530
多重重みつき加算部707には、また、重み記憶部706から重み923が供給されている。多重重みつき加算部707は、これらの供給された瞬時推定SNR 921、過去の推定SNR 922、重み923を用いて推定先天的SNR 924を求める。重み923をαとし、ξn(k)ハットを推定先天的SNRとすると、ξn(k)ハットは、次式によって計算される。
Figure 0004172530
ここでは、G2-1(k)γ-1(k)バー=1とする。
図18は、図17に示した多重値域限定処理部701の構成を示すブロック図である。多重値域限定処理部701は、定数記憶部7011、最大値選択部70120〜7012M-1、分離部7013、多重化部7014を有する。分離部7013には、図17の加算器708から、γn(k)-1が供給される。分離部7013は、供給されたγn(k)-1をM個の周波数帯域別成分に分離し、最大値選択部70120〜7012M-1に供給する。最大値選択部70120〜7012M-1の他方の入力には、定数記憶部7011からゼロが供給されている。最大値選択部70120〜7012M-1は、γn(k)-1をゼロと比較し、大きい方の値を多重化部7014へ伝達する。この最大値選択演算は、上述の式12を実行することに相当する。多重化部7014は、これらの値を多重化して出力する。
図19は、図17に含まれる多重重みつき加算部707の構成を示すブロック図である。多重重みつき加算部707は、重みつき加算部70710〜7071M-1、分離部7072、7074、多重化部7075を有する。分離部7072には、図17の多重値域限定処理部701から、P[γn(k)-1]が瞬時推定SNR 921として供給される。分離部7072は、P[γn(k)-1]をM個の周波数帯域別成分に分離し、周波数帯域別瞬時推定SNR 9210〜921M-1として、重みつき加算部70710〜7071M-1に伝達する。分離部7074には、図17の多重乗算部705から、G2n-1(k)バーγn-1(k)が過去の推定SNR 922として供給される。分離部7074は、G2n-1(k)バーγn-1(k)をM個の周波数帯域別成分に分離し、過去の周波数帯域別推定SNR 9220〜922M-1として、重みつき加算部70710〜7071M-1に伝達する。一方、重みつき加算部70710〜7071M-1には、重み923も供給される。重みつき加算部70710〜7071M-1は、上述の式13によって表される重みつき加算を実行し、周波数帯域別推定先天的SNR 9240〜924M-1を多重化部7075に伝達する。多重化部7075は、周波数帯域別推定先天的SNR 9240〜924M-1を多重化し、推定先天的SNR 924として出力する。重みつき加算部70710〜7071M-1の動作と構成については、次に図20を参照しながら説明する。
図20は、図19に示した重みつき加算部70710〜7071M-1の構成を示すブロック図である。重みつき加算部7071は、乗算器7091及び7093、定数乗算器7095、加算器7092及び7094を有する。図19の分離部7072から周波数帯域別瞬時推定SNR 921が、図19の分離部7074から過去の周波数帯域別SNR 922が、図17の重み記憶部706から重み923が、それぞれ入力として供給される。値αを有する重み923は、定数乗算器7095と乗算器7093に伝達される。定数乗算器7095は入力信号を−1倍して得られた−αを、加算器7094に伝達する。加算器7094のもう一方の入力としては1が供給されており、加算器7094の出力は両者の和である1−αとなる。1−αは乗算器7091に供給されて、もう一方の入力である周波数帯域別瞬時推定SNR P[γn(k)−1]と乗算され、それらの積である(1−α)P[γn(k)−1]が加算器7092に伝達される。一方、乗算器7093では、重み923として供給されたαと過去の推定SNR 922が乗算され、それらの積であるαG2n-1(k)バーγn-1(k)が加算器7092に伝達される。加算器7092は、(1−α)P[γn(k)−1]とαG2n-1(k)バーγn-1(k)の和を、周波数帯域別推定先天的SNR 904として出力する。
図21は、図8に示した雑音抑圧係数生成部8を示すブロック図である。雑音抑圧係数生成部8は、MMSE STSA ゲイン関数値計算部811、一般化尤度比計算部812、及び抑圧係数計算部814を有する。以下、非特許文献2(1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号(IEEE TRANSACTIONSON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING,VOL.32, NO.6, PP.1109-1121, DEC,1984)、1109〜1121 ページ)に記載されている計算式をもとに、抑圧係数の計算方法を説明する。
フレーム番号をn、周波数番号をkとし、γn(k)を図8の周波数別SNR計算部6から供給される周波数別後天的SNR、ξn(k)ハットを図8の推定先天的SNR計算部7から供給される周波数別推定先天的SNR、qを図8の音声非存在確率記憶部21から供給される音声非存在確率とする。また、
ηn(k)= ξn(k)ハット/(1-q)、
vn(k) = (ηn(k)γn(k))/(1+ηn(k))
とする。MMSE STSA ゲイン関数値計算部811は、図8の周波数別SNR計算部6から供給される後天的SNR γn(k)、図8の推定先天的SNR計算部7から供給される推定先天的SNR ξn(k)ハット及び図8の音声非存在確率記憶部21から供給される音声非存在確率qをもとに、各周波数帯域毎にMMSE STSAゲイン関数値を計算し、抑圧係数計算部814に出力する。各周波数帯域毎のMMSE STSAゲイン関数値 Gn(k) は、
Figure 0004172530
で与えられる。ここで、I0(z)は0次変形ベッセル関数、I1(z)は1次変形ベッセル関数である。変形ベッセル関数については、非特許文献3(1985年、数学辞典、岩波書店、374.Gページ)に記載されている。
一般化尤度比計算部812は、図8の周波数別SNR計算部6から供給される後天的SNR γn(k)、図8の推定先天的SNR計算部7から供給される推定先天的SNR ξn(k)ハット及び図8の音声非存在確率記憶部21から供給される音声非存在確率qをもとに、周波数帯域毎に一般化尤度比を計算し、抑圧係数計算部814に伝達する。周波数帯域毎の一般化尤度比Λn(k)は、
Figure 0004172530
で与えられる。
抑圧係数計算部814は、MMSE STSA ゲイン関数値計算部811から供給されるMMSE STSA ゲイン関数値Gn(k)と一般化尤度比計算部812から供給される一般化尤度比Λn(k)から周波数毎に抑圧係数を計算し、図8の抑圧係数補正部15へ出力する。周波数帯域毎の抑圧係数Gn(k)バーは、
Figure 0004172530
で与えられる。周波数帯域別にSNRを計算する代わりに、複数の周波数帯域から構成される広い帯域に共通なSNRを求めて、これを用いることも可能である。
図22は、図8に示した抑圧係数補正部15の構成を示すブロック図である。抑圧係数補正部15は、周波数別抑圧係数補正部15010〜1501M-1、分離部1502及び1503、及び多重化部1504を有する。分離部1502は、図8の推定先天的SNR計算部7から供給される推定先天的SNRを周波数帯域別成分に分離し、それぞれ周波数別抑圧係数補正部15010〜1501M-1に出力する。分離部1503は、図8の抑圧係数生成部8から供給される抑圧係数を周波数帯域別成分に分離し、それぞれ周波数別抑圧係数補正部15010〜1501M-1に出力する。周波数別抑圧係数補正部15010〜1501M-1は、分離部1502から供給される周波数帯域別推定先天的SNRと、分離部1503から供給される周波数帯域別抑圧係数から、周波数帯域別補正抑圧係数を計算し、多重化部1504へ出力する。多重化部1504は、周波数別抑圧係数補正部15010〜1501M-1から供給される周波数帯域別補正抑圧係数を多重化し、補正抑圧係数として図8の多重乗算部16と推定先天的SNR計算部7へ出力する。
次に図23を参照しながら、周波数別抑圧係数補正部15010〜1501M-1の構成と動作について詳細に説明する。
図23は、抑圧係数補正部15に含まれる周波数別抑圧係数補正部15010〜1501M-1の構成を示すブロック図である。周波数別抑圧係数補正部1501は、最大値選択部1591、抑圧係数下限値記憶部1592、閾値記憶部1593、比較部1594、スイッチ1595、修正値記憶部1596及び乗算器1597を有する。比較部1594は、閾値記憶部1593から供給される閾値と、図22の分離部1502から供給される周波数帯域別推定先天的SNRを比較し、周波数帯域別推定先天的SNRが閾値よりも大きければ“0”を、小さければ“1”をスイッチ 1595に供給する。スイッチ1595は、図22の分離部1503から供給される周波数帯域別抑圧係数を、比較部1594の出力値が“1”のときに乗算器1597に出力し、“0”のときに最大値選択部1591に出力する。すなわち、周波数帯域別推定先天的SNRが閾値よりも小さいときに、抑圧係数の補正が行われる。乗算器1597は、スイッチ1595の出力値と修正値記憶部1596の出力値との積を計算し、最大値選択部1591に伝達する。
一方、抑圧係数下限値記憶部1592は、記憶している抑圧係数の下限値を、最大値選択部1591に供給する。最大値選択部1591は、図22の分離部1503から供給される周波数帯域別抑圧係数、又は乗算器1597で計算された積と、抑圧係数下限値記憶部1592から供給される抑圧係数下限値とを比較し、大きい方の値を図22の多重化部1504に出力する。すなわち、抑圧係数は抑圧係数下限値記憶部1592が記憶する下限値よりも必ず大きい値になる。
これまで説明した全ての実施の形態では、雑音抑圧の方式として、最小平均2乗誤差短時間スペクトル振幅法を仮定してきたが、その他の方法にも適用することができる。このような方法の例として、非特許文献4(1979年12月、プロシーディングス・オブ・ザ・アイ・イー・イー・イー、第67 巻、第12 号(PROCEEDINGS OF THE IEEE, VOL.67, NO.12, PP.1586-1604, DEC, 1979)、1586〜1604 ページ)に開示されているウィーナーフィルタ法や、非特許文献5(1979年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第27巻、第2号(IEEETRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.27, NO.2,PP.113-120, APR, 1979)、113〜120 ページ)に開示されているスペクトル減算法などがあるが、これらの詳細な構成例については説明を省略する。
また、上述した各実施形態の雑音抑圧装置は、プログラムなどを蓄積する記憶装置、入力用のキーやスイッチが配置された操作部、LCDなどの表示装置、操作部からの入力を受け付けて各部の動作を制御する制御装置から構成されるコンピュータ装置によって構成することができる。前述した各実施形態の雑音抑圧装置における動作は、制御装置が記憶装置に格納されたプログラムを実行することで実現される。プログラムは、予め記憶部に格納されていてもよく、また、CD-ROMなどの記録媒体に書き込まれた状態でユーザに提供されてもよい。また、ネットワークを通じて、プログラムを提供することも可能である。

Claims (21)

  1. 入力信号に含まれている雑音を抑圧する方法であって、
    入力信号を複数の帯域から構成される周波数領域信号に変換し、
    前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求め、
    該統合周波数領域信号を用いて推定雑音を求め、
    該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、
    該抑圧係数で前記周波数領域信号を重みづけする、
    ことを特徴とする雑音抑圧の方法。
  2. 前記推定雑音を補正して補正推定雑音を求め、
    該補正推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める、
    ことを特徴とする請求項1に記載の雑音抑圧の方法。
  3. 前記周波数領域信号の振幅を補正して振幅補正信号を求め、
    該振幅補正信号の帯域を統合して統合周波数領域信号を求める、
    ことを特徴とする請求項1または2に記載の雑音抑圧の方法。
  4. 前記周波数領域信号の位相を補正して位相補正信号を求め、
    前記抑圧係数で前記振幅補正信号を重みづけした結果と前記位相補正信号を時間領域信号に変換する、
    ことを特徴とする請求項3に記載の雑音抑圧の方法。
  5. 入力信号のオフセットを除去してオフセット除去信号を求め、
    該オフセット除去信号を周波数領域信号に変換する、
    ことを特徴とする請求項3または4に記載の雑音抑圧の方法。
  6. 入力信号に含まれている雑音を抑圧する装置であって、
    入力信号を複数の帯域から構成される周波数領域信号に変換する変換部と、
    前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める帯域統合部と、
    該統合周波数領域信号を用いて推定雑音を求める雑音推定部と、
    該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、
    該抑圧係数で前記周波数領域信号を重みづけする乗算部と、
    を有することを特徴とする雑音抑圧の装置。
  7. 前記推定雑音を補正して補正推定雑音を求める推定雑音補正部と
    該補正推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、
    を有することを特徴とする請求項6に記載の雑音抑圧の装置。
  8. 前記周波数領域信号の振幅を補正して振幅補正信号を求める振幅補正部と、
    該振幅補正信号の帯域を統合して統合周波数領域信号を求める帯域統合部と、
    を有することを特徴とする請求項6または7に記載の雑音抑圧の装置。
  9. 前記周波数領域信号の位相を補正して位相補正信号を求める位相補正部と、
    前記抑圧係数で前記振幅補正信号を重みづけした結果と前記位相補正信号を時間領域信号に変換する逆変換部と、
    を有することを特徴とする請求項8に記載の雑音抑圧の装置。
  10. 入力信号のオフセットを除去してオフセット除去信号を求めるオフセット除去部と、
    該オフセット除去信号を周波数領域信号に変換する変換部と、
    を有する請求項8または9に記載の雑音抑圧の装置。
  11. 入力信号に含まれている雑音を抑圧する信号処理を行なうコンピュータプログラムであって、
    入力信号を複数の帯域から構成される周波数領域信号に変換する処理と、
    前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める処理と、
    該統合周波数領域信号を用いて推定雑音を求める処理と、
    該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、
    該抑圧係数で前記周波数領域信号を重みづけする処理と、
    をコンピュータに実行させることを特徴とする雑音抑圧用のコンピュータプログラム。
  12. 前記推定雑音を補正して補正推定雑音を求める処理と、
    該補正推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、
    をコンピュータにさらに実行させることを特徴とする請求項11に記載の雑音抑圧用のコンピュータプログラム。
  13. 前記周波数領域信号の振幅を補正して振幅補正信号を求める処理と、
    該振幅補正信号の帯域を統合して統合周波数領域信号を求める処理と、
    をコンピュータにさらに実行させることを特徴とする請求項11または12に記載の雑音抑圧用のコンピュータプログラム。
  14. 前記周波数領域信号の位相を補正して位相補正信号を求める処理と、
    前記抑圧係数で前記振幅補正信号を重みづけした結果と前記位相補正信号を時間領域信号に変換する処理と、
    をコンピュータにさらに実行させることを特徴とする請求項13に記載の雑音抑圧用のコンピュータプログラム。
  15. 前記入力信号のオフセットを除去してオフセット除去信号を求める処理と、
    該オフセット除去信号を周波数領域信号に変換する処理と、
    をコンピュータにさらに実行させることを特徴とする請求項13または14に記載の雑音抑圧用のコンピュータプログラム。
  16. 入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求め、該抑圧係数で前記周波数領域信号を重みづけすることによって入力信号に含まれている雑音を抑圧する方法であって、
    少なくとも一つの抑圧係数を複数の帯域成分に対して利用する、ことを特徴とする雑音抑圧の方法。
  17. 前記抑圧係数を定める際に、抑圧係数毎に該抑圧係数を用いる複数の帯域の前記周波数領域信号を用いて前記複数の帯域で共通な推定雑音を求め、該推定雑音を用いて前記抑圧係数を定めることを特徴とする、請求項16に記載の雑音抑圧の方法。
  18. 入力信号を周波数領域信号に変換する変換部と、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を定める抑圧係数生成部と、該抑圧係数で前記周波数領域信号を重みづけする乗算部と、を少なくとも具備する雑音抑圧の装置であって、
    前記周波数領域信号の帯域を統合して統合周波数領域信号を求める帯域統合部を有し、
    前記抑圧係数生成部は、前記統合周波数領域信号を用いて抑圧係数を定め、
    前記乗算部は、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけすることを特徴とする雑音抑圧の装置。
  19. 前記統合周波数領域信号を用いて前記複数の帯域で共通な推定雑音を求める雑音推定部をさらに有し、
    前記抑圧係数生成部は、該推定雑音を用いて前記抑圧係数を定めることを特徴とする請求項18に記載の雑音抑圧の装置。
  20. 入力信号に含まれている雑音を抑圧するために、前記入力信号を周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけする信号処理を行なうコンピュータプログラムであって、
    前記周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて前記抑圧係数を定め、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけする処理をコンピュータに実行させることを特徴とする雑音抑圧用のコンピュータプログラム。
  21. 前記統合周波数領域信号を用いて前記複数の帯域で共通な推定雑音を求め、該推定雑音を用いて前記抑圧係数を定める処理を、コンピュータにさらに実行させることを特徴とする請求項20に記載の雑音抑圧用のコンピュータプログラム。
JP2007505297A 2005-09-02 2006-08-29 雑音抑圧の方法及び装置並びにコンピュータプログラム Active JP4172530B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005255748 2005-09-02
JP2005255748 2005-09-02
PCT/JP2006/316963 WO2007026691A1 (ja) 2005-09-02 2006-08-29 雑音抑圧の方法及び装置並びにコンピュータプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008110432A Division JP2008203879A (ja) 2005-09-02 2008-04-21 雑音抑圧の方法及び装置並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP4172530B2 true JP4172530B2 (ja) 2008-10-29
JPWO2007026691A1 JPWO2007026691A1 (ja) 2009-03-26

Family

ID=37808780

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007505297A Active JP4172530B2 (ja) 2005-09-02 2006-08-29 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP2008110432A Pending JP2008203879A (ja) 2005-09-02 2008-04-21 雑音抑圧の方法及び装置並びにコンピュータプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008110432A Pending JP2008203879A (ja) 2005-09-02 2008-04-21 雑音抑圧の方法及び装置並びにコンピュータプログラム

Country Status (6)

Country Link
US (1) US9318119B2 (ja)
EP (2) EP1921609B1 (ja)
JP (2) JP4172530B2 (ja)
KR (1) KR100927897B1 (ja)
CN (1) CN101091209B (ja)
WO (1) WO2007026691A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008203879A (ja) * 2005-09-02 2008-09-04 Nec Corp 雑音抑圧の方法及び装置並びにコンピュータプログラム
US8818001B2 (en) 2009-11-20 2014-08-26 Sony Corporation Signal processing apparatus, signal processing method, and program therefor
US8989403B2 (en) 2010-03-09 2015-03-24 Mitsubishi Electric Corporation Noise suppression device

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL1032724C2 (nl) * 2006-10-23 2008-04-25 Ten Cate Thiolon Bv Kunstgrasveld, in het bijzonder voor een kunstgrassportveld.
US20100207689A1 (en) * 2007-09-19 2010-08-19 Nec Corporation Noise suppression device, its method, and program
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
CN101983402B (zh) * 2008-09-16 2012-06-27 松下电器产业株式会社 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法
WO2010090311A1 (ja) * 2009-02-09 2010-08-12 日本電気株式会社 経路制御システム、経路制御装置、通信装置、経路制御方法およびプログラム
JP5648052B2 (ja) * 2009-07-07 2015-01-07 コーニンクレッカ フィリップス エヌ ヴェ 呼吸信号のノイズ低減
JP5294085B2 (ja) 2009-11-06 2013-09-18 日本電気株式会社 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP5787126B2 (ja) 2009-11-06 2015-09-30 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
JP2011100029A (ja) 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
JP5325134B2 (ja) * 2010-02-04 2013-10-23 日本電信電話株式会社 反響消去方法、反響消去装置、そのプログラムおよび記録媒体
WO2011148860A1 (ja) 2010-05-24 2011-12-01 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
EP2767978B1 (en) 2010-05-25 2017-03-15 Nec Corporation Noise suppression in a deteriorated audio signal
EP2600344B1 (en) 2010-07-26 2015-02-18 Panasonic Corporation Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit
JP2012058358A (ja) * 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
WO2012070671A1 (ja) * 2010-11-24 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
WO2012070684A1 (ja) 2010-11-25 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
WO2012114628A1 (ja) 2011-02-26 2012-08-30 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体
JP2014123011A (ja) * 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
RU2640442C2 (ru) * 2012-12-31 2018-01-09 Филип Моррис Продактс С.А. Курительное изделие, содержащее ограничитель потока в полой трубке
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
CN104702558B (zh) * 2013-12-05 2018-03-09 上海数字电视国家工程研究中心有限公司 Ofdm系统的相位噪声消除方法
US20170011753A1 (en) * 2014-02-27 2017-01-12 Nuance Communications, Inc. Methods And Apparatus For Adaptive Gain Control In A Communication System
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
CN104134444B (zh) * 2014-07-11 2017-03-15 福建星网视易信息系统有限公司 一种基于mmse的歌曲去伴奏方法和装置
CN104090253B (zh) * 2014-07-14 2016-12-07 中国电子科技集团公司第四十一研究所 一种基于数据模型的校准件定标数据中噪声的处理方法
CN105635453B (zh) * 2015-12-28 2020-12-29 上海博泰悦臻网络技术服务有限公司 一种通话音量自动调节方法、系统、车载设备及汽车
US10825465B2 (en) 2016-01-08 2020-11-03 Nec Corporation Signal processing apparatus, gain adjustment method, and gain adjustment program
CN106228993B (zh) * 2016-09-29 2020-02-07 北京奇艺世纪科技有限公司 一种消除噪声的方法和装置以及电子设备
EP3593349B1 (en) * 2017-03-10 2021-11-24 James Jordan Rosenberg System and method for relative enhancement of vocal utterances in an acoustically cluttered environment
CN108281149B (zh) * 2017-12-29 2021-08-27 芯原微电子(北京)有限公司 一种基于加Blackman窗的FIR滤波器的音频采样率转换方法及系统
US11769517B2 (en) * 2018-08-24 2023-09-26 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
CN109613336B (zh) * 2018-12-07 2020-12-01 中国电子科技集团公司第四十一研究所 一种任意长度fft多模信号频域分析装置及方法
CN110164467B (zh) * 2018-12-18 2022-11-25 腾讯科技(深圳)有限公司 语音降噪的方法和装置、计算设备和计算机可读存储介质
KR102569365B1 (ko) * 2018-12-27 2023-08-22 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
CN109829899B (zh) * 2019-01-18 2020-08-07 创新奇智(广州)科技有限公司 一种针对钢卷端面缺陷检测的背景抑制算法
CN110931033B (zh) * 2019-11-27 2022-02-18 深圳市悦尔声学有限公司 一种麦克风内置耳机的语音聚焦增强方法
CN111131965A (zh) * 2019-12-26 2020-05-08 九江慧明电子科技有限公司 一种带有保护功能的音频系统及其调节方法
CN111163399A (zh) * 2019-12-26 2020-05-15 九江慧明电子科技有限公司 一种具有高灵敏度的音频系统及其调节方法
CN111402917B (zh) * 2020-03-13 2023-08-04 北京小米松果电子有限公司 音频信号处理方法及装置、存储介质
CN113936670A (zh) * 2020-06-28 2022-01-14 腾讯科技(深圳)有限公司 丢包重发方法、系统、装置、计算机可读存储介质及设备
CN111899752B (zh) * 2020-07-13 2023-01-10 紫光展锐(重庆)科技有限公司 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940009391B1 (ko) 1985-07-01 1994-10-07 모토로라 인코포레이티드 잡음 억제 시스템
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
JP3338573B2 (ja) 1994-11-01 2002-10-28 ユナイテッド・モジュール・コーポレーション サブバンド分割演算回路
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
JPH0944186A (ja) * 1995-07-31 1997-02-14 Matsushita Electric Ind Co Ltd 雑音抑制装置
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
JP3522954B2 (ja) 1996-03-15 2004-04-26 株式会社東芝 マイクロホンアレイ入力型音声認識装置及び方法
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
JPH11289312A (ja) 1998-04-01 1999-10-19 Toshiba Tec Corp マルチキャリア無線通信装置
US6381570B2 (en) * 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
JP2000357969A (ja) 1999-06-16 2000-12-26 Victor Co Of Japan Ltd オーディオ信号の符号化装置
GB2355834A (en) * 1999-10-29 2001-05-02 Nokia Mobile Phones Ltd Speech recognition
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US6529868B1 (en) * 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6701291B2 (en) * 2000-10-13 2004-03-02 Lucent Technologies Inc. Automatic speech recognition with psychoacoustically-based feature extraction, using easily-tunable single-shape filters along logarithmic-frequency axis
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7349841B2 (en) 2001-03-28 2008-03-25 Mitsubishi Denki Kabushiki Kaisha Noise suppression device including subband-based signal-to-noise ratio
ATE331279T1 (de) * 2001-04-09 2006-07-15 Koninkl Philips Electronics Nv Vorrichtung zur sprachverbesserung
JP2002316580A (ja) 2001-04-24 2002-10-29 Murakami Corp カメラ内蔵ミラー装置
JP3457293B2 (ja) * 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
EP1278185A3 (en) * 2001-07-13 2005-02-09 Alcatel Method for improving noise reduction in speech transmission
JP2003131689A (ja) * 2001-10-25 2003-05-09 Nec Corp ノイズ除去方法及び装置
WO2004006625A1 (en) * 2002-07-08 2004-01-15 Koninklijke Philips Electronics N.V. Audio processing
US20040148160A1 (en) * 2003-01-23 2004-07-29 Tenkasi Ramabadran Method and apparatus for noise suppression within a distributed speech recognition system
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
JP4162604B2 (ja) * 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
JP4542790B2 (ja) * 2004-01-16 2010-09-15 株式会社東芝 ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
JP4172530B2 (ja) 2005-09-02 2008-10-29 日本電気株式会社 雑音抑圧の方法及び装置並びにコンピュータプログラム
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
WO2019021609A1 (ja) 2017-07-28 2019-01-31 シャープ株式会社 カメラモジュール製造方法およびカメラモジュール製造装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008203879A (ja) * 2005-09-02 2008-09-04 Nec Corp 雑音抑圧の方法及び装置並びにコンピュータプログラム
US9318119B2 (en) 2005-09-02 2016-04-19 Nec Corporation Noise suppression using integrated frequency-domain signals
US8818001B2 (en) 2009-11-20 2014-08-26 Sony Corporation Signal processing apparatus, signal processing method, and program therefor
US8989403B2 (en) 2010-03-09 2015-03-24 Mitsubishi Electric Corporation Noise suppression device

Also Published As

Publication number Publication date
KR100927897B1 (ko) 2009-11-23
JP2008203879A (ja) 2008-09-04
WO2007026691A1 (ja) 2007-03-08
EP2555190B1 (en) 2014-07-02
US20100010808A1 (en) 2010-01-14
EP1921609B1 (en) 2014-07-16
CN101091209B (zh) 2010-06-09
JPWO2007026691A1 (ja) 2009-03-26
EP1921609A1 (en) 2008-05-14
US9318119B2 (en) 2016-04-19
KR20070088751A (ko) 2007-08-29
EP1921609A4 (en) 2012-07-25
EP2555190A1 (en) 2013-02-06
CN101091209A (zh) 2007-12-19

Similar Documents

Publication Publication Date Title
JP4172530B2 (ja) 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP5092748B2 (ja) 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP4282227B2 (ja) ノイズ除去の方法及び装置
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP4670483B2 (ja) 雑音抑圧の方法及び装置
JP4973873B2 (ja) 残響抑圧の方法、装置及び残響抑圧用プログラム
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
JP2003140700A (ja) ノイズ除去方法及び装置
JP2007006525A (ja) ノイズ除去の方法及び装置
JP4395772B2 (ja) ノイズ除去方法及び装置
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP4968355B2 (ja) 雑音抑圧の方法及び装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080804

R150 Certificate of patent or registration of utility model

Ref document number: 4172530

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 5