JP5788873B2 - 信号処理方法、情報処理装置、及び信号処理プログラム - Google Patents

信号処理方法、情報処理装置、及び信号処理プログラム Download PDF

Info

Publication number
JP5788873B2
JP5788873B2 JP2012517235A JP2012517235A JP5788873B2 JP 5788873 B2 JP5788873 B2 JP 5788873B2 JP 2012517235 A JP2012517235 A JP 2012517235A JP 2012517235 A JP2012517235 A JP 2012517235A JP 5788873 B2 JP5788873 B2 JP 5788873B2
Authority
JP
Japan
Prior art keywords
noise
information
unknown
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012517235A
Other languages
English (en)
Other versions
JPWO2011148861A1 (ja
Inventor
昭彦 杉山
昭彦 杉山
良次 宮原
良次 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Engineering Ltd
Original Assignee
NEC Corp
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Engineering Ltd filed Critical NEC Corp
Priority to JP2012517235A priority Critical patent/JP5788873B2/ja
Publication of JPWO2011148861A1 publication Critical patent/JPWO2011148861A1/ja
Application granted granted Critical
Publication of JP5788873B2 publication Critical patent/JP5788873B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B15/00Suppression or limitation of noise or interference
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Noise Elimination (AREA)

Description

本発明は、劣化信号中の雑音を抑圧して所望の信号を強調するための信号処理技術に関する。
劣化信号(所望の信号と雑音とが混合された信号)から、雑音の一部又は全部を抑圧し、強調信号(所望の信号を強調した信号)を出力する信号処理技術として、雑音抑圧技術(noise suppressing technology)が知られている。例えば、ノイズサプレッサは、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムであり、携帯電話など様々な音声端末において利用されている。
この種の技術に関し、特許文献1には、入力信号に1より小さな抑圧係数を乗算することによって、ノイズを抑圧する方法が開示されており、特許文献2には、推定された雑音を劣化信号から直接減算することによって、雑音を抑圧する方法が開示されている。
特許文献1及び2に記載の技術は、既に雑音が混合されて劣化している所望信号から、雑音を推定しなければならない。しかし、劣化信号だけから正確に雑音を推定することには限界があり、特許文献1及び2に記載された方法は、一般的に、雑音が所望信号に対して十分小さい場合のみ有効である。雑音が所望信号に対して十分に小さいという条件が満たされない場合は、雑音推定値の精度が低いため、特許文献1及び2に記載された方法では、十分な雑音抑圧の効果が得られず、さらに強調信号に大きな歪が含まれていた。
一方、特許文献3には、所望信号に混入する雑音の特性が事前にある程度わかる場合に、事前に記録しておいた雑音情報(雑音の特性に関する情報)を、劣化信号から減算することで、雑音を抑圧する技術が開示されている。またここでは、入力信号を分析して得られた入力信号パワーが大きいときは大きな係数を、その入力信号パワーが小さいときは小さな係数を、雑音情報に積算して、その積算結果を劣化信号から減算する方法も開示されている。
特許第4282227号公報 特開平8−221092号公報 特開2006−279185号公報
しかしながら、未知の特性を有する雑音と既知の特性を有する雑音とを両方抑圧する技術はなかった。例えば、携帯電話を操作しながら音声通話をおこなう場合や、インタビューの録画を行なう場合など、人の話す音声を強調して、他の機械ノイズや背景ノイズなどを抑圧することができなかった。
以上を踏まえ、本発明は、上述の課題を解決する信号処理技術を提供することを目的とする。
上記目的を達成するため、本発明に係る装置は、入力された劣化信号に含まれた雑音を抑圧する雑音抑圧手段を備え、前記雑音抑圧手段は、既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力手段と、未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力する第2出力手段と、を含み、前記既知雑音情報と前記未知雑音情報とを用いて雑音抑圧処理を行なう。
上記目的を達成するため、本発明に係る方法は、既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力し、未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力し、前記既知雑音情報と前記未知雑音情報とを用いて、入力された劣化信号に含まれた雑音を抑圧する。
上記目的を達成するため、プログラム記録媒体は、既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力ステップと、未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力する第2出力ステップと、前記既知雑音情報と前記未知雑音情報とを用いて、入力された劣化信号に含まれた雑音を抑圧する雑音抑圧ステップと、をコンピュータに実行させる信号処理プログラムを格納する。
本発明は、未知の特性を有する雑音と既知の特性を有する雑音とを両方抑圧することができる信号処理技術を提供する。
本発明の第1実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第2実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第3実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第4実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第5実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第6実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第7実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第8実施形態に係る雑音抑圧部の概略構成を示すブロック図である。 本発明の第9実施形態としての情報処理装置の概略構成を示すブロック図である。 本発明の第9実施形態としての情報処理装置に含まれる変換部の構成を示すブロック図である。 本発明の第9実施形態としての情報処理装置に含まれる逆変換部の構成を示すブロック図である。 本発明の第10実施形態としての情報処理装置の概略構成を示すブロック図である。 本発明の第11実施形態としての情報処理装置の概略構成を示すブロック図である。 本発明の第12実施形態としての情報処理装置の概略構成を示すブロック図である。 本発明の他の実施形態としての信号処理プログラムを実行するコンピュータの概略構成図である。 本発明の情報処理装置の概略構成を示すブロック図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
(第1実施形態)
本発明に係る情報処理装置の第1実施形態として、劣化信号(所望の信号と雑音とが混合された信号)から、雑音の一部又は全部を抑圧し、強調信号(所望の信号を強調した信号)を出力する装置について説明する。
本実施形態では、携帯電話で音声通話しつつ撮影または機械操作する場合やICレコーダで音声録音中に機械操作を行なう場合や、インタビュー録画中に機械を操作したり機械が動作したりする場合など、を前提としている。そして、本実施形態によれば、装置周辺で発生した雑音(使用者や話者の周囲にある背景ノイズ)の抑圧と、装置自体で発生した雑音(オートフォーカス駆動ノイズ、ズーミングノイズ、シャッター音など既知のノイズ)の抑圧とをバランスよく両立させることができる。
情報処理装置としては、例えばデジタルカメラ、デジタルビデオカメラ、ノートパソコン、携帯電話、ICレコーダ、テレビ会議システムなどといった装置が挙げられるが、本発明はこれに限定されるものではなく、ノイズ除去を要求されるあらゆる装置に適用可能である。
図1は、情報処理装置に含まれる雑音抑圧部3の構成を示すブロック図である。図に示すように、雑音抑圧部3は、既知雑音情報出力部301と、未知雑音情報出力部303とを含み、既知雑音情報出力部301から出力された既知雑音情報と未知雑音情報出力部303から出力された未知雑音情報とを用いて雑音抑圧処理を行なう。また、図16は、情報処理装置Aの構成を示す他のブロック図である。該情報処理装置Aは、雑音抑圧部3を備える。雑音抑圧部3は、既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力部301(既知雑音情報出力部301)と、未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して未知雑音情報を出力する第2出力部303(未知雑音情報出力部303)とを備える。以下では図1を用いて説明する。
既知雑音情報出力部301は、既知の性質を有する既知雑音を抑圧するため、記憶部311に予め記憶された雑音情報を用いて既知雑音情報を出力する。記憶部311は、半導体メモリなどの記憶素子を含み、抑圧対象としての既知の雑音の特性に関する情報(雑音情報)を記憶している。抑圧対象として記憶される既知の雑音は、例えば、シャッター音、モータ駆動音、ズーム音、オートフォーカスのフォーカシングノイズ(カチカチという音)等である。一方、未知雑音情報出力部303は、未知の性質を有する未知雑音を抑圧するため、劣化信号に含まれる未知雑音を推定する推定部331を含む。
以上の構成により、本実施形態の情報処理装置は、未知の特性を有する雑音と既知の特性を有する雑音とを両方抑圧することができる。
(第2実施形態)
図2は、本発明の第2実施形態としての情報処理装置に含まれる雑音抑圧部23の構成を示すブロック図である。第1実施形態と同様に、雑音抑圧部23は、既知雑音情報出力部231と、未知雑音情報出力部233とを含み、既知雑音情報出力部231から出力された既知雑音情報と未知雑音情報出力部233から出力された未知雑音情報とを用いて雑音抑圧処理を行なう。また、図示していないが、既知雑音情報出力部231は、予め雑音情報を記憶する記憶部を含み、未知雑音情報出力部233は、劣化信号に含まれる未知雑音を推定する推定部を含む。
ただし、本実施形態の雑音抑圧部23は、既知雑音情報出力部231から出力された既知雑音情報を用いて雑音抑圧処理を行なった信号に対して、未知雑音情報出力部233から出力された未知雑音情報を用いて更に雑音抑圧処理を加える。つまり、既知雑音情報出力部231から出力された既知雑音情報は、既知雑音抑圧部232に供給され、入力された劣化信号に含まれる既知雑音の抑圧に用いられる。更に、既知雑音を抑圧済みの信号は、未知雑音情報出力部233に供給され、未知雑音情報出力部233は、既に既知雑音の抑圧処理が施された信号を用いて、未知雑音の推定を行なう。そして、推定の結果として出力された未知雑音情報は、未知雑音抑圧部234に供給され、既知雑音を抑圧済みの信号に対して推定された未知雑音の抑圧処理が加えられて強調信号として出力される。
以上の構成により、本実施形態の情報処理装置は、未知の特性を有する雑音と既知の特性を有する雑音との両方抑圧を実現する。
(第3実施形態)
図3は、本発明の第2実施形態としての情報処理装置に含まれる雑音抑圧部33の構成を示すブロック図である。本実施形態に係る雑音抑圧部33の構成及び動作は、第2実施形態の雑音抑圧部23とほぼ同様であるが、入力された劣化信号が未知雑音情報出力部333に供給される点で異なる。
本実施形態では、未知雑音情報出力部333は、入力された劣化信号を用いて、未知雑音の推定を行なう。そして、推定の結果として出力された未知雑音情報は、未知雑音抑圧部234に供給され、既知雑音を抑圧済みの信号に対して推定された未知雑音の抑圧処理が加えられて強調信号として出力される。
以上の構成により、既知雑音情報出力部231及び既知雑音抑圧部232の雑音抑圧精度が低い場合にでも、未知雑音の推定を高い精度で行なうことが可能となる。
(第4実施形態)
図4は、本発明の第4実施形態としての情報処理装置に含まれる雑音抑圧部43の構成を示すブロック図である。本実施形態に係る雑音抑圧部43の構成及び動作は、第3実施形態の雑音抑圧部33とほぼ同様であるが、入力された劣化信号が既知雑音情報出力部431にも供給される点で異なる。
本実施形態では、既知雑音情報出力部331は、入力された劣化信号を用いて、記憶部に記憶した雑音情報から既知雑音情報を生成する。例えば、既知雑音情報出力部431は、入力した劣化信号を分析し、分析結果に応じた混合方法によって予め記憶された雑音情報を混合して、既知雑音情報としての混合雑音情報(擬似雑音情報)を生成し出力する。混合対象となる複数の雑音情報のうち少なくとも1つは予め記憶部に記憶されたものである。
より具体的な例を示すと、記憶部に予め複数の雑音情報が記憶されており、既知雑音情報出力部431は、それらを組み合わせて混合する。混合対象は、例えば、既知の雑音の最大雑音情報と平均雑音情報の組合せ、最大雑音情報と平均雑音情報と最小雑音情報の組合せ、ピーク成分雑音情報とそれ以外の組合せ、衝撃成分雑音情報とそれ以外の組合せ等である。
なお、平均雑音情報、最大雑音情報、最小雑音情報、ピーク成分雑音情報、衝撃成分雑音情報の定義は以下の通りである。
平均雑音情報:既知の雑音の全体(複数フレーム)についてフーリエ変換により導きだされる複数のスペクトルについて同じ周波数成分の振幅(またはパワー)を平均したもの。いわゆる時間方向に平均した平均スペクトル。
最大雑音情報:既知の雑音の全体(複数フレーム)についてフーリエ変換により導きだされる複数のスペクトルの周波数成分ごとの振幅(またはパワー)の最大値、いわゆる最大スペクトル。
最小雑音情報:既知の雑音の全体(複数フレーム)についてフーリエ変換により導きだされる複数のスペクトルの周波数成分ごとの振幅(またはパワー)の最小値、いわゆる最小スペクトル。
ピーク成分雑音情報:既知の雑音の全体(複数フレーム)についてフーリエ変換により導きだされるスペクトルにおいて、周波数方向に順に振幅を比較したときに、近傍の値に比べて突出して大きい値を有する周波数成分。
衝撃成分雑音情報:衝撃音の全体についてフーリエ変換により導きだされる複数のスペクトルの平均、いわゆる衝撃音の平均スペクトル。衝撃音自体は、フーリエ変換前の音声信号の時間変化を観測したときに、極めて短時間だけ大きな値を持つものであるが、フーリエ変換後のスペクトルは、所定の周波数帯域に渡って振幅がほぼ一定という特徴を有する。
以上のように、入力した劣化信号の分析結果に応じた混合方法によって予め記憶された雑音情報を混合して、既知雑音情報としての混合雑音情報(擬似雑音情報)を生成すれば、変動の激しい信号特性に対応した雑音抑圧を実現することができる。
(第5実施形態)
図5は、本発明の第5実施形態としての情報処理装置に含まれる雑音抑圧部53の構成を示すブロック図である。本実施形態に係る雑音抑圧部53は、既知雑音情報出力部231から出力された既知雑音情報と、未知雑音情報出力部333から出力された未知雑音とを選択的に用いて雑音抑圧処理を行なう点で、上記第2乃至第4実施形態と異なる。既知雑音情報出力部231の構成及び動作は、第2実施形態と同様であり、未知雑音情報出力部333の構成及び動作は、第3実施形態と同様であるため同じ符号を用いている。
雑音抑圧部53において選択部535は、例えば、既知雑音情報に関する利得g1(0<g1<1)と、未知雑音情報に関する利得g2(0<g2<1)とをそれぞれ算出し、何れか小さい方または大きい方を選択して抑圧部536に供給する。抑圧部536は、選択部535から供給された利得を劣化信号に積算することにより雑音抑圧処理を行なう。ここで、雑音抑圧部53の雑音抑圧処理は、劣化信号の周波数成分ごとに行なわれる。つまり、雑音抑圧部53は、周波数ごとに、既知雑音と未知雑音の何れがより深刻かをみて、深刻な方に合わせて抑圧する。
なお、選択部535に対して劣化信号を入力し、選択部535が劣化信号を分析して、既知雑音情報と未知雑音情報との何れを抑圧に用いるかを決定してもよい。この場合、抑圧部536は、選択部535から供給された既知雑音情報または未知雑音情報を、劣化信号から減算することにより雑音抑圧処理を行なう。
本実施形態によれば、より効率的に雑音抑圧を実現することができる。例えば、選択部535が利得の最小値を選択すれば、より深刻な雑音を効果的に抑圧できる。つまり、本実施形態によれば、既知雑音が未知雑音より全体的に大きい状況では、既知雑音が大きい周波数では既知雑音を優先的に抑圧し、既知雑音が小さい周波数では未知雑音を優先的に抑圧することができる。一方、選択部535が利得の最大値を選択すれば、雑音抑圧による歪みの発生を効果的に防止でき高い音質を実現できる。さらに雑音抑圧部53は、歪みが発生しない利得の閾値Gthが分かっている場合には、その閾値Gthよりも利得g1、g2の両方が大きい場合には小さい方の利得を用いて抑圧を行ない、何れかの利得が閾値Gthよりも小さい場合には、その閾値Gthを用いて抑圧を行なってもよい。
(第6実施形態)
図6は、本発明の第6実施形態としての情報処理装置に含まれる雑音抑圧部63の構成を示すブロック図である。本実施形態に係る雑音抑圧部63は、既知雑音情報出力部431が劣化信号の分析結果に応じて既知雑音情報を生成する点で、第5実施形態と異なる。そのため、既知雑音情報出力部431には劣化信号が供給されている。劣化信号を分析して、その分析結果に応じて既知雑音情報を生成する過程については、図4を用いて第4実施形態で説明した通りであるので、その説明を省略する。また、その他の構成及び動作は第5実施形態と同様であるため、同じ構成については同じ符号を用いてその説明を省略する。
本実施形態のように、入力した劣化信号の分析結果に応じて既知雑音情報を生成すれば、第5実施形態の効果に加えて、変動の激しい信号特性に対応した雑音抑圧を実現することができる。
(第7実施形態)
図7は、本発明の第7実施形態としての情報処理装置に含まれる雑音抑圧部73の構成を示すブロック図である。本実施形態に係る雑音抑圧部73は、既知雑音情報出力部231から出力された既知雑音情報と、未知雑音情報出力部333から出力された未知雑音とを混合して雑音抑圧処理を行なう点で、上記第5実施形態と異なる。他の構成は第5実施形態と同様であるため同じ符号を用いて説明を省略する。
雑音抑圧部73において混合部735は、例えば、既知雑音情報に関する利得g1(0<g1<1)と、未知雑音情報に関する利得g2(0<g2<1)とをそれぞれ算出し、それらを混合した値(例えば中間値)を抑圧部536に供給する。抑圧部536は、混合部735から供給された利得を劣化信号に積算することにより雑音抑圧処理を行なう。ここで、雑音抑圧部73の雑音抑圧処理は、劣化信号の周波数成分ごとに行なわれる。つまり、周波数ごとに、既知雑音と未知雑音の抑圧が行なわれる。
なお、混合部735に対して劣化信号を入力し、混合部735が劣化信号を分析して、既知雑音情報と未知雑音情報とを分析結果に応じて混合して、抑圧に用いてもよい。つまり、混合部735が、既知雑音情報と、未知雑音情報とを、入力された劣化信号の分析結果に応じた重み付けで混合してもよい。
本実施形態によれば、抑圧の利得、あるいは抑圧のために減算するべき成分をより正確に求めることができ、効果的に雑音抑圧を実現することができる。その結果、雑音の抑圧と、それによる歪みの発生防止とをバランスよく実現することが可能となる。
(第8実施形態)
図8は、本発明の第8実施形態としての情報処理装置に含まれる雑音抑圧部83の構成を示すブロック図である。本実施形態に係る雑音抑圧部83は、既知雑音情報出力部431が劣化信号の分析結果に応じて既知雑音情報を生成する点で、第7実施形態と異なる。そのため、既知雑音情報出力部431には、劣化信号が供給されている。劣化信号を分析して、その分析結果に応じて既知雑音情報を生成する過程については、図4を用いて第4実施形態で説明した通りであるので、その説明を省略する。また、その他の構成及び動作は第7実施形態と同様であるため、同じ構成については同じ符号を用いてその説明を省略する。
本実施形態のように、入力した劣化信号の分析結果に応じて既知雑音情報を生成すれば、第7実施形態の効果に加えて、変動の激しい信号特性に対応した雑音抑圧を実現することができる。
(第9実施形態)
本実施形態では、図9を用いて、第1乃至第8実施形態で説明した雑音抑圧部3、23、33、43、53、63、73、83の周辺構成の一例を説明する。図9及び以下の説明において、代表して雑音抑圧部3について示す。
図9に示すように、雑音抑圧部3の周囲には、入力端子1、変換部2、逆変換部4、出力端子5が設けられている。
入力端子1には、劣化信号が、サンプル値系列として供給される。入力端子1に供給された劣化信号は、変換部2においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分の振幅スペクトルは雑音抑圧部3へ供給され、位相スペクトルは、逆変換部4に伝達される。なお、ここでは、雑音抑圧部3に振幅スペクトルが供給されているが、本発明はこれに限定されるものではなく、その二乗に相当するパワースペクトルが雑音抑圧部3に供給されても良い。
雑音抑圧部3は、変換部2から供給された劣化信号振幅スペクトルの各周波数で雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを逆変換部4に伝達する。逆変換部4は、雑音抑圧部3から供給された強調信号振幅スペクトルと変換部2から供給された劣化信号の位相スペクトルとを合わせて逆変換を行い、強調信号サンプルとして、出力端子5に供給する。
[変換部の構成]
図10は、変換部2の構成を示すブロック図である。図10に示すように、変換部2はフレーム分割部121、窓がけ処理部(windowing unit)122、及びフーリエ変換部123を含む。劣化信号サンプルは、フレーム分割部121に供給され、K/2サンプル毎のフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部122に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t)(t=0,1,...,K/2−1)に対するw(t)で窓がけ(windowing)された信号は、次式(1)で与えられる。
Figure 0005788873
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。オーバラップ長としてフレーム長の50%を仮定すれば、t=0,1,...,K/2−1に対して、以下の式(2)で得られる左辺が、窓がけ処理部122の出力となる。
Figure 0005788873
実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、MMSE STSA法における抑圧係数を1に設定したとき、又はSS法においてゼロを減算したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式(3)に示すハニング窓を用いることができる。
Figure 0005788873
このほかにも、ハミング窓、ケイザー窓、ブラックマン窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部123に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトルarg Yn(k)は、逆変換部4に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部3に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
[逆変換部の構成]
図11は、逆変換部4の構成を示すブロック図である。図11に示すように、逆変換部4は逆フーリエ変換部143、窓がけ処理部142、及び、フレーム合成部141を含む。逆フーリエ変換部143は、雑音抑圧部3から供給された強調信号振幅スペクトルと変換部2から供給された劣化信号位相スペクトルarg Yn(k)とを乗算して、強調信号(以下の式(4)の左辺)を求める。
Figure 0005788873
逆フーリエ変換部143は、得られた強調信号に逆フーリエ変換を施す。逆フーリエ変換された強調信号は、1フレームがKサンプルを含む時間領域サンプル値系列xn(t)(t=0,1,...,K−1)として、窓がけ処理部142に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t)(t=0,1,...,K/2−1)に対してw(t)で窓がけされた信号は、次式(5)の左辺で与えられる。
Figure 0005788873
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。フレーム長の50%をオーバラップ長として仮定すれば、t=0,1,...,K/2−1に対して、以下の式の左辺が、窓がけ処理部142の出力となり、フレーム合成部141に伝達される。
Figure 0005788873
フレーム合成部141は、窓がけ処理部142からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0,1,...,K−1における出力信号(式(7)の左辺)を得る。得られた出力信号は、フレーム合成部141から出力端子5に伝達される。
Figure 0005788873
なお、図10と図11において変換部2と逆変換部4における変換をフーリエ変換として説明したが、変換部2と逆変換部4は、フーリエ変換に代えて、コサイン変換、修正コサイン変換、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。例えば、コサイン変換や修正コサイン変換は、変換結果として振幅だけしか得ないため、図9における変換部2から逆変換部4に至る経路は不要になる。また、雑音情報記憶部6に記録する雑音情報は振幅(又はパワー)だけとなるため、記憶容量の削減、雑音抑圧処理における演算量の削減に貢献する。ハール変換は乗算を不要とし、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるため、雑音抑圧効果の向上が期待できる。
また、変換部2が周波数成分を複数統合してから、雑音抑圧部3が実際の抑圧を行うこともできる。その際、変換部2は、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することにより、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧が実行されることで、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量が削減される。
[雑音抑圧部の処理]
雑音抑圧部3においては、様々な抑圧を行うことが可能である。抑圧方法には、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean−Square Error Short−Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とがある。SS法は、雑音情報を、変換部2から供給された劣化信号振幅スペクトルから減算する。MMSE STSA法は、雑音情報と変換部2から供給された劣化信号振幅スペクトルとを用いて、複数の周波数成分それぞれに対して抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
雑音抑圧部3は、雑音の抑圧に際しては、過剰な抑圧を避けるために、フロアリングを適用することができる。フロアリングとは、最大抑圧量を超える抑圧を避ける方法であり、フロアリングパラメータが最大抑圧量を決定する。SS法は、補正雑音情報を劣化信号振幅スペクトルから減算した結果が、フロアリングパラメータより小さくならないように制約をかける。具体的には、SS法は、減算結果がフロアリングパラメータよりも小さいときには、減算結果をフロアリングパラメータで置換する。また、MMSE STSA法は、補正雑音情報と劣化信号振幅スペクトルから求めた抑圧係数が、フロアリングパラメータよりも小さいときに、抑圧係数をフロアリングパラメータで置換する。フロアリングの詳細に関しては、文献「M.Berouti,R.Schwartz and J.Makhoul,″Enhancement of speech corrupted by acoustic noise,″Proceedings of ICASSP’79,pp.208−−211,Apr.1979」に開示されている。雑音抑圧部3は、フロアリングパラメータを導入することによって、過剰な抑圧を生じることがなく、強調信号の歪が大きくなることを防止することができる。
雑音抑圧部3は、雑音情報の周波数成分数を劣化信号スペクトルの周波数成分数よりも小さく設定することもできる。このとき、複数の雑音情報が複数の周波数成分に対して共用される。劣化信号スペクトルと雑音情報の双方に対して、複数の周波数成分を統合する場合と比べて、劣化信号スペクトルの周波数分解能が高いので、雑音抑圧部3は、周波数成分の統合が全くない場合よりも少ない演算量で、高い音質を達成することができる。劣化信号スペクトルの周波数成分数よりも少ない周波数成分数の雑音情報を用いた抑圧の詳細は、特開2008−203879号に開示されている。
(第10実施形態)
本発明の第10実施形態について、図12を用いて説明する。第9実施形態と比べた場合、本実施形態に係る雑音抑圧部3に、雑音抑圧結果がフィードバックされている点で異なる。他の構成は第9実施形態と同様であるため、ここでは同じ構成については同じ符号を付してその説明を省略する。
本実施形態において、雑音抑圧部3は、雑音抑圧結果としての強調信号振幅スペクトルに基づいた倍率係数を抑圧すべき雑音の雑音情報(例えば利得)に乗算することにより雑音情報を補正する。
雑音抑圧部3は、帰還(feedback)された雑音抑圧結果を用いて倍率係数を更新するときには、所望信号が入力されていないタイミングでの雑音抑圧結果が大きいほど(抑圧されずに残った雑音が大きいほど)補正後の雑音情報が大きくなるように、倍率係数を更新する。所望信号が入力されていないタイミングでの雑音抑圧結果が大きいということは、抑圧が不十分であることを示し、倍率係数を変更することによって補正後の雑音情報を大きくすることが望ましいからである。補正後の雑音情報が大きいときには、SS法では減算する値が大きくなり、雑音抑圧結果は小さくなる。また、MMSE STSA法のような乗算型の抑圧では、抑圧係数の計算に用いる信号対雑音比の推定値が小さくなり、小さな抑圧係数が得られる。これは、より強力な雑音抑圧をもたらす。倍率係数を更新するにあたって、複数の方法が考えられる。例として、再計算法及び逐次更新法について説明する。
雑音抑圧結果としては、雑音が完全に抑圧された状態が理想である。このため、雑音抑圧部3は、例えば、劣化信号の振幅又はパワーが小さいときに、雑音が完全に抑圧されるように、倍率係数を再計算又は逐次更新することができる。劣化信号の振幅又はパワーが小さいときには、抑圧しようとする雑音以外の信号のパワーも小さい確率が高いからである。雑音抑圧部3は、劣化信号の振幅又はパワーが小さいことを、劣化信号の振幅又はパワーが閾値よりも小さいことを用いて検出できる。
また、雑音抑圧部3は、劣化信号の振幅又はパワーが小さいことを、劣化信号の振幅又はパワーと記憶部311に記録されている雑音情報との差分が、閾値より小さいことを用いても検出できる。すなわち、雑音抑圧部3は、劣化信号の振幅又はパワーが雑音情報と似ているときに、劣化信号における雑音情報の占有率が高い(信号対雑音比が低い)ことを利用する。特に、雑音抑圧部3は、複数の周波数点における情報を複合的に用いることにより、スペクトル概形を比較することが可能となり、検出精度を高くすることができる。
SS法における倍率係数は、各周波数において、補正雑音情報が、所望信号が入力されていないタイミングでの劣化信号スペクトルに等しくなるように、再計算される。言い換えれば、雑音抑圧部3は、雑音だけが入力された時点で変換部2から供給された劣化信号振幅スペクトル|Yn(k)|と、倍率係数αnと雑音情報ν(k)との積が一致するように倍率係数αnを求める。ここでnはフレーム番号、kは、周波数番号である。すなわち、倍率係数αn(k)は次式(8)で計算される。
αn(k)=|Yn(k)|/νn(k) ・・・(8)
一方、SS法における倍率係数の逐次更新は、各周波数において、所望信号が入力されていないタイミングでの強調信号振幅スペクトルがゼロに近づくように、倍率係数を少しずつ更新する。雑音抑圧部3は、逐次更新に最小二乗平均(Least Squares Method,LMS)アルゴリズムを用いる場合には、n番目フレーム、周波数番号kの誤差en(k)を用いて、αn+1(k)を次式(9)で計算する。
αn+1(k)=αn(k)+μen(k)/νn(k)・・・(9)
ただし、μはステップサイズと呼ばれる微小定数である。
雑音抑圧部3は、計算して得られた倍率係数αn(k)を直ちに利用するときには、数式(9)の代わりに以下の数式(10)を用いる。
αn(k)=αn−1(k)+μen(k)/νn(k)・・・(10)
すなわち、雑音抑圧部3は、現在の誤差を用いて現在の倍率係数αn(k)を計算し、直ちに適用する。雑音抑圧部3は、倍率係数を直ちに更新することにより、リアルタイムで高精度の雑音抑圧を実現できる。
雑音抑圧部3は、正規化最小二乗平均(Normalized Least Squares Method,NLMS)アルゴリズムを用いる場合には、上述の誤差en(k)を用いて、倍率係数αn+1(k)を次式(11)で計算する。
αn+1(k)=αn(k)+μen(k)νn(k)/σn(k)・・・(11)
σn(k)は、雑音情報νn(k)の平均パワーであり、FIRフィルタに基づく平均(スライド窓を用いた移動平均)やIIRフィルタに基づく平均(漏れ積分)などを用いて計算できる。
また、雑音抑圧部3は、摂動法を用いて、以下の式(12)によって倍率係数αn+1(k)を計算しても良い。
αn+1(k)=αn(k)+μen(k)・・・(12)
また、雑音抑圧部3は、誤差の符号だけ表わす符号関数sgn{en(k)}を用いて、以下の式(13)によって倍率係数αn+1(k)を計算しても良い。
αn+1(k)=αn(k)+μ・sgn{en(k)}・・・(13)
同様に、雑音抑圧部3は、最小二乗アルゴリズム(Least Squares,LS)アルゴリズムやその他の適応アルゴリズムを用いてもよい。また、雑音抑圧部3は、更新した倍率係数を直ちに適用することも可能であり、数式(9)から数式(10)への変更を参照して、数式(11)〜数式(13)を変形して、倍率係数をリアルタイム更新してもよい。
MMSE STSA法は、倍率係数を逐次更新する。雑音抑圧部3は、各周波数において、数式(8)から数式(13)を用いて説明した方法と同様の方法で、倍率係数αn(k)を更新する。
上述した倍率係数の更新方法としての再計算法と逐次更新法について、再計算法は追従速度が速く、逐次更新法は精度が高いという特徴がある。これらの特徴を活かすために、雑音抑圧部3は、最初は再計算法を用い、後に逐次更新法を用いる、というように更新方法を変更することも可能である。雑音抑圧部3は、更新方法の変更のタイミングを決定するにあたり、倍率係数が最適値に十分近くなったことを条件として更新方法を変更することもできる。また、例えば、雑音抑圧部3は、予め定められた時間が経過したときに更新方法を変更してもよい。またさらに、雑音抑圧部3は、倍率係数の補正量が予め定められた閾値よりも小さくなったときに変更することもできる。
以上、本実施形態によれば、雑音抑圧に用いられる雑音情報を雑音抑圧結果に基づいて更新するので、未知な雑音を含む多種多様な雑音を抑圧することができる。
(第11実施形態)
本発明の第11実施形態について、図13を用いて説明する。第11実施形態としての情報処理装置に含まれる雑音抑圧部3には、入力端子9から、入力した劣化信号中に既知雑音が存在するか否かを示す情報(既知雑音存在情報)が供給される。図5乃至図8の例では、選択部535または混合部735に既知雑音存在情報を供給し、選択部535または混合部735は既知雑音存在情報に応じて選択または混合を行なう。
これにより、特定の雑音が存在しているタイミングで、確実に雑音を抑圧することができる。
(第12実施形態)
本発明の第12実施形態について、図14を用いて説明する。第12実施形態としての情報処理装置に含まれる雑音抑圧部3には、所望信号存在判定部8からの出力が供給される。所望信号存在判定部8には、変換部2からの劣化信号振幅スペクトルが伝達され、そこで、劣化信号振幅スペクトルを解析し、所望信号が存在するか否か、或いは、どの程度存在するのかを判定する。図5乃至図8の例では、選択部535または混合部735に所望信号存在判定部8からの出力が供給され、選択部535または混合部735は、供給された判定結果に応じて選択または混合を行なう。
本実施形態によれば、劣化信号中の雑音の割合に応じて雑音の抑圧を行なうので、結果的により精度の高い雑音抑圧結果を得ることができる。
(他の実施形態)
以上説明してきた第1乃至第12実施形態は、それぞれ別々の特徴を持つ情報処理装置について説明したが、それらの特徴を如何様に組み合わせた情報処理装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されても良いし、単体の装置に適用されても良い。さらに、本発明は、実施形態の機能を実現するソフトウェアの信号処理プログラムが、システム或いは装置に直接或いは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、或いはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWWサーバも、本発明の範疇に含まれる。
図15は、第1実施形態を信号処理プログラムにより構成した場合に、その信号処理プログラムを実行するコンピュータ1500の構成図である。コンピュータ1500は、入力部1501と、CPU1502と、雑音情報記憶部1503と、出力部1504と、メモリ1505とを含む。
CPU1502は、メモリ1505に格納された信号処理プログラムを読み込むことにより、コンピュータ1500全体の動作を制御する。すなわち、信号処理プログラムを実行したCPU1502は、既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する(S1521)。次に、CPU1502は、未知の性質を有する未知雑音を抑圧するため、未知雑音を推定して未知雑音情報を出力する(S1522)。更に、CPU1502は、既知雑音情報と未知雑音情報とを用いて入力部1501で入力された劣化信号に含まれた雑音を抑圧し(S1523)、出力部1504から強調信号を出力する。これにより、第1実施形態と同様の効果を得ることができる。
[実施形態の他の表現]
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
入力された劣化信号に含まれた雑音を抑圧する雑音抑圧手段を備えた情報処理装置であって、
前記雑音抑圧手段は、
既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力手段と、
未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力する第2出力手段と、
を含み、前記既知雑音情報と前記未知雑音情報とを用いて雑音抑圧処理を行なうことを特徴とする情報処理装置。
(付記2)
前記雑音抑圧手段は、
前記第1出力手段から出力された既知雑音情報を用いて雑音抑圧処理を行なった信号に対して、前記第2出力手段から出力された未知雑音情報を用いて更に雑音抑圧処理を加えることを特徴とする付記1に記載の情報処理装置。
(付記3)
前記第2出力手段は、入力された前記劣化信号に基づいて、前記未知雑音を推定することを特徴とする付記1または2に記載の情報処理装置。
(付記4)
前記第1出力手段は、入力された前記劣化信号に基づいて、記憶した前記雑音情報から既知雑音情報を生成することを特徴とする付記1、2または3に記載の情報処理装置。
(付記5)
前記雑音抑圧手段は、
前記第1出力手段から出力された前記既知雑音情報及び前記第2出力手段から出力された前記未知雑音情報の何れか一方を選択する選択手段を更に含み、
前記選択手段によって選択された雑音情報を用いて、雑音抑圧処理を行なうことを特徴とする付記1に記載の情報処理装置。
(付記6)
前記選択手段は、
前記劣化信号に基づいて、前記既知雑音情報及び前記未知雑音情報の何れか一方を選択することを特徴とする付記5に記載の情報処理装置。
(付記7)
前記雑音抑圧手段は、
前記第1出力手段から出力された前記既知雑音情報及び前記第2出力手段から出力された前記未知雑音情報を混合する混合手段を更に含み、
前記混合手段による混合によって生成された混合雑音情報を用いて、雑音抑圧処理を行なうことを特徴とする付記1に記載の情報処理装置。
(付記8)
前記混合手段は、
前記劣化信号に基づいて、前記既知雑音情報及び前記未知雑音情報を混合することを特徴とする付記7に記載の情報処理装置。
(付記9)
入力した音声信号をスペクトルに変換して前記劣化信号を生成する変換手段と、
前記雑音抑圧手段によって雑音を抑圧されたスペクトルを逆変換して出力する音声信号を生成する逆変換手段と、
を更に備えたことを特徴とする付記1乃至8の何れかに記載の情報処理装置。
(付記10)
前記第1出力手段は、前記雑音抑圧手段による抑圧結果に応じて、既知雑音情報を補正して出力することを特徴とする付記1乃至9の何れかに記載の情報処理装置。
(付記11)
劣化信号中に抑圧すべきでない所望信号がどの程度存在するか否かを判定する判定手段を更に有し、
前記雑音抑圧手段は、前記判定手段による判定結果に応じて雑音抑圧処理を行なうことを特徴とする付記1乃至10の何れかに記載の情報処理装置。
(付記12)
入力された劣化信号に含まれた雑音を抑圧する信号処理方法であって、
既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力し、
未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力し、
前記既知雑音情報と前記未知雑音情報とを用いて前記劣化信号に含まれた雑音を抑圧することを特徴とする信号処理方法。
(付記13)
入力された劣化信号に含まれた雑音を抑圧する信号処理プログラムであって、
既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力ステップと、
未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力する第2出力ステップと、
前記既知雑音情報と前記未知雑音情報とを用いて前記劣化信号に含まれた雑音を抑圧する雑音抑圧ステップと、
をコンピュータに実行させることを特徴とする信号処理プログラム。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解しうる様々な変更をすることができる。
この出願は、2010年5月25日に出願された日本出願特願2010−119495を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (13)

  1. 入力された劣化信号に含まれた既知の雑音と、該既知の雑音とともに存在する未知の雑音を抑圧するための雑音抑圧手段を備え、
    前記雑音抑圧手段は、
    既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力手段と、
    未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力する第2出力手段と、
    を含み、前記既知雑音情報と前記未知雑音情報とを用いて雑音抑圧処理を行なう情報処理装置。
  2. 前記雑音抑圧手段は、
    前記第1出力手段から出力された既知雑音情報を用いて雑音抑圧処理を行なった信号に対して、前記第2出力手段から出力された未知雑音情報を用いて更に雑音抑圧処理を加える請求項1に記載の情報処理装置。
  3. 前記第2出力手段は、入力された前記劣化信号に基づいて、前記未知雑音を推定する請求項1または2に記載の情報処理装置。
  4. 前記第1出力手段は、入力された前記劣化信号に基づいて、記憶した前記雑音情報から既知雑音情報を生成する請求項1、2または3に記載の情報処理装置。
  5. 前記雑音抑圧手段は、
    前記第1出力手段から出力された前記既知雑音情報及び前記第2出力手段から出力された前記未知雑音情報の何れか一方を選択する選択手段を更に含み、
    前記選択手段によって選択された雑音情報を用いて、雑音抑圧処理を行なう請求項1に記載の情報処理装置。
  6. 前記選択手段は、
    前記劣化信号に基づいて、前記既知雑音情報及び前記未知雑音情報の何れか一方を選択する請求項5に記載の情報処理装置。
  7. 前記雑音抑圧手段は、
    前記第1出力手段から出力された前記既知雑音情報及び前記第2出力手段から出力された前記未知雑音情報を混合する混合手段を更に含み、
    前記混合手段による混合によって生成された混合雑音情報を用いて、雑音抑圧処理を行なう請求項1に記載の情報処理装置。
  8. 前記混合手段は、
    前記劣化信号に基づいて、前記既知雑音情報及び前記未知雑音情報を混合する請求項7に記載の情報処理装置。
  9. 入力した劣化信号をスペクトルに変換して前記劣化信号を生成する変換手段と、
    前記雑音抑圧手段によって雑音を抑圧されたスペクトルを逆変換して出力する強調信号を生成する逆変換手段と、
    を更に備える請求項1乃至8の何れか1項に記載の情報処理装置。
  10. 前記第1出力手段は、前記雑音抑圧手段による抑圧結果に応じて、既知雑音情報を補正して出力する請求項1乃至9の何れか1項に記載の情報処理装置。
  11. 劣化信号中に抑圧すべきでない所望信号がどの程度存在するか否かを判定する判定手段を更に有し、
    前記雑音抑圧手段は、前記判定手段による判定結果に応じて雑音抑圧処理を行なう請求項1乃至10の何れか1項に記載の情報処理装置。
  12. 入力された劣化信号に含まれた既知の雑音と、該既知の雑音とともに存在する未知の雑音を抑圧するための信号処理方法であって、
    既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力し、
    未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力し、
    前記既知雑音情報と前記未知雑音情報とを用いて、入力された劣化信号に含まれた雑音を抑圧する信号処理方法。
  13. 入力された劣化信号に含まれた既知の雑音と、該既知の雑音とともに存在する未知の雑音を抑圧するための信号処理プログラムであって、
    既知の性質を有する既知雑音を抑圧するため、予め記憶された雑音情報を用いて既知雑音情報を出力する第1出力ステップと、
    未知の性質を有する未知雑音を抑圧するため、前記未知雑音を推定して、未知雑音情報を出力する第2出力ステップと、
    前記既知雑音情報と前記未知雑音情報とを用いて、入力された劣化信号に含まれた雑音を抑圧する雑音抑圧ステップと、
    をコンピュータに実行させる信号処理プログラム。
JP2012517235A 2010-05-25 2011-05-13 信号処理方法、情報処理装置、及び信号処理プログラム Active JP5788873B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012517235A JP5788873B2 (ja) 2010-05-25 2011-05-13 信号処理方法、情報処理装置、及び信号処理プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010119495 2010-05-25
JP2010119495 2010-05-25
JP2012517235A JP5788873B2 (ja) 2010-05-25 2011-05-13 信号処理方法、情報処理装置、及び信号処理プログラム
PCT/JP2011/061598 WO2011148861A1 (ja) 2010-05-25 2011-05-13 信号処理方法、情報処理装置、及び信号処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2011148861A1 JPWO2011148861A1 (ja) 2013-07-25
JP5788873B2 true JP5788873B2 (ja) 2015-10-07

Family

ID=45003851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012517235A Active JP5788873B2 (ja) 2010-05-25 2011-05-13 信号処理方法、情報処理装置、及び信号処理プログラム

Country Status (5)

Country Link
US (1) US20130077802A1 (ja)
EP (2) EP2579255B1 (ja)
JP (1) JP5788873B2 (ja)
CN (1) CN102918592A (ja)
WO (1) WO2011148861A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
US9837097B2 (en) 2010-05-24 2017-12-05 Nec Corporation Single processing method, information processing apparatus and signal processing program
WO2014136629A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US9484043B1 (en) * 2014-03-05 2016-11-01 QoSound, Inc. Noise suppressor
CN103971681A (zh) * 2014-04-24 2014-08-06 百度在线网络技术(北京)有限公司 一种语音识别方法及系统
CN106910511B (zh) * 2016-06-28 2020-08-14 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN113311227B (zh) * 2021-06-10 2022-06-24 中国科学技术大学先进技术研究院 一种用于故障电弧诊断技术的电流信号降噪方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002314637A (ja) * 2001-04-09 2002-10-25 Denso Corp 雑音低減装置
JP2003284181A (ja) * 2002-03-20 2003-10-03 Matsushita Electric Ind Co Ltd 集音装置
JP2005292812A (ja) * 2004-03-09 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体
JP2007241157A (ja) * 2006-03-13 2007-09-20 Nec Access Technica Ltd 雑音除去機能を有する音声入力装置および方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3451146B2 (ja) 1995-02-17 2003-09-29 株式会社日立製作所 スペクトルサブトラクションを用いた雑音除去システムおよび方法
SG77611A1 (en) * 1997-11-13 2001-01-16 Univ Singapore Acoustic echo cancellation equipped with howling suppressor and double-talk detector
US6240180B1 (en) * 1997-11-14 2001-05-29 Tellabs Operations, Inc. Echo canceller employing dual-H architecture having split adaptive gain settings
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7617099B2 (en) * 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
EP1376539B8 (en) * 2001-03-28 2010-12-15 Mitsubishi Denki Kabushiki Kaisha Noise suppressor
JP4027172B2 (ja) * 2001-08-24 2007-12-26 キヤノン株式会社 記録装置
US6904146B2 (en) * 2002-05-03 2005-06-07 Acoustic Technology, Inc. Full duplex echo cancelling circuit
US7433475B2 (en) * 2003-11-27 2008-10-07 Canon Kabushiki Kaisha Electronic device, video camera apparatus, and control method therefor
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
JP2006279185A (ja) 2005-03-28 2006-10-12 Casio Comput Co Ltd 撮像装置、音声記録方法及びプログラム
CN101091209B (zh) 2005-09-02 2010-06-09 日本电气株式会社 抑制噪声的方法及装置
US8189766B1 (en) * 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002314637A (ja) * 2001-04-09 2002-10-25 Denso Corp 雑音低減装置
JP2003284181A (ja) * 2002-03-20 2003-10-03 Matsushita Electric Ind Co Ltd 集音装置
JP2005292812A (ja) * 2004-03-09 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体
JP2007241157A (ja) * 2006-03-13 2007-09-20 Nec Access Technica Ltd 雑音除去機能を有する音声入力装置および方法

Also Published As

Publication number Publication date
EP2579255A1 (en) 2013-04-10
EP2767978B1 (en) 2017-03-15
US20130077802A1 (en) 2013-03-28
EP2767978A1 (en) 2014-08-20
EP2579255A4 (en) 2013-10-30
WO2011148861A1 (ja) 2011-12-01
CN102918592A (zh) 2013-02-06
EP2579255B1 (en) 2014-11-26
JPWO2011148861A1 (ja) 2013-07-25

Similar Documents

Publication Publication Date Title
JP5867389B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP5788873B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP5310494B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP6064600B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP6070953B2 (ja) 信号処理装置、信号処理方法、及び記憶媒体
JP5294085B2 (ja) 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP5787126B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6011536B2 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
WO2011055829A1 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6119604B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150730

R150 Certificate of patent or registration of utility model

Ref document number: 5788873

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350