WO2011055830A1 - 信号処理方法、情報処理装置、及び信号処理プログラム - Google Patents

信号処理方法、情報処理装置、及び信号処理プログラム Download PDF

Info

Publication number
WO2011055830A1
WO2011055830A1 PCT/JP2010/069870 JP2010069870W WO2011055830A1 WO 2011055830 A1 WO2011055830 A1 WO 2011055830A1 JP 2010069870 W JP2010069870 W JP 2010069870W WO 2011055830 A1 WO2011055830 A1 WO 2011055830A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
impact sound
information
unit
noise
Prior art date
Application number
PCT/JP2010/069870
Other languages
English (en)
French (fr)
Inventor
昭彦 杉山
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to CN201080050832.4A priority Critical patent/CN102612711B/zh
Priority to EP10828388.8A priority patent/EP2500902B1/en
Priority to US13/508,694 priority patent/US9042576B2/en
Publication of WO2011055830A1 publication Critical patent/WO2011055830A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

 劣化信号中の衝撃音を十分に抑圧すること。 劣化信号中の衝撃音を抑圧する。そのために、劣化信号中において衝撃音を検出する。そして、検出された衝撃音の位相情報を、位相情報の変化量が小さくなるように劣化信号中の衝撃音以外の信号の位相情報で処理することを特徴とする。

Description

信号処理方法、情報処理装置、及び信号処理プログラム
 本発明は、劣化信号中の雑音を抑圧して所望の信号を強調するための信号処理技術に関する。
 劣化信号(所望の信号に雑音が重畳された信号)から、雑音を抑圧し、強調信号(所望の信号を強調した信号)を出力する雑音抑圧技術(noise suppressing technology)が知られている。例えば、ノイズサプレッサは、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムであり、携帯電話など様々な音声端末において利用されている。
 この種の技術に関し、特許文献1には、入力信号に1より小さな抑圧係数を乗算することによって、ノイズを抑圧する方法が開示されている。また、特許文献2には、推定された雑音を劣化信号から直接減算することによって、雑音を抑圧する方法が開示されている。しかし、特許文献1及び2に記載の技術は、雑音の推定に平均操作が含まれており、衝撃音のような突発的な雑音を十分に抑圧することができない。
 これに対し、非特許文献1は、劣化信号パワースペクトルの平坦度と過去からの増分に基づいて衝撃音を検出する雑音抑圧システムを開示している。非特許文献1に記載のシステムは、非音声区間で衝撃音が検出されなかったときに、背景雑音を推定する。非特許文献1に記載のシステムは、非音声区間で衝撃音が検出されたときには、劣化信号を背景雑音の推定値で置換することで衝撃音を抑圧し、劣化信号と背景雑音との差を用いて衝撃音推定値を更新する。非特許文献1に記載のシステムは、音声区間で衝撃音が検出されたときには、衝撃音推定値を劣化信号から減算することで衝撃音を抑圧する。
特許第4282227号 特開平8−221092号
A.Sugiyama,Single−channel impact−noise suppression with no auxiliary information for its detection,″Proceedings of WASPAA2007,pp.127−−130,Oct.2007.
 しかしながら、上述の非特許文献1に開示された構成では、位相に関して衝撃音抑圧処理を適用しておらず、位相の不連続性がそのまま存在した。その結果、ユーザにとって、衝撃音の抑圧が十分に感じられない場合があった。
 以上を踏まえ、本発明は、上述の課題を解決する信号処理技術を提供することを目的とする。
 上記目的を達成するため、本発明に係る信号処理方法は、劣化信号中の衝撃音を抑圧するために、前記劣化信号中において衝撃音を検出し、検出された衝撃音の位相情報を、位相情報の変化量が小さくなるように前記劣化信号中の前記衝撃音以外の信号の位相情報で処理する。
 上記目的を達成するため、本発明に係る情報処理装置は、劣化信号中の衝撃音を抑圧する情報処理装置であって、前記劣化信号中において衝撃音を検出する検出手段と、検出された衝撃音の位相情報を、前記劣化信号中の前記衝撃音以外の信号の位相情報で処理する位相処理手段と、を備える。
 上記目的を達成するため、本発明に係るプログラム記録媒体に格納される信号処理プログラムは、劣化信号中の衝撃音を抑圧する信号処理プログラムであって、コンピュータに、前記劣化信号中において衝撃音を検出する工程と、検出された衝撃音の位相情報を、前記劣化信号中の前記衝撃音以外の信号の位相情報を用いて処理する工程と、を実行させる。
 本発明によれば、劣化信号中の位相情報に関して衝撃音抑圧処理を適用することにより、位相に起因する信号の不連続性を低減し、衝撃音を十分に抑圧することができる。
本発明の第1実施形態としての雑音抑圧装置100の概略構成を示すブロック図。 本発明の第1実施形態としての雑音抑圧装置100に含まれる変換部2の構成を示すブロック図。 本発明の第1実施形態としての雑音抑圧装置100に含まれる逆変換部4の構成を示すブロック図。 本発明の第1実施形態としての雑音抑圧装置100に含まれる衝撃音抑圧部11の構成を示すブロック図。 本発明の第2実施形態としての雑音抑圧装置100に含まれる衝撃音検出部10の構成を示すブロック図。 本発明の第3実施形態としての雑音抑圧装置300の概略構成を示すブロック図。 本発明の第3実施形態としての雑音抑圧装置300に含まれる衝撃音抑圧部12の構成を示すブロック図。 本発明の第4実施形態としての雑音抑圧装置400の概略構成を示すブロック図。 本発明の第5実施形態としての雑音抑圧装置に含まれる衝撃音抑圧部52の構成を示すブロック図。 本発明の第6実施形態としての雑音抑圧装置の概略構成を示すブロック図。 本発明の第6実施形態としての雑音抑圧装置に含まれる衝撃音抑圧部62の構成を示すブロック図。 本発明の第7実施形態としての雑音抑圧装置に含まれる衝撃音抑圧部72の構成を示すブロック図。 本発明の第8実施形態としての雑音抑圧装置800の概略構成を示すブロック図。 本発明の第9実施形態としての雑音抑圧装置900の概略構成を示すブロック図。 本発明の第10実施形態としての雑音抑圧装置1000の概略構成を示すブロック図。 本発明の他の実施形態としての信号処理プログラムを実行するコンピュータ1100の概略構成図。 雑音抑圧装置100の別の構成例を示すブロック図。
 以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
 なお、本明細書中の「雑音」は、処理対象となる情報以外の不要な情報一般を示し、音に限定されるものではない。また、本明細書中の「衝撃音」は、雑音の一種であり、短時間に急激な変化を示す情報一般を示し、音に限定されるものではない。
 (第1実施形態)
 <全体構成>
 本発明に係る信号処理方法を実現する第1実施形態として、雑音抑圧装置について説明する。図1は、雑音抑圧装置100の全体構成を示すブロック図である。図16は、雑音抑圧装置100の別の構成例を示すブロック図である。雑音抑圧装置100は、例えばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能するが、本発明はこれに限定されるものではなく、入力信号からのノイズ除去を要求されるあらゆる情報処理装置に適用可能である。
 入力端子1には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子1に供給された劣化信号は、変換部2においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分のうち、振幅は振幅スペクトルとして多重化され、衝撃音検出部10と逆変換部4に伝達される。一方、位相は、位相スペクトルとして衝撃音抑圧部11へ供給される。
 衝撃音検出部10は、劣化信号スペクトルの周波数特性と時間特性に基づいて、衝撃音の存在を検出する。衝撃音検出部10は、検出に当って、周波数特性と時間特性のいずれかを用いてもよいし、双方を用いてもよい。また、双方を用いる際に、衝撃音検出部10は、それぞれの特性評価結果の重み付き和またはより複雑な関数で表現される統合結果を用いることもできる。衝撃音抑圧部11は、変換部2から供給された劣化信号に対し、衝撃音検出部10から供給された衝撃音検出情報に基づいて、各周波数で衝撃音を抑圧し、衝撃音抑圧結果を強調信号位相スペクトルとして逆変換部4に伝達する。
 逆変換部4は、衝撃音抑圧部11から供給された強調信号位相スペクトルと変換部2から供給された劣化信号振幅スペクトルとを合わせて逆変換を行い、強調信号サンプルとして、出力端子5に供給する。
 <変換部2の構成>
 図2は、変換部2の構成を示すブロック図である。図2に示すように、変換部2はフレーム分割部21、窓がけ処理部(windowing unit)22、及びフーリエ変換部23を含む。劣化信号サンプルは、フレーム分割部21に供給され、K/2サンプル毎のフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部22に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t)(t=0,1,...,K/2−1)に対するw(t)で窓がけ(windowing)された信号は、次式(1)で与えられる。
Figure JPOXMLDOC01-appb-M000001
 また、窓がけ処理部22は、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0,1,...,K/2−1に対して、以下の式(2)で得られる左辺が、窓がけ処理部22の出力となる。
Figure JPOXMLDOC01-appb-M000002
 窓がけ処理部22は、実数信号に対しては、左右対称窓関数を用いてもよい。また、窓関数は、MMSE STSA法における抑圧係数を1に設定したとき、又はSS法においてゼロを減算したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1となることを意味する。
 以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。窓かけ処理部22は、w(t)として、例えば、次式(3)に示すハニング窓を用いてもよい。
Figure JPOXMLDOC01-appb-M000003
 このほかにも、ハミング窓、ケイザー窓、ブラックマン窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部23に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトルarg Yn(k)は衝撃音抑圧部11に、劣化信号振幅スペクトル|Yn(k)|は衝撃音検出部10と逆変換部4に供給される。既に説明したように、変換部2は、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
 <逆変換部4の構成>
 図3は、逆変換部4の構成を示すブロック図である。図3に示すように、逆変換部4は逆フーリエ変換部43、窓がけ処理部42、及び、フレーム合成部41を含む。逆フーリエ変換部43は、衝撃音抑圧部11から供給された強調信号位相スペクトルと変換部2から供給された劣化信号振幅スペクトルとを組み合わせて、強調信号(以下の式(4)の左辺)を求める。
Figure JPOXMLDOC01-appb-M000004
 逆フーリエ変換部43は、得られた強調信号に逆フーリエ変換を施す。逆フーリエ変換された強調信号は、1フレームがKサンプルを含む時間領域サンプル値系列xn(t)(t=0,1,...,K−1)として、窓がけ処理部42に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t)(t=0,1,...,K/2−1)に対してw(t)で窓がけされた信号は、次式(5)の左辺で与えられる。
Figure JPOXMLDOC01-appb-M000005
 また、窓がけ処理部42は、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0,1,...,K/2−1に対して、以下の式の左辺が、窓がけ処理部42の出力となり、フレーム合成部41に伝達される。
Figure JPOXMLDOC01-appb-M000006
 フレーム合成部41は、窓がけ処理部42からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0,1,...,K−1における出力信号(式(7)の左辺)を得る。得られた出力信号は、フレーム合成部41から出力端子5に伝達される。
Figure JPOXMLDOC01-appb-M000007
 なお、図2と図3において変換部2と逆変換部4における変換をフーリエ変換として説明した。変換部2、逆変換部4は、フーリエ変換に代えて、コサイン変換、修正コサイン変換、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。例えば、コサイン変換や修正コサイン変換は、変換結果として振幅だけしか得られない。このため、図1における変換部2から逆変換部4に至る経路は不要になる。また、雑音情報記憶部6に記録する雑音情報も、振幅(又はパワー)だけとなり、記憶容量の削減、雑音抑圧処理における演算量の削減に貢献する。変換部2、逆変換部4がハール変換を用いた場合には、乗算が不要となり、LSI化したときの面積を小さくすることができる。変換部2、逆変換部4がウェーブレット変換を用いた場合には、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
 また、変換部2が周波数成分を複数統合してから、衝撃音抑圧部11が実際の抑圧を行うこともできる。その際、変換部2は、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することにより、高い音質を達成することができる。このように、複数の周波数成分を統合してから衝撃音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、雑音抑圧装置100は、全体の演算量を削減することができる。
 <衝撃音抑圧部11の構成>
 図4は、衝撃音抑圧部11の内部構成を示すブロック図である。図4に示すように、衝撃音抑圧部11は、遅延部111と合成部112とを含む。遅延部111は、入力である劣化信号位相スペクトルを遅延させる。遅延量は一つである必要はなく、遅延部111は、複数の遅延量で入力を遅延して、複数の遅延信号を生成することもできる。合成部112は、劣化信号位相スペクトルと遅延部111から供給される遅延した劣化信号位相スペクトルを用いて、強調信号位相スペクトルを合成する。
 合成部112は、位相処理を、衝撃音検出部10から衝撃音の検出が伝達されたときだけ行う。合成部112は、位相処理として、過去(衝撃音発生前)の値を用いて、以下の数式(8)に示す処理を位相に適用することができる。
Figure JPOXMLDOC01-appb-M000008
 ここで、Nは周波数の範囲を、Mはフレーム番号の範囲を表わし、clpは周波数p、lフレーム前の劣化信号位相スペクトルに対する係数を表わす。
 すなわち、合成部112は、周波数範囲k−N/2からk+N/2、フレーム番号nからn−M+1の範囲にある劣化信号位相スペクトルの線形結合で、強調信号の位相を計算する。最も簡単な例が、各周波数における1フレーム前の位相との平均である。或いは、合成部112は、1フレーム前の位相と同じ位相を適用(置換)しても良い。これにより、現在の位相そのものよりも過去の位相との差が小さくなり、衝撃音として知覚されにくくなる。この考え方を拡張すると、衝撃音抑圧部11は、信号全体を遅延させ、衝撃音に続く未来の信号成分の位相を、過去の信号成分の位相と同様に用いて、位相の変化を抑圧することによって、衝撃音抑圧効果を向上させることもできる。この位相処理による衝撃音抑圧効果は非常に大きく、パワー制御や振幅制御を行なわなくても、位相処理だけで、衝撃音抑圧効果を得ることができる。
 さらに、衝撃音抑圧部11は、位相に過去の値とは無関係な成分を加算することもできる。このような成分の例としては、ランダム位相がある。さらに、衝撃音抑圧部11は、ランダム位相が45度以下であるというように、ランダム位相の範囲に制約を加えることもできる。衝撃音抑圧部11は、位相に過去の値と無関係な成分を付加することで、衝撃音を効果的に抑圧できる。
 以上説明したように、本実施形態にあっては、雑音抑圧装置100は、劣化信号中の衝撃音を抑圧する際に、劣化信号中において衝撃音を検出し、検出された衝撃音の位相成分を、劣化信号中の衝撃音以外の信号の位相成分を用いて処理した。これにより、雑音抑圧装置100は、衝撃音を一層効果的に抑圧することができる。
 (第2実施形態)
 次に、図5を用いて本発明の第2実施形態について説明する。本実施形態は衝撃音の検出方法に特徴を有する衝撃音抑圧装置及び方法に関するものである。従来の衝撃音検出方法では十分な検出精度を得られていなかったが、本実施形態のように衝撃音の検出を行なうことで、非常に精度良く劣化信号中の衝撃音を検出できるようになる。
 本実施形態における衝撃音検出部10は、劣化信号振幅スペクトルの周波数特性と時間特性に基づいて、衝撃音の存在を検出する。衝撃音検出部10は、検出に当って、周波数特性と時間特性のいずれかを用いてもよいし、双方を用いてもよい。また、衝撃音検出部10は、双方を用いる際に、それぞれの特性評価結果の重み付き和またはより複雑な関数で表現される統合結果を用いることもできる。
 <衝撃音検出部の構成>
 図5は、衝撃音検出部10の構成を示すブロック図である。図5を参照すると、衝撃音検出部10は、スペクトル周波数特性評価部101、スペクトル時間特性評価部102、及び統合部103を含む。
 スペクトル周波数特性評価部101は、スペクトルの周波数方向変化に関する特性を評価して、統合部103に供給する。スペクトル周波数特性評価部101は、スペクトルの周波数方向変化に関する特性として、スペクトルの周波数方向平坦度を評価する。スペクトル周波数特性評価部101は、スペクトル平坦度として、隣接周波数点におけるスペクトルの差分絶対値の総和を用いることができる。周波数k、フレームnにおける劣化信号振幅スペクトル|Yn(k)|を用いると、スペクトル周波数特性評価部101は、フレームnにおけるスペクトル平坦度Fmf(n)を、次式(9)で求めることができる。
Figure JPOXMLDOC01-appb-M000009
 また、スペクトル周波数特性評価部101は、スペクトル平坦度として、平均スペクトルとの差分絶対値の総和を用いることもできる。フレームnにおける平均劣化信号振幅スペクトル|Yn|バーを用いると、スペクトル周波数特性評価部101は、フレームnにおけるスペクトル平坦度Fmf(n)を、次式(10)で求めることができる。
Figure JPOXMLDOC01-appb-M000010
 スペクトル周波数特性評価部101は、kによって平坦度計算の対象とする周波数を制限することもできる。特に、衝撃音スペクトルは高域で強く、通常信号のスペクトルは低域で強いので、スペクトル周波数特性評価部101は、kの範囲を高周波領域に限定することで、検出精度を高くすることができる。また、スペクトル周波数特性評価部101は、平坦度を複数のサブバンドで個別に求め、これらの線形または非線形結合によって、全体的な平坦度を求めてもよい。スペクトル周波数特性評価部101は、サブバンド処理を、衝撃音と摩擦音の識別に利用することもできる。衝撃音と摩擦音はいずれも広帯域にわたって平坦なスペクトル特性を有するが、一般的に摩擦音の方が狭帯域であり、低域パワーが弱い。このような特性の違いを識別するために、サブバンド処理と複数のサブバンド平坦度の結合は有効である。
 スペクトル周波数特性評価部101は、このようにして求めた平坦度を閾値と比較して、平坦度のスコアを求める。平坦度のスコアは、どの程度平坦であるかを表す指標で、例えば、1と0の間に正規化した値として表現することができる。平坦度の上限閾値をσH、下限閾値をσL、これらに対応した平坦度をFH、FLとすると、スペクトル周波数特性評価部101は、平坦度のスコアSf(n)を、式(11)で定めることができる。
Figure JPOXMLDOC01-appb-M000011
 式(11)においては、上限閾値と下限閾値の間を線形補間しているが、これは任意の関数または多項式などによる補間を適用することができる。
 閾値は、例えば、予め定められた値の他、平坦度の過去の平均や中央値など、あるいはそれらに基づいて計算した値などである。また、スペクトル周波数特性評価部101は、複数の閾値を用意しておき、劣化信号スペクトルを分析した結果に基づいて、選択的に用いることもできる。このような分析結果の例は、劣化信号振幅スペクトル、パワースペクトル、これらの統計量(平均値、中央値、最大値、最小値、分散)などである。
 一方、スペクトル時間特性評価部102は、スペクトルの時間方向変化に関する特性を評価して、統合部103に供給する。スペクトル時間特性評価部102は、スペクトルの時間方向変化として、振幅又はパワースペクトルの増分を用いることができる。スペクトル時間特性評価部102は、時間方向変化の評価を、各周波数点で行う。スペクトル時間特性評価部102は、これらの線形または非線形結合によって、全体的な変化を求めてもよい。また、スペクトル時間特性評価部102は、時間方向変化をサブバンドで求めることもできる。例えば、スペクトル時間特性評価部102は、次式(12)によって、一つのサブバンドにおける時間方向の変化Fmt(n)を求めることができる。
Figure JPOXMLDOC01-appb-M000012
 kの値によって、サブバンド下限が決定される。また、スペクトル時間特性評価部102は、N−1の代わりに特定の周波数番号を用いれば、サブバンド上限を指定できる。また、スペクトル時間特性評価部102は、時間方向変化を複数のサブバンドで個別に求め、これらの線形または非線形結合によって、全体的な変化を求めてもよい。衝撃音スペクトルは高域で強く、通常信号のスペクトルは低域で強いので、スペクトル時間特性評価部102は、高周波領域に限定して変化を評価することで、検出精度を高くすることができる。
 また、スペクトル時間特性評価部102は、振幅又はパワースペクトルの周波数方向の統計量(平均値、中央値、最大値、最小値、分散)、あるいはそれらのうちいくつかの組合せを用いることもできる。例えば、スペクトル時間特性評価部102は、最小値を用いた場合、次式(13)によって時間変化を求めることができる。
Figure JPOXMLDOC01-appb-M000013
 スペクトル時間特性評価部102がこのような最小値の時間変化を用いることで、衝撃音検出部10は、非常に的確に衝撃音を検出することができる。これは、劣化信号の周波数方向の統計量は、通常、幅広い値を取り得るが、衝撃音に関しては、周波数方向の最小値が大きい傾向があるからである。
 特に、これらの統計量のいずれかが小さな分散を有している場合には、スペクトル時間特性評価部102は、分散の小さい統計量を利用することで、検出の精度を高くすることができる。
 なお、数式(9)~(12)に対しては、劣化信号振幅スペクトル|Yn(k)|に代えてパワースペクトル|Yn(k)|2を用いることもできる。
 スペクトル時間特性評価部102は、このようにして求めた時間変化を閾値と比較して、時間変化のスコアを求める。時間変化のスコアは、どの程度の時間変化が存在するかを表す指標で、例えば、1と0の間に正規化した値として表現することができる。時間変化の上限閾値、下限閾値、これらに対応した時間変化量を用いて、スペクトル時間特性評価部102は、時間変化のスコアSt(n)を、式(11)と同様にして定めることができる。スペクトル時間特性評価部102は、平坦度のスコアと同じように、線形補間の代わりに任意の関数または多項式などによる補間を適用することができる。
 スペクトル時間特性評価部102は、閾値として予め定められた値の他、時間変化の過去の平均や中央値など、あるいはそれらに基づいて計算した値などを用いてもよい。また、スペクトル時間特性評価部102は、複数の閾値を用意しておき、劣化信号振幅スペクトルを分析した結果に基づいて、選択的に用いることもできる。このような分析結果の例は、劣化信号振幅スペクトル、パワースペクトル、これらの統計量(平均値、中央値、最大値、最小値、分散)などである。
 統合部103は、スペクトル周波数特性評価部101から供給されたスペクトルの周波数方向変化に関する特性とスペクトル時間特性評価部102から供給されたスペクトルの時間方向変化に関する特性を統合して、衝撃音データを生成し、これを出力する。衝撃音データは、例えば、0と1の間の値に正規化された衝撃音らしさである。例えば、衝撃音データが1であることは、100%の確信をもって衝撃音と判定することであり、0.8であることは、20%の不確定性をもって衝撃音と判定することである。
 前記特性の統合の最も簡単な方法は、前記平坦度のスコアと時間変化のスコアの論理積である。統合部103は、2つのスコアの双方が1に等しいときに衝撃音データを1とする。また、統合部103は、論理積の代わりに論理和を用いることもできる。統合部103は、いずれか一方のスコアが1であれば、衝撃音データを1とする。
 統合部103は、これらのスコアを統合した統合スコアを用いて衝撃音データを計算することもできる。例えば、統合部103は、両者の和を衝撃音データとすると、論理積や論理和より不確実な場合も、衝撃音を1以上に設定することができる。スコアの統合は、両者の単純な和だけでなく、線形、非線形関数を含む様々な統合でもよい。この統合に用いる関数によって、周波数特性または時間特性のどちらをどの程度重視するのかを調整することができる。
 このようにして求めた衝撃音データが1以上であれば、雑音抑圧装置は、衝撃音が確実に存在すると判定して、衝撃音を完全に抑圧する。衝撃音データが1以下であれば、雑音抑圧装置は、その値に応じて衝撃音抑圧の程度を弱くする。
 以上のように、本実施形態では、雑音抑圧装置は、劣化信号中の衝撃音を抑圧する際に、劣化信号から振幅又はパワー成分を抽出し、その振幅又はパワー成分の時間方向変化の統計量を用いて、衝撃音を検出する。これにより、雑音抑圧装置は、より正確に衝撃音を検出することが可能となる。
 なお、本実施形態では、第1実施形態の一部としての衝撃音検出部10について説明したが、本実施形態の衝撃音検出方法は、第1実施形態に記載の衝撃音抑圧方法に限定されるものではなく、どのように衝撃音を抑圧するかについては問わない。すなわち、雑音抑圧装置は、本実施形態の方法で検出した衝撃音に対し、第1実施形態で説明したように、位相処理によって衝撃音を抑圧してもよいし、振幅やパワーを制御することによって衝撃音を抑圧してもよい。
 (第3実施形態)
 ここで、本発明の第3実施形態としての雑音抑圧装置について説明する。図6は、本実施形態に係る雑音抑圧装置300を示す図である。雑音抑圧装置300は、第1衝撃音抑圧部11と第2衝撃音抑圧部12とを備える。衝撃音検出部10と第2衝撃音抑圧部12には、変換部2から劣化信号振幅スペクトル|Yn(k)|が供給される。逆変換部4には、第1衝撃音抑圧部から強調信号位相スペクトルarg Xn(k)バーが、第2衝撃音抑圧部12から強調信号振幅スペクトル|Xn(k)バー|が供給される。第1衝撃音抑圧部11の構成は、第1実施形態で説明した衝撃音抑圧部と同じであるため、ここでは詳しい説明を省略する。
 図7は、第2衝撃音抑圧部12の内部構成を示すブロック図である。図7に示すように、第2衝撃音抑圧部12は、遅延部121と合成部122とを含む。遅延部121は、入力である劣化信号振幅スペクトルを遅延させる。遅延量は一つである必要はない。遅延部121は、複数の遅延量で入力を遅延して、複数の遅延信号を生成することもできる。合成部122は、入力した劣化信号振幅スペクトルと遅延部121から供給される遅延した劣化信号振幅スペクトルとを合成して、強調信号振幅スペクトルを生成する。合成部122は、遅延信号との合成処理を、衝撃音検出部10において衝撃音が検出されたときだけ行う。
 合成部122は、合成処理として、過去の値を用いて、第1実施形態の数式(8)に示す処理を適用したように、次式(14)に示す処理を適用することができる。
Figure JPOXMLDOC01-appb-M000014
 数式(14)においてclpは、周波数p、lフレーム遅延した劣化信号振幅スペクトルに対する係数を表わす。すなわち、合成部122は、周波数範囲がk−N/2からk+N/2、フレーム番号nからn−M+1の範囲にある劣化信号振幅スペクトの線形結合で、強調信号振幅スペクトルを計算する。最も簡単な例が、各周波数における1フレーム前のサンプルとの平均である。平均を用いることで、現在のサンプル単独の場合よりも過去のサンプルとの差が小さくなり、衝撃音として知覚されにくくなる。
 合成の別の例として、合成部122は、過去のサンプルから求めた値(例えば平均値、最大値)を上限として、現在のサンプルに制限をかけてもよい。この合成法も、現在のサンプル単独の場合よりも過去のサンプルとの差を小さくし、衝撃音として知覚されにくくする。また、第2衝撃音抑圧部12は、位相に対する処理と同様に、信号全体を遅延させ、衝撃音に続く未来の信号成分の振幅スペクトルを、過去の信号成分の振幅スペクトルと同様に用いて、振幅スペクトルの変化を抑圧することによって、衝撃音抑圧効果を向上させることもできる。なお、これらの合成において、劣化信号振幅スペクトルに代えて劣化信号パワースペクトルを利用できることは、すでに他の説明で述べた通りである。
 以上のように本実施形態は、検出された衝撃音の振幅又はパワー成分が小さくなるように、劣化信号中の衝撃音以外の信号を用いて処理する。このように位相と振幅又はパワーの両面から衝撃音を処理することで、雑音抑圧装置300は、より一層効果的に衝撃音を抑圧することが可能となる。
 (第4実施形態)
 次に、本発明の第4実施形態としての雑音抑圧装置400について図8を用いて説明する。本実施形態の雑音抑圧装置400は、第1実施形態の雑音抑圧装置100に加えて、雑音存在情報を入力する入力端子9を有する。図8における衝撃音抑圧部31は、入力端子9から供給された雑音存在情報を用いて、各周波数で、第1実施形態で説明した位相処理を行なうことにより衝撃音を抑圧する。そして、衝撃音抑圧部31は、衝撃音抑圧結果を強調信号スペクトルとして逆変換部4に伝達する。強調信号位相スペクトルは、雑音存在情報が雑音の存在を示すときには劣化信号位相スペクトルに対して第1実施形態で説明した位相処理を施し衝撃音を抑圧したものとなる。一方、雑音存在情報が雑音の不存在を示すときには劣化信号位相スペクトルそのものとなる。
 これにより、より効率の良い衝撃音抑圧を行なうことができる。
 (第5実施形態)
 次に本発明の第5実施形態としての雑音抑圧装置について説明する。本実施形態は、図6を用いて説明した第3実施形態に係る雑音抑圧装置をベースにしたものであり、第3実施形態とは、第2衝撃音抑圧部12の内部構成が異なるものである。その他の構成及び動作は、第3実施形態と同様であるため、ここでは詳しい説明を省略する。
 本実施形態に係る第2衝撃音抑圧部52の内部構成について、図9に示す。図9は、衝撃音抑圧部52の構成を示すブロック図である。図9に示すように、第2衝撃音抑圧部52は、遅延部121、合成部124に加えて、重要度評価部123を備えている。遅延部121については、第3実施形態において図7を用いて説明した通りの構成であるためここでは説明を省略する。
 重要度評価部123は、重要度に応じた処理を遂行するための情報(重要度情報)を生成し、合成部124に供給する。合成部124は、強調信号スペクトル合成処理に加えて、重要度評価部123から供給された重要度情報に従って、重要度に応じた処理を行う。
 重要度評価部123の生成する重要度情報の第1の例は、劣化信号振幅スペクトルのピークである。重要度評価部123は、スペクトルのピークを、各周波数点におけるスペクトルを隣接する周波数点におけるスペクトルと比較して、十分に大きいかどうかを評価して検出することができる。最も簡単な例は、各周波数点のスペクトルをその両隣(低域側及び高域側)のスペクトルと比較して、その差が閾値より大きいときにピークと判定することである。差に対する閾値は、両側のスペクトルに対して等しい必要はない。日本工業規格 JIS×4332−3「音響映像オブジェクトの符号化 —第3部 音響—」、2002年3月には、高域側の差分閾値を低域側差分閾値よりも小さくすることが、聴覚特性に合致すると記載されている。同様にして、重要度評価部123は、低域側及び高域側の複数の周波数点に対して差分を求め、これらの情報を総合してピークを検出することもできる。すなわち、すぐ隣の周波数点に対しては差分が大きいが、それよりも離れた隣接周波数点同志においては差分が小さい周波数点を検出すれば、それがピークとなる。重要度評価部123は、このようにして検出したピークの位置(周波数)と大きさ(重要度)を、合成部124へ供給する。
 重要度評価部123の生成する重要度情報の第2の例は、劣化信号振幅スペクトルの大きさである。重要度評価部123は、スペクトルがピークを形成しなくても、その値が大きいときには、その周波数を大振幅として検出する。例えば、大きな値のスペクトルが周波数方向に連続すると、ピークとしては検出されない。しかし、このような部分は、聴覚にとって重要である。そこで、重要度評価部123は、検出した大振幅の位置(周波数)と大きさ(重要度)を、合成部124へ供給する。
 重要度評価部123の生成する重要度情報の第3の例は、劣化信号振幅スペクトルの雑音らしさである。前述のピーク検出を行い、検出されたピークのうち、特に低域に存在するピークは雑音の可能性が低い。また、スペクトル値が小さくピークでない位置では雑音らしさが高い。すなわち、ピークは雑音らしさが低く、非ピークでスペクトル値が小さいときは雑音らしさが高い。重要度評価部123は、これらのピークの位置(周波数)と大きさ(重要度)を、合成部124へ供給する。
 重要度評価部123の生成する重要度情報は、既に説明したピーク、大振幅、及び雑音らしさを適切に組み合わせてもよい。例えば、大振幅のスペクトルに対してピーク検出の閾値を低くして、振幅が大きい帯域では小さなピークも検出されるように制御することなどがその例である。重要度評価部123は、指標を組み合わせて用いることで、より正確な重要度情報を得ることができる。また、これまでの他の説明のように、重要度評価部123は、処理を特定の周波数帯域に限定する、サブバンド処理などを適用することが可能である。
 具体的に合成部124は、重要度評価部123から供給された周波数点以外では、図7で説明した合成部122と同じ強調信号スペクトル合成処理を行う。重要度評価部123から供給された周波数点には重要な信号成分が存在し、これらは強調信号の音質に重要な役割を果たす。そこで、衝撃音抑圧部52は、これらの周波数点においてはその重要度に応じた抑圧を適用する。つまり、衝撃音抑圧部52は、重要度が高い場合には弱い抑圧を、重要度が低い場合には強い抑圧を適用する。
 以上、本実施形態によれば、雑音の振幅又はパワースペクトルに対して、重要度を加味した抑圧を行なうことができ、より高品質の出力を得ることができる。
 (第6実施形態)
 次に本発明の第6実施形態としての雑音抑圧装置について説明する。本実施形態は、図6を用いて説明した第3実施形態に係る雑音抑圧装置をベースにしたものであり、第3実施形態とは、第2衝撃音抑圧部12の内部構成が異なるものである。その他の構成及び動作は、第3実施形態と同様であるため、ここでは詳しい説明を省略する。
 図10Aは、本実施形態に係る雑音抑圧装置の全体構成図である。図6の構成によく似ているが、第2衝撃音抑圧部62が、入力端子9から雑音存在情報が供給される点で異なる。その他の構成及び動作については、図6と同様であるためここでは詳細な説明を省略する。
 図10Bは、第2衝撃音抑圧部62の内部構成を示すブロック図である。図10Bに示すように、衝撃音抑圧部62は、遅延部121、合成部134及び背景音推定部125を含んでいる。遅延部121については、図7で説明したものと同様であるのでここでは説明を省略する。背景音推定部125は、劣化信号振幅スペクトルを変換部2から受け、雑音存在情報を入力端子9から受けて背景音レベルを推定し、背景音レベル推定値として合成部134に供給する。背景音推定部125は、背景音レベル推定値を、入力として劣化信号振幅スペクトルが供給されるときには背景音振幅スペクトルの推定値、劣化信号パワースペクトルが供給されるときには背景音パワースペクトルの推定値として求める。背景音推定部125は、背景音の推定を、雑音存在情報によって雑音が存在するとされるときだけ行い、背景音の推定値を更新する。合成部134は、合成部122と同じ強調信号スペクトル合成処理に加えて、背景音推定部125から供給された背景音推定値によって異なる処理を行う。
 合成部134は、入力端子9から供給される雑音存在情報が雑音の存在を表すときに、背景音推定部125から供給された背景音推定値を下限値とした抑圧を行う。すなわち、合成部134は、合成した結果が背景音推定値より小さいときには、背景音推定値と等しくなるまで抑圧を弱くし、それを強調信号スペクトルとして出力する。合成部134は、合成結果が背景音推定値に等しいかそれよりも大きいときは、合成結果をそのまま強調信号スペクトルとして出力する。入力端子9から供給される雑音存在情報が雑音の非存在を表すときには、合成部134は背景音推定値を下限値とした処理を行わず、合成結果をそのまま強調信号スペクトルとして出力する。
 以上のように、衝撃音抑圧部62は、背景音推定値を下限値とした抑圧を行うことにより、過剰抑圧を回避し、自然な聴感を与える強調信号を得ることができる。
 (第7実施形態)
 次に、本発明の第7実施形態としての雑音抑圧装置について図11を用いて説明する。本実施形態は、図6を用いて説明した第3実施形態に係る雑音抑圧装置をベースにしたものであり、第3実施形態とは、第2衝撃音抑圧部72の内部構成が異なるものである。その他の構成及び動作は、第3実施形態と同様であるため、ここでは詳しい説明を省略する。
 図11は、第2衝撃音抑圧部72の内部構成を示すブロック図である。図11に示すように、第2衝撃音抑圧部72は、遅延部121、合成部122及び白色化処理部127を含んでいる。遅延部121と合成部122との関係については、図5から図7で説明した通りであるためここでは説明を省略する。白色化処理部127は、合成部122から強調信号スペクトルを供給され、これを白色化して、白色化強調信号スペクトルとして出力する。
 白色化処理部127は、強調信号振幅スペクトルの平均値を求め、この平均値からの分散を基準値以下にする。具体的には、白色化処理部127は、平均値+εを超える振幅スペクトル値を平均値+εで置き換える。また、白色化処理部127は、平均値−εより小さい振幅スペクトル値を平均値−εで置き換える。白色化処理部127は、それ以外の強調信号振幅スペクトルについては、そのままとする。また、白色化処理部127は、平均値±εで置き換える代わりに、平均値±εの範囲の乱数で置き換えても良い。例えば、白色化処理部127は、平均値+εを超える振幅スペクトル値は平均値+εと平均値の間の乱数で置き換える。また、白色化処理部127は、平均値−εより小さい振幅スペクトル値は平均値−εと平均値の間の乱数で置き換える。白色化処理によって振幅スペクトルの値が均一化し、雑音が知覚されにくくなる。
 さらに、図11の構成に加えて、図9を用いて説明した重要度評価部123を設けても良い。その場合、白色化処理部127は、白色化処理に重要度評価部123の出力を利用することもできる。重要度評価部123が雑音らしさを求め、雑音らしさが大きいときだけ、白色化処理部127が白色化処理を適用する。このようにすることで、所望信号成分が少ないときに強調信号が白色信号に近くなり、雑音として知覚されにくくなる。
 白色化処理部127は、これら白色化処理において、複数のサブバンドで個別の処理を行うこともできる。また、白色化処理部127は、特定のサブバンドで白色化を回避することもできる。この場合、白色化処理部127は、サブバンド毎に異なる平均値を用いるので、自然な聴感を与える強調信号を得ることができる。
 (第8実施形態)
 図12は、本発明の第8実施形態に係る雑音抑圧装置の構成を示すブロック図である。本実施形態を、第1実施形態と比べた場合、雑音抑圧部3が追加されている他は、同様の構成である。したがって、同じ構成については同じ符号を付してその説明を省略する。
 雑音抑圧部3は、変換部2から供給された劣化信号振幅スペクトルと入力した雑音情報(外部から供給される雑音に関する情報)とを用いて、各周波数で雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを逆変換部4に伝達する。
 以上の構成により、雑音抑圧装置は、衝撃音以外のノイズをも的確に抑圧することが可能となる。
 (第9実施形態)
 図13は、本発明の第9実施形態に係る雑音抑圧装置の構成を示すブロック図である。本実施形態を、第8実施形態と比べた場合、衝撃音検出部90が、雑音抑圧部3によって雑音を抑圧された結果を用いて衝撃音の検出を行なう点で異なる。その他は、同様の構成であるため、同じ構成については同じ符号を付してその説明を省略する。
 雑音抑圧部3からの出力は衝撃音検出部90に入力される。衝撃音検出部90の構成は、第1実施形態で説明した衝撃音検出部10と同じであるため、ここでは詳しい説明を省略する。
 以上の構成により、衝撃音検出部90は、雑音抑圧部3によって雑音を抑圧された結果を用いて、より正確に衝撃音を検出することが可能となる。
 (第10実施形態)
 図14は、本発明の第10実施形態に係る雑音抑圧装置の構成を示すブロック図である。本実施形態を、第8実施形態と比べた場合、衝撃音検出部91が、雑音情報を用いて衝撃音の検出を行なう点で異なる。衝撃音検出部91は、供給された雑音情報(例えば、雑音の存在を示す情報(雑音存在情報)、スペクトル形状等に関する情報を含む雑音情報)を利用して、衝撃音の検出を行う。その他は、同様の構成であるため、同じ構成については同じ符号を付してその説明を省略する。
 衝撃音検出部91は、変換部2から供給された劣化信号振幅スペクトルと入力した雑音情報とを用いて、雑音情報が雑音の存在を表すときに衝撃音を検出する。
 以上の構成により、雑音抑圧装置は、正確に衝撃音を検出し、これを抑圧することが可能となる。
 (他の実施形態)
 以上説明してきた第1乃至第10実施形態では、それぞれ別々の特徴を持つ雑音抑圧装置について説明したが、それらの特徴を如何様に組み合わせた雑音抑圧装置も、本発明の範疇に含まれる。
 また、本発明は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するソフトウェアの信号処理プログラムが、システム或いは装置に直接或いは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、或いはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWWサーバも、本発明の範疇に含まれる。
 図15は、第1実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ1100の構成図である。コンピュータ1100は、入力部1101と、CPU1102と、出力部1103と、メモリ1104と、通信制御部1106とを含む。
 CPU1102は、信号処理プログラムを読み込むことにより、コンピュータ1100の動作を制御する。すなわち、信号処理プログラムを実行したCPU1102は、劣化信号中から衝撃音を検出する(S801)。次に、CPU1102は、劣化信号中において検出した衝撃音の位相情報を、衝撃音以外の信号の位相情報を用いて処理する(S802)。
 これにより、第1実施形態と同様の効果を得ることができる。
 以上、実施形態を参照して本願発明を説明したが、本願発明は以上の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で同業者が理解し得る様々な変更をすることができる。
 この出願は、2009年11月9日に出願された日本出願特願2009−256596を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (20)

  1.  劣化信号中の衝撃音を抑圧するために、
     前記劣化信号中において衝撃音を検出し、
     検出された衝撃音の位相情報を、該位相情報の変化量が小さくなるように前記劣化信号中の前記衝撃音以外の信号の位相情報で処理する信号処理方法。
  2.  前記衝撃音の位相情報を、前記劣化信号中の衝撃音発生前の信号の位相情報で処理する請求項1に記載の信号処理方法。
  3.  前記衝撃音の位相情報を、前記劣化信号中の衝撃音発生前の信号の位相情報で置換する請求項2に記載の信号処理方法。
  4.  前記衝撃音の位相情報を、前記劣化信号中の衝撃音発生前の信号の位相情報と、前記衝撃音の位相情報との平均値で置換する請求項2に記載の信号処理方法。
  5.  前記劣化信号を遅延させ、前記衝撃音の位相情報を、前記劣化信号中の衝撃音発生前の信号の位相情報で処理する請求項2乃至4の何れか1項に記載の信号処理方法。
  6.  前記劣化信号を、前記位相情報と振幅又はパワー情報とに分解し、
     前記振幅又はパワー情報を用いて、前記劣化信号中の衝撃音を検出する請求項1乃至5の何れか1項に記載の信号処理方法。
  7.  検出された衝撃音の前記振幅又はパワー情報が小さくなるように、前記劣化信号中の前記衝撃音以外の信号の前記振幅又はパワー情報を用いて処理する請求項6に記載の信号処理方法。
  8.  検出された衝撃音の前記振幅又はパワー情報を、前記劣化信号中の前記衝撃音が発生する前の信号の振幅又はパワー情報と結合させる請求項7に記載の信号処理方法。
  9.  検出された衝撃音の前記振幅又はパワー情報を、前記劣化信号中の前記衝撃音が発生する前の信号の振幅又はパワー情報を用いて平均化する請求項7に記載の信号処理方法。
  10.  前記劣化信号中の前記衝撃音が発生する前の信号の振幅又はパワー情報を用いて、検出された衝撃音の前記振幅又はパワー情報に制限をかける請求項6に記載の信号処理方法。
  11.  前記劣化信号を遅延させ、前記衝撃音の振幅又はパワー情報を、前記劣化信号中の衝撃音発生前後の信号の振幅又はパワー情報で処理する請求項8乃至10の何れか1項に記載の信号処理方法。
  12.  雑音存在情報を入力し、該雑音存在情報が雑音の存在を示すときに前記衝撃音の抑圧を行なう請求項1乃至11の何れか1項に記載の信号処理方法。
  13.  前記劣化信号中の重要度を評価し、
     前記劣化信号中の重要度が高い部分は弱く、それ以外は強く前記衝撃音を抑圧する請求項1乃至12の何れか1項に記載の信号処理方法。
  14.  前記劣化信号中の背景音を推定し、
     前記劣化信号中の背景音推定値を下限値として、前記衝撃音を抑圧する請求項1乃至11の何れか1項に記載の信号処理方法。
  15.  前記振幅又はパワー情報の平均値を求め、該平均値からの分散を基準値以下にする請求項6に記載の信号処理方法。
  16.  前記振幅又はパワー情報中の雑音を、雑音情報を用いて抑圧し、その結果を用いて、前記衝撃音を検出する請求項6に記載の信号処理方法。
  17.  前記振幅又はパワー情報中の雑音を、雑音情報を用いて抑圧し、
     前記雑音情報を用いて、前記衝撃音を検出する請求項6に記載の信号処理方法。
  18.  入力信号を周波数領域信号に変換し、
     該周波数領域信号を用いて衝撃音を検出し、
     前記衝撃音が検出されたときに、
     振幅と位相の変化分が小さくなるように衝撃音を抑圧することを特徴とする雑音抑圧の方法。
  19.  劣化信号中の衝撃音を抑圧する情報処理装置であって、
     前記劣化信号中において衝撃音を検出する検出手段と、
     検出された衝撃音の位相情報を、該位相情報の変化量が小さくなるように前記劣化信号中の前記衝撃音以外の信号の位相情報で処理する位相処理手段と、
     を備える情報処理装置。
  20.  劣化信号中の衝撃音を抑圧する信号処理プログラムであって、
     コンピュータに、
     前記劣化信号中において衝撃音を検出する工程と、
     検出された衝撃音の位相情報を、該位相情報の変化量が小さくなるように前記劣化信号中の前記衝撃音以外の信号の位相情報を用いて処理する工程と、
     を実行させる信号処理プログラムを格納するプログラム記録媒体。
PCT/JP2010/069870 2009-11-09 2010-11-02 信号処理方法、情報処理装置、及び信号処理プログラム WO2011055830A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201080050832.4A CN102612711B (zh) 2009-11-09 2010-11-02 信号处理方法、信息处理装置
EP10828388.8A EP2500902B1 (en) 2009-11-09 2010-11-02 Signal processing method, information processor, and signal processing program
US13/508,694 US9042576B2 (en) 2009-11-09 2010-11-02 Signal processing method, information processing apparatus, and storage medium for storing a signal processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009256596A JP5310494B2 (ja) 2009-11-09 2009-11-09 信号処理方法、情報処理装置、及び信号処理プログラム
JP2009-256596 2009-11-09

Publications (1)

Publication Number Publication Date
WO2011055830A1 true WO2011055830A1 (ja) 2011-05-12

Family

ID=43970062

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/069870 WO2011055830A1 (ja) 2009-11-09 2010-11-02 信号処理方法、情報処理装置、及び信号処理プログラム

Country Status (5)

Country Link
US (1) US9042576B2 (ja)
EP (1) EP2500902B1 (ja)
JP (1) JP5310494B2 (ja)
CN (1) CN102612711B (ja)
WO (1) WO2011055830A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120300100A1 (en) * 2011-05-27 2012-11-29 Nikon Corporation Noise reduction processing apparatus, imaging apparatus, and noise reduction processing program
JP6004792B2 (ja) * 2011-07-06 2016-10-12 本田技研工業株式会社 音響処理装置、音響処理方法、及び音響処理プログラム
WO2013032025A1 (ja) * 2011-08-29 2013-03-07 日本電気株式会社 信号処理装置、信号処理方法、およびコンピュータ・プログラム
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP6528679B2 (ja) * 2013-03-05 2019-06-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
CN103308804B (zh) * 2013-06-17 2016-09-14 湖南大学 基于快速k-s变换电能质量扰动信号时频参数提取方法
CN104575513B (zh) * 2013-10-24 2017-11-21 展讯通信(上海)有限公司 突发噪声的处理系统、突发噪声的检测及抑制方法与装置
JPWO2016203753A1 (ja) * 2015-06-16 2018-04-19 日本電気株式会社 雑音検出装置、雑音抑圧装置、雑音検出方法、雑音抑圧方法、および、プログラム
CN107436451B (zh) * 2017-07-26 2019-10-11 西安交通大学 一种自动计算地震数据光缆耦合噪声强弱程度的振幅谱方法
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
US10360895B2 (en) 2017-12-21 2019-07-23 Bose Corporation Dynamic sound adjustment based on noise floor estimate
CN108540893A (zh) * 2018-06-22 2018-09-14 会听声学科技(北京)有限公司 脉冲噪声抑制方法、系统及耳机
JP7152112B2 (ja) * 2018-08-24 2022-10-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07248783A (ja) * 1994-03-10 1995-09-26 Kubota Corp アクティブ消音装置
JPH08221092A (ja) 1995-02-17 1996-08-30 Hitachi Ltd スペクトルサブトラクションを用いた雑音除去システム
JP2008099163A (ja) * 2006-10-16 2008-04-24 Audio Technica Corp ノイズキャンセルヘッドフォンおよびヘッドフォンにおけるノイズキャンセル方法
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
JP2009256596A (ja) 2008-03-19 2009-11-05 Sumitomo Chemical Co Ltd 蛍光体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
US6668062B1 (en) * 2000-05-09 2003-12-23 Gn Resound As FFT-based technique for adaptive directionality of dual microphones
ATE288666T1 (de) * 2000-05-26 2005-02-15 Koninkl Philips Electronics Nv Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
EP1376539B8 (en) * 2001-03-28 2010-12-15 Mitsubishi Denki Kabushiki Kaisha Noise suppressor
JP4223350B2 (ja) * 2003-08-19 2009-02-12 パナソニック株式会社 補聴器
EP1581026B1 (en) * 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
CN100347962C (zh) 2004-03-31 2007-11-07 清华大学 时域同步正交频分复用接收机去除相位噪声的方法及系统
CN101146080A (zh) 2007-10-15 2008-03-19 深圳国人通信有限公司 一种多载波快速削峰装置及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07248783A (ja) * 1994-03-10 1995-09-26 Kubota Corp アクティブ消音装置
JPH08221092A (ja) 1995-02-17 1996-08-30 Hitachi Ltd スペクトルサブトラクションを用いた雑音除去システム
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
JP2008099163A (ja) * 2006-10-16 2008-04-24 Audio Technica Corp ノイズキャンセルヘッドフォンおよびヘッドフォンにおけるノイズキャンセル方法
JP2009256596A (ja) 2008-03-19 2009-11-05 Sumitomo Chemical Co Ltd 蛍光体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A. SUGIYAMA: "Single-channel impact-noise suppression with no auxiliary information for its detection", PROCEEDINGS OF WASPAA 2007, October 2007 (2007-10-01), pages 127 - 130
See also references of EP2500902A4

Also Published As

Publication number Publication date
CN102612711A (zh) 2012-07-25
US20120224718A1 (en) 2012-09-06
JP2011100082A (ja) 2011-05-19
US9042576B2 (en) 2015-05-26
EP2500902A1 (en) 2012-09-19
JP5310494B2 (ja) 2013-10-09
CN102612711B (zh) 2016-07-06
EP2500902A4 (en) 2013-05-01
EP2500902B1 (en) 2017-08-16

Similar Documents

Publication Publication Date Title
WO2011055830A1 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP5867389B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
US20100207689A1 (en) Noise suppression device, its method, and program
JP6064600B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
Tabibian et al. Speech enhancement using a wavelet thresholding method based on symmetric Kullback–Leibler divergence
US20110022361A1 (en) Sound processing device, sound processing method, and program
JP5788873B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
WO2014168021A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6300031B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5294085B2 (ja) 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP6011536B2 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP5787126B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2011055829A1 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2013021960A1 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP2018031819A (ja) 信号処理装置、信号処理方法、及び、信号処理プログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080050832.4

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10828388

Country of ref document: EP

Kind code of ref document: A1

REEP Request for entry into the european phase

Ref document number: 2010828388

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2010828388

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13508694

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE