JP6070953B2 - 信号処理装置、信号処理方法、及び記憶媒体 - Google Patents

信号処理装置、信号処理方法、及び記憶媒体 Download PDF

Info

Publication number
JP6070953B2
JP6070953B2 JP2013500847A JP2013500847A JP6070953B2 JP 6070953 B2 JP6070953 B2 JP 6070953B2 JP 2013500847 A JP2013500847 A JP 2013500847A JP 2013500847 A JP2013500847 A JP 2013500847A JP 6070953 B2 JP6070953 B2 JP 6070953B2
Authority
JP
Japan
Prior art keywords
component
signal
phase
amplitude
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013500847A
Other languages
English (en)
Other versions
JPWO2012114628A1 (ja
Inventor
昭彦 杉山
昭彦 杉山
良次 宮原
良次 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2012114628A1 publication Critical patent/JPWO2012114628A1/ja
Application granted granted Critical
Publication of JP6070953B2 publication Critical patent/JP6070953B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Noise Elimination (AREA)

Description

本発明は、信号の位相成分を制御する信号処理技術に関する。
信号の位相成分を制御して信号処理を行なう技術の一例として、位相スペクトルに着目した雑音抑圧の技術について、特許文献1や非特許文献1に開示がある。特許文献1や非特許文献1では、雑音に関係する振幅スペクトルを抑圧すると同時に、位相スペクトルをπ/4までのランダム値だけシフトさせている。位相スペクトルをランダムにシフトさせることで、雑音スペクトルの減衰だけでは抑圧できない雑音の抑圧を実現している。
WO2007/029536
Akihiko Sugiyama, ``Single-Channel Impact-Noise Suppression with NoAuxiliary Information for Its Detection," Proc. IEEE Workshop on Appl. of Sig.Proc. to Audio and Acoustics(WASPAA), pp.127-130, Oct. 2007.
しかしながら、特許文献1や非特許文献1のように、位相スペクトルをランダムにシフトさせると、隣接するフレーム間で位相スペクトルの不一致が生じ、フレーム合成時に信号レベルが低下する。その結果、雑音抑圧区間と雑音非抑圧区間で出力信号レベルに差が生じ、出力信号の品質が低下する。
本発明は、上述の課題を解決する信号処理技術を提供することを目的とする。
上記目的を達成するため、本発明に係る装置は、
第1信号と第2信号とが混在した混在信号を、複数のサンプルから構成されるフレームに分割し、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換手段と、
所定周波数の前記位相成分を所定のフレームにおいて置換する第1制御手段と、
前記第1制御手段が施した前記位相成分の置換によって生じる前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御手段と、
前記第1制御手段により置換された位相成分と、前記第2制御手段により補正された振幅成分又はパワー成分と、を合成する合成手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
信号処理装置が、
第1信号と第2信号とが混在した混在信号を複数のサンプルから構成されるフレームに分割し、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換ステップと、
所定周波数の前記位相成分を所定のフレームにおいて置換する第1制御ステップと、
前記第1制御ステップにおける前記位相成分の置換によって生じる前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御ステップと、
前記第1制御ステップにより置換された位相成分と、前記第2制御ステップにより補正された振幅成分又はパワー成分と、を合成する合成ステップと、
を含むことを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
第1信号と第2信号とが混在した混在信号を、複数のサンプルから構成されるフレームに分割し、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換ステップと
所定周波数の前記位相成分を所定のフレームにおいて置換する第1制御ステップと、
前記第1制御ステップにおける前記位相成分の置換によって生じる前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御ステップと、
前記第1制御ステップにより置換された位相成分と、前記第2制御ステップにより補正された振幅成分又はパワー成分と、を合成する合成ステップと、
をコンピュータに実行させる。
本発明によれば、出力信号の品質を低下させずに入力信号の位相成分を制御する信号処理技術を提供することができる。
本発明の第1実施形態としての信号処理装置の概略構成を示すブロック図である。 本発明の第2実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第2実施形態に含まれる変換部の構成を示すブロック図である。 本発明の第2実施形態に含まれる逆変換部の構成を示すブロック図である。 本発明の第2実施形態に含まれる雑音抑圧部の構成を示すブロック図である。 本発明の第2実施形態において周波数領域で位相置換を行わない場合の信号の流れを示す図である。 本発明の第2実施形態において周波数領域で位相置換を行う場合の信号の流れを示す図である。 本発明の第2実施形態において周波数領域で位相置換を行わない場合のフレームのオーバラップ加算を示す図である。 本発明の第2実施形態において周波数領域で位相置換を行う場合のフレームのオーバラップ加算を示す図である。 本発明の第2実施形態において周波数領域で位相置換を行う場合の周波数領域信号をベクトルで示す図である。 本発明の第2実施形態において周波数領域で位相置換を行わない場合の周波数領域信号をベクトルで示す図である。 本発明の第3実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第4実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第5実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第6実施形態に係るに係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第7実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第7実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第8実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第9実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の他の実施形態としての雑音抑圧装置の概略構成を示すブロック図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
(第1実施形態)
図1は、本発明の第1実施形態に係る信号処理装置100の概略構成を示す図である。図1において、信号処理装置100は、変換部101と第1制御部102と第2制御部103と合成部104を備える。変換部101は、第1信号と第2信号とが混在した混在信号110を、周波数ごとの位相成分120及び振幅成分又はパワー成分130に変換する。また、第1制御部102は、所定周波数の位相成分120を置換する。さらに、第2制御部103は、第1制御部102が施した置換による振幅成分又はパワー成分の変化量に応じて、所定周波数の振幅成分又はパワー成分を補正する。一方、合成部104は、第1制御部102により置換された位相成分140と、第2制御部103により補正された振幅成分又はパワー成分150と、を合成する。
このような構成により、出力信号の品質を低下させずに入力信号の位相成分を制御する信号処理技術を提供することができる。
(第2実施形態)
《全体構成》
本発明の第2実施形態としての雑音抑圧装置について図2乃至図11を用いて説明する。図2は、雑音抑圧装置200の全体構成を示すブロック図である。本実施形態の雑音抑圧装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能するが、本発明はこれに限定されるものではなく、入力信号からのノイズ除去を要求されるあらゆる情報処理装置に適用可能である。
入力端子206には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子206に供給された劣化信号は、変換部201においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は各周波数で独立に処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)230は雑音抑圧部205へ供給され、位相スペクトル(位相成分)220は位相制御部202に供給される。なお、ここでは雑音抑圧部205に劣化信号振幅スペクトル230を供給しているが、本発明はこれに限定されるものではなく、その二乗に相当するパワースペクトルを雑音抑圧部205に供給しても良い。
雑音抑圧部205は、変換部201から供給される劣化信号振幅スペクトル230を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部205は、変換部201から供給された劣化信号振幅スペクトル230と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部203に伝達する。位相制御部202は、変換部201から供給された劣化信号位相スペクトル220を置換し、強調信号位相スペクトル240として逆変換部204へ供給する。また、劣化信号位相スペクトル220と強調信号位相スペクトル240から位相の回転量(シフト量)を計算し、振幅制御部203へ伝達する。振幅制御部203は、位相制御部202から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル250を逆変換部204へ供給する。逆変換部204は、位相制御部202から供給された強調信号位相スペクトル240と、振幅制御部203から供給された補正振幅スペクトル250とを合成して逆変換を行い、強調信号として、出力端子207に供給する。
《変換部の構成》
図3は、変換部201の構成を示すブロック図である。図3に示すように、変換部201はフレーム分割部301、窓がけ処理部(windowing unit)302、及びフーリエ変換部303を含む。劣化信号サンプルは、フレーム分割部301に供給され、K/2サンプル毎のフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部302に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式(1)で与えられる。
Figure 0006070953
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式(2)で得られる左辺が、窓がけ処理部302の出力となる。
Figure 0006070953
実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、MMSE STSA法における抑圧係数を1に設定したとき、またはSS法においてゼロを減算したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1 となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式(3)に示すハニング窓を用いることができる。
Figure 0006070953
このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部303に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部202に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部205に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
《逆変換部の構成》
図4は、逆変換部204の構成を示すブロック図である。図4に示すように、逆変換部204は逆フーリエ変換部401、窓がけ処理部402及びフレーム合成部403を含む。逆フーリエ変換部401は、雑音補正部6から供給された強調信号振幅スペクトルと位相制御部202から供給された強調信号位相スペクトル arg Yn(k)とを乗算して、強調信号(以下の式(4)の左辺)を求める。
Figure 0006070953
得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部402に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式(5)の左辺で与えられる。
Figure 0006070953
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部402の出力となり、フレーム合成部403に伝達される。
Figure 0006070953
フレーム合成部403は、窓がけ処理部402からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0, 1, ..., K-1における出力信号(式(7)の左辺)を得る。得られた出力信号は、フレーム合成部403から出力端子207に伝達される。
Figure 0006070953
なお、図3と図4において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
また、変換部201において得られる周波数成分を複数統合してから、雑音抑圧部205で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合して、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
《雑音抑圧部の構成》
雑音抑圧部205は、変換部201から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部201からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部203へ供給する。
雑音の推定には、M. Kato, A. Sugiyama, and M. Serizawa, "Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA," IEICE Trans. Fundamentals (Japanese Edition), vol.J87-A, no.7, pp.851-860, July 2004.(文献1)やR. Martin, "Spectral subtraction based on minimum statistics," EUSPICO-94, pp.1182-1185, Sept. 1994(文献2)に示されるように、様々な推定方法が利用できる。
例えば、推定雑音スペクトルを、目的音が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法(文献1)がある。この方法では目的音の発生を検出する必要がある。目的音の発生している区間は、強調信号のパワーで判断することができる。
理想的な動作状態として、強調信号は雑音以外の目的音となっている。また、目的音や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
また、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法(文献1)もある。この場合、推定が開始された直後には目的音が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
さらに、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法(文献2)もある。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
雑音抑圧部205においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部201から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部201から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
雑音抑圧部205においては、様々な雑音推定を行うことが可能である。例えば目的音が発生していないフレームの劣化信号振幅スペクトルを利用し、その平均値を推定雑音スペクトルとする方法がある。また、劣化信号振幅スペクトルが供給され始めた初期段階の平均値を推定雑音スペクトルとする方法もある。さらには、統計的に劣化信号振幅スペクトルの最小値を観測し、その最小値を推定雑音スペクトルとする方法などもある。
《位相制御部及び振幅制御部の構成》
図5は位相制御部202及び振幅制御部203の構成を示すブロック図である。図5に示すように、位相制御部202は位相置換部501と置換量生成部502とを含み、振幅制御部203は、補正量算出部503と振幅補正部504とを含む。
置換量生成部502は、劣化信号位相スペクトルの置換量を生成し、位相置換部501に供給する。また、置換量生成部502は、劣化信号位相スペクトル220を受けて生成した置換量との差分である回転量(シフト量)を求め、補正量算出部503に供給する。位相置換部501では、変換部201から劣化信号位相スペクトル220が供給され、置換量生成部502から置換量が供給され、劣化信号位相スペクトル220を供給された置換量で置換し、強調信号位相スペクトル240として逆変換部204へ供給する。補正量算出部503では、置換量生成部502から供給される回転量(シフト量)に基づいて、振幅の補正係数を決定し、振幅補正部504に供給する。置換量生成部502は、例えば乱数によって置換量を生成する。乱数により、劣化信号位相スペクトルを各周波数で置換すると、劣化信号位相スペクトル220の形状が変化する。この形状の変化により、雑音の特徴を弱めることができる。
乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがある。ここでは一様乱数による置換量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。ここでは、線形合同法での一様乱数を例に挙げ、説明を続ける。線形合同法で発生させた一様乱数は、0〜(2^M)−1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の置換量φは、0〜2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式(8)で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure 0006070953
計算の簡単化のために、Rの値をそのまま置換量とすることもできる。置換量の2πはちょうど一回転、すなわちゼロを表す。位相を現在の位相±2πで置換した場合は、置換していない場合と同一である。よって、±2π+φという置換量は、置換量φと等しくなる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、式(8)により置換量φを求めればよい。
位相置換部501は、置換量生成部502から置換量を受け取り、劣化信号位相スペクトルを置換する。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度を置換量φの値で置換する。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、置換量φの正規ベクトルを求め、劣化信号位相スペクトルを置換する。
置換量φの正規ベクトルは、式(9)で求められる。ここで、Φは置換ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure 0006070953
補正量算出部503による、補正係数算出方法について説明する。まず、位相の置換により出力レベルの低下が生じることを、図6及び図7を用いて説明する。
図6及び図7は、劣化信号が図2に示すブロック図で処理された場合の信号を示している。図6と図7の違いは位相置換の有無である。図6は位相置換を行わない場合の信号を、図7は位相置換をフレーム3で行った場合の信号を示している。
まず、位相を置換しない場合の信号について図6を用いて説明する。図6の最上部に描かれているのは、劣化信号である。劣化信号はフレーム分割部301においてフレーム分割される。点線で区切られた、上から2番目の信号が、フレーム分割後の信号である。ここでは、連続した4フレーム分の信号を図示した。また、フレームのオーバラップ率は50%としている。
フレームに分割された信号は窓掛け処理部302によって窓掛けが行われる。点線で区切られた、上から3番目の信号が窓掛け処理後の信号である。図6では位相置換による影響を明確に示すため、矩形窓による重み付けをしている。
次に、フーリエ変換部303によって、周波数領域の信号に変換されるが、図6では周波数領域での信号は省略した。位相置換の点線より下部は、逆変換部204の逆フーリエ変換部401により、時間領域へ変換された信号を図示している。点線で区切られた、上から4番目の信号が位相置換後の信号である。ただし、図6では位相置換を行っていないため、窓掛け処理後の信号から変化していない。
逆変換部204の逆フーリエ変換部401から出力された強調信号は、窓掛け処理を再度実施される。図6では、矩形窓による重み付けを実施した場合を示している。窓掛け処理された信号は、フレーム合成部403において、合成される。この時、フレーム間の時間を揃える必要がある。フレームのオーバラップ率が50%であるので、ちょうど半分ずつフレームが重なる。位相の置換を実施していない場合、図6のように入力信号と出力信号は一致する。
一方、位相を置換する場合の信号について図7を用いて説明する。図7に示したのは位相置換をフレーム3で実施した場合の信号である。最上部に描かれているのは、図6と同じ劣化信号である。フレーム分割後及び窓掛け処理後の信号も図6と同様である。
図7では、フレーム3で位相置換を実施した場合を描いている。位相置換処理の点線下部に示した右向き三角形の区間に注目する。位相置換処理により、フレーム3及び4の信号が時間方向にシフトしている。位相置換を施した信号を再度窓掛け処理し、フレーム合成する。このとき、フレーム2とフレーム3が重なるiiの区間で、フレーム2とフレーム3の信号に違いが生じる。これにより、フレーム合成後の出力信号レベルがiiの区間において小さくなる。つまり、位相の置換を実施する場合、図7のiiの区間で出力信号レベルが低下する。
この位相置換による出力信号レベルの低下は、時間領域における加算を周波数領域の加算に置き換え、周波数領域のベクトル合成でも説明できる。
図8に、フレーム分割および窓掛け処理後の連続した2フレームの劣化信号を、x1[n]およびx2[m]として示す。なお、オーバラップ率は50%としている。ここで、nはx1の離散時間を、mはx2の離散時間を表しており、オーバラップ率が50%の場合には、以下の式(10)が成立する。
Figure 0006070953
また、x1とx2の関係は、以下の式(11)のようになる。
Figure 0006070953
まず、時間領域信号から周波数領域信号への変換および逆変換の式を示す。周波数領域信号X[k]は、時間領域信号x[n]のフーリエ変換によって、以下の式(12)のように表現される。ここで、kは離散周波数を表し、Lはフレーム長である。
Figure 0006070953
また、周波数領域信号X[k]を逆変換により、時間領域信号x[n]に戻すと、以下の式(13)のように表現される。
Figure 0006070953
これに基づいて、時間領域信号x1[n],x2[m]を、周波数領域信号X1[k],X2[k] に変換すると、以下の式(14)、式(15)のように表現される。
Figure 0006070953
Figure 0006070953
周波数領域信号X1[k],X2[k]を、逆変換によってそれぞれ時間領域信号x1[n],x2[m]に戻すと、式(13)より、以下の式(16)、式(17)のように表現される。
Figure 0006070953
Figure 0006070953
逆変換部は、フーリエ変換により周波数領域信号を時間領域信号に変換する。その後、フレーム合成部により、前フレームと現フレームの強調音声をオーバラップ加算する。たとえば、図示した例のオーバラップ率50%では、離散時間m=L/2〜L-1の区間で隣接フレームの加算が行われる。この加算区間m=L/2〜L-1を考える。
時間領域の加算に、式(16)及び式(17)を代入すると、以下の式(18)のように表現される。
Figure 0006070953
さらに、式(18)中の周波数領域信号X1[k],X2[k]に式(14),式(15)を代入すると、以下の式(19)のように表現される。
Figure 0006070953
さらに、式(19)を展開すると、以下の式(20)のように表現される。
Figure 0006070953
ここで、式(20)の各項に含まれる総和演算を考える。任意の整数gを導入し、以下の式(21)が成立する。
Figure 0006070953
デルタ関数δ[g]のフーリエ逆変換式は、式(22)で示される。
Figure 0006070953
ここで、デルタ関数δ[g]は、以下の式(23)で示される。
Figure 0006070953
式(22)より、式(21)は、以下の式(24)に変形できる。
Figure 0006070953
式(24)の関係から、式(20)は、以下の式(25)で表わされる。
Figure 0006070953
よって、式(20)は、以下の式(26)となる。
Figure 0006070953
さて、ここで周波数領域信号X2[k]に対し、位相置換を行った場合を考える。このときの時間領域信号は、図9のようになる。
X2[k]の位相スペクトルを置換したときに、等価的にφ[k]回転させたと考えると、その逆変換は以下の式(27)となる。
Figure 0006070953
これを、式(18)に代入すると、以下の式(28)が成立する。
Figure 0006070953
これを展開すると、以下の式(29)が成立する。
Figure 0006070953
ここで、オーバラップ率50%と仮定し、オーバラップ区間のn=L/2〜L-1について考える。オーバラップ区間では、式(11)より、以下の式(30)のように展開できる。
Figure 0006070953
ここで、それぞれの項にある括弧内の
Figure 0006070953
の項は、ベクトル合成であるから、特定の周波数kに注目すると、図10のように描くことができる。位相置換が行われていないとき、すなわちφ[k]=0の場合は、図11のようになる。
式(31)の絶対値を求めると、以下の式(32)となる。
Figure 0006070953
よって、式(31)の絶対値が最大になる条件は、φ[k]=0の場合であり、その値は2である。すなわち、位相置換が行われると、出力信号の大きさが小さくなることがわかる。
この出力信号レベルの低下量を補正するように、補正量算出部503において強調信号振幅スペクトルの振幅補正量を決定する。
ここでは、位相置換量が一様乱数によって決定されると仮定し、補正量の算出方法を具体的に説明する。ここでは、問題簡単化のため、位相の置換による大きさの変動に着目し、それぞれの周波数成分が単位ベクトルに正規化されているものとする。
まず、位相置換を行わない場合を考える。連続するフレーム間で位相が同じ場合の合成ベクトルは、図11に示されるSのようになり、そのベクトルの大きさ|S|は、以下の式(33)で表わされる。
Figure 0006070953
一方、一様乱数により位相置換を行う場合、連続するフレーム間位相差φは、-πから+πまでの範囲に一様に分布する。この連続するフレーム間で位相が異なる場合の合成ベクトルは、図10に示されるベクトルS′のようになる。そのベクトルの大きさ|S′|は、以下の式(34)で表わされる。
Figure 0006070953
さて、ここで、期待値E(|S′|^2)を求めると、以下の式(35)のようになる。
Figure 0006070953
ここで、φが-πから+πに一様分布することから、以下の式(36)のようになる。
Figure 0006070953
このため、|S'|^2の期待値は、以下の式(37)で表わされる。
Figure 0006070953
さて、位相の置換をしない場合の、期待値E(|S|^2)は、式(33)より以下の式(38)で表わされる。
Figure 0006070953
式(37)と式(38)の比を取ると、以下の式(39)が成立する。
Figure 0006070953
すなわち、位相を一様乱数で置換させる場合、出力信号のパワー平均値は入力の1/2になる。振幅補正部504で振幅値に対して補正を行う場合、補正量算出部503は補正係数をsqrt(2)とし、振幅補正部504に伝達する。パワーに対して補正を行う場合は、補正係数を2として、振幅補正部504に伝達する。
ここでは、一様乱数による置換量生成の場合を例に挙げて説明したが、正規乱数などでもその分散と平均値が決まれば、補正係数を一意に定めることができる。正規乱数を使う場合の補正係数の導出を以下に説明する。
正規乱数を用いた置換の場合、回転量φの発生確率が正規分布により決定される。そのため、正規乱数による位相置換を実施した場合のパワー期待値を求めるには、φの発生確率に基づいて、重み付けを行う必要がある。
具体的には、φの発生確率に基づいた、重み関数f(φ)を導入する。その重み関数f(φ)により、cos(φ)を重みづけする。さらに、重み付け関数f(φ)の積分値で正規化することにより、パワー期待値を求めることができる。
正規乱数による位相置換を行った場合の出力パワー期待値E(S"^2)は、一様乱数の出力パワー期待値である式(35)に、重み付け関数f(φ)およびその積分値を導入し、以下の式(40)のように表現できる。
Figure 0006070953
重み関数f(φ)は、正規分布により表現できるので、以下の式(41)が成立する。
Figure 0006070953
ここで、σは分散をμは平均を表している。
例えば、平均値μ=0,分散σ=1の標準正規分布では、以下の式(42)となるので、となるので、これを式(40)に代入すると、式(43)のようになる。
Figure 0006070953
Figure 0006070953
ここで、式(43)の右辺、第2項を数値計算すると、式(44)が成立するので、位相の置換をしない場合の、E(|S^2|)との比は、式(45)で表わされる。
Figure 0006070953
Figure 0006070953
補正量算出部503は、位相を標準正規分布の正規乱数で置換させ、振幅補正部504で振幅値に対して補正を行う場合、補正係数をsqrt(1/0.805)として、伝達する。パワーに対して補正を行う場合は、補正係数を1/0.805として、振幅補正部504に伝達する。位相置換はすべての周波数に対して行っても良いが、一部の周波数に対して行っても構わない。振幅補正は位相置換を行った周波数に対してのみ行う。よって、位相置換を行わない周波数の補正係数は、1.0とする。位相置換を行った周波数の補正係数だけを、ここで導出した値とする。
《振幅補正部の説明》
振幅制御部203では、位相制御部202から伝達された位相の回転量を用いて振幅補正係数を算出し、雑音抑圧部205から供給された強調信号振幅スペクトルに乗じ、逆変換部204に供給する。これにより、劣化信号位相スペクトルを置換し、強調信号位相スペクトルを得た場合の出力レベル低下を解消することができる。以上のように、本実施形態によれば、位相スペクトルを置換操作することによる出力信号レベルへの影響を振幅制御部203により取り除くことができるため、高品質な強調信号を得ることができる。
(第3実施形態)
本発明の第3実施形態について、図12を用いて説明する。本実施形態では、位相の置換によって生じる回転量の上限を制限する点で第2実施形態と異なる。それ以外の構成及び動作については第2実施形態と同様であるためここでは詳しい説明を省略する。
図12は、本実施形態に係る位相制御部1202及び振幅制御部203の構成を示すブロック図である。図12に示すように、本実施形態における位相制御部1202は、第2実施形態で説明した置換量生成部502と位相置換部501に加え、回転量制限部1221を含む。置換量生成部502は、回転量制限部1221からの制限を受けつつ、劣化信号位相スペクトルの置換量を生成し、位相置換部501に供給する。
回転量制限部1221は、置換量生成部502によって生成される置換量の置換によって生じる置換前の位相からの回転量を一定範囲内に制限する。つまり、φの分布が0〜2πから任意の範囲に制限される。例えば、0〜π/2のように制限する。これにより、強調信号位相スペクトルに劣化信号位相スペクトルの特徴がある程度残ることになる。完全に位相をランダムに置換する場合に比較し、劣化信号の特徴がある程度保持されるため、目的音への影響が少なくなり、目的音の歪が軽減できる。
本実施形態によれば、第2実施形態の効果に加えて、位相の置換によって生じる回転量を制限することにより、目的音の劣化を低減させることができる。
(第4実施形態)
本発明の第4実施形態について、図13を用いて説明する。本実施形態では、位相成分を遅延させ、フレーム間での位相成分の差分を求めた上でそこから補正量を算出する点で第2実施形態と異なる。つまり、位相制御部1302と振幅制御部1303の内部構成において第2実施形態と異なり、他の構成及び動作は第2実施形態と同様であるためここではその説明を省略する。
図13は、本実施形態における位相制御部1302及び振幅制御部1303の構成を示すブロック図である。図13に示すように、第4実施形態における位相制御部1302は、第2実施形態に含まれる置換量生成部502と位相置換部501を備え、さらに、置換後の位相を振幅制御部1303に供給する構成になっている。また振幅制御部1303は、位相成分遅延部1331及び補正量算出部1333を含む。
位相成分遅延部1331では、位相置換部501から供給された強調信号位相スペクトルを1フレーム分保持し、補正量算出部1333に供給する。補正量算出部1333は位相成分遅延部1331からの1フレーム前の強調信号位相スペクトルと位相置換部501からの現在の強調信号位相スペクトルから振幅補正量を算出し、振幅補正部504に伝達する。位相成分遅延部1331は単純な1フレームの遅延で実現される。
本実施形態によれば、第2実施形態の効果に加えて、位相置換量に対応して、数学的に出力レベルの期待値を導出できない場合でも出力レベルを補正することができる。例えば、乱数テーブルによる乱数ではその発生確率に偏りがあるが、本実施形態では出力レベルを問題なく補正できる。
補正量算出部503は、前フレームと現フレームの強調信号位相スペクトルから各周波数で合成ベクトルの大きさを求め、その大きさから補正係数を決定する。前フレームの位相をα,現フレームの位相をβとすると、その合成ベクトルの大きさ|S'|は、以下の式(46)で表わされる。
Figure 0006070953
連続するフレームで位相が一致する場合の合成ベクトルの大きさ|S|は、式(33)において既に導出しているように|S|=2である。よって、振幅補正量は、以下の式(47)
で表わされる。
Figure 0006070953
この値を、振幅制御部1303に供給し、強調信号振幅スペクトルを補正することで、出力レベルの低下を解消することができる。本実施形態において、振幅制御部以外の構成及び動作については、第2実施形態と同様であるためここではその説明を省略する。
(第5実施形態)
本発明の第5実施形態について、図14を用いて説明する。図14は、本実施形態に係る位相制御部202及び振幅制御部1403の構成を示すブロック図である。
本実施形態では、第2実施形態と異なり、入出力比算出部1431を導入し、入力端子206からの劣化信号及び逆変換部204からの強調信号を受け取り、その入出力レベル比を算出する。入出力レベル比は補正量算出部1433に供給され、強調信号のレベルが劣化信号と同等になるように、振幅補正部504において強調信号振幅スペクトルを補正する。入出力比算出部1431では、劣化信号と強調信号の時間領域信号から、そのレベルの比を求める。
第nフレームの劣化信号yn(t)と第nフレームの強調信号xn(t)のレベル比Rは、以下の式(48)で表わされる。ここで、tはサンプル時間を示し、Lはフーリエ変換のフレーム長を示している。
Figure 0006070953
補正量算出部1433は、この比の値Rと位相置換を行った周波数成分の数により、振幅補正量Gを求める。時間領域信号が変換部によりN個の周波数成分に分割され、そのうちM個の位相スペクトルに対して、位相置換を行った場合、振幅補正量Gは、以下の式(49)のように求められる。
Figure 0006070953
また、振幅制御部1403では、位相制御部202から伝達された位相置換の有無の情報より、位相置換が行われた周波数のみで振幅補正を行う。本実施形態において、入出力比算出部1431及び補正量算出部1433以外の構成及び動作については、第2実施形態と同様であるためここではその説明を省略する。
本実施形態によれば、時間領域の信号から補正係数を求めているため、位相置換量がいかなる方法で決定されても、出力レベルを補正できる。
(第6実施形態)
本発明の第6実施形態について、図15を用いて説明する。図15は、本実施形態に係る位相制御部202及び振幅制御部1503の構成を示すブロック図である。図15に示すように、本実施形態における振幅制御部1503は、第5実施形態に含まれる入出力比算出部1431に加え、平均化処理部1531を含む。平均化処理部以外の構成及び動作については、第5実施形態と同様であるためここではその説明を省略する。
平均化処理部1531は、入力端子206から劣化信号を受け取り、平均化処理を施した上で、その平均値を入出力比算出部1431に供給する。また、平均化処理部1531は逆変換部204から強調信号を受け取り、平均化処理を施した上で、その平均値を入出力比算出部1431に供給する。入出力比算出部1431は平均化処理部1531から劣化信号及び強調信号の平均値を受け取り、そのレベル比を算出する。
平均化処理部1531では、任意の時間長で劣化信号及び強調信号のレベルを平均化する。具体的には、移動平均や漏れ積分などを用いる。
本実施形態によれば、第5実施形態の効果に加えて、平均化されたレベルを使用するため、補正量の変動が抑制され、出力信号の品質向上が実現できる。
(第7実施形態)
本発明の第7実施形態について、図16及び図17を用いて説明する。図16は、本実施形態に係る雑音抑圧装置1600の構成を示す図である。本実施形態では、第2実施形態の図2と比較すると、振幅成分遅延部1611及び位相成分遅延部1612が加わり、さらに逆変換部1613が追加されている。また、振幅制御部1603の内部構成にも差異がある。本実施形態において、しかし振幅成分遅延部、位相成分遅延部及び振幅制御部以外の動作については、第6実施形態と同様であるためここではその説明を省略する。
入力端子206に供給された劣化信号は、変換部201と振幅制御部1603に供給される。変換部201から出力された劣化信号振幅スペクトル230は振幅成分遅延部1611及び逆変換部1613へ供給され、劣化信号位相スペクトル220は位相制御部202に供給される。位相制御部202は、変換部201から供給された劣化信号位相スペクトル220を置換し、強調信号位相スペクトルとして逆変換部1613及び位相成分遅延部1612へ供給する。また、各周波数における位相置換の有無を、振幅制御部1603へ伝達する。
逆変換部1613は、変換部201から供給された劣化信号振幅スペクトル230と位相制御部202から供給される劣化信号位相スペクトルを用いて、位相置換によるレベル低下の生じた信号を振幅制御部1603に伝達する。
振幅成分遅延部1611は、変換部201からの劣化信号振幅スペクトル230を遅延させ、雑音抑圧部205に供給する。
位相成分遅延部1612は、位相制御部202からの強調信号位相スペクトルを遅延させ、逆変換部204に供給する。雑音抑圧部205は、振幅成分遅延部1611から供給される劣化信号振幅スペクトルを用いて、雑音を推定し、推定雑音スペクトルを生成する。
逆変換部204は、位相制御部202から位相成分遅延部1612を介して供給された、強調信号位相スペクトル240と、振幅制御部1603から供給された補正振幅スペクトル250とを合成して逆変換を行い、強調信号として、出力端子207に供給する。
劣化信号位相スペクトル220を位相制御部202で制御し、逆変換部1613において時間領域の信号に変換する。その信号と劣化信号210とを用いて、位相置換によるレベルの変動量を求める。
この変動量は位相置換部501による置換処理のみの変動であるので、位相の置換によるレベル変動を正確に捉えることができる。このレベル比を用いて振幅補正を行うが、求まるレベル比は1フレーム前のものである。
そこで、振幅成分遅延部1611と位相成分遅延部1612を導入し、1フレーム前の周波数成分に対して、振幅制御部1603において振幅補正を行う。
図17は、本実施形態に係る位相制御部202及び振幅制御部1603の内部構成を説明するためのブロック図である。入出力比算出部1731は、入力端子206から供給される劣化信号と逆変換部1613から供給される、位相置換によるレベル低下分を含んだ信号から、レベル比を算出し、補正量算出部1233に供給する。
補正量算出部1233は、位相制御部202から各周波数における位相置換の有無の情報を受け取り、振幅補正量を算出する。振幅補正部504は、その振幅補正量に基づいて、強調信号位相スペクトルを各周波数で補正し、逆変換部204へ供給する。なお、振幅成分遅延部1611は、雑音抑圧部205と振幅制御部1603の間に導入しても構わない。
本実施形態によれば、第5実施形態の効果に加え、第5実施形態及び第6実施形態では不可避だった入出力比の遅延を回避でき、より正確な出力レベルの補正を実現できる。
(第8実施形態)
本発明の第8実施形態について、図18を用いて説明する。図18では、第2実施形態にフレームオーバーラップ制御部1808が追加されている。フレームオーバーラップ制御部1808では、変換部201及び逆変換部204において、フレーム分割,合成されるときのオーバラップ率の制御を行い、そのオーバラップ率を振幅制御部203に供給する。既に説明したとおり、位相置換によるレベル低下はオーバラップによって生じる。このレベル低下量はオーバラップ率により変化し、オーバラップ率が大きくなるほど、低下量も大きくなる。よって、オーバラップ率が変化した場合には、振幅補正量を制御する必要がある。
具体的には、オーバラップ率50%の場合の振幅補正量Gを基準に補正量を求める。オーバラップ率が0%のとき振幅補正は必要無い。また、オーバラップ率50%のとき振幅補正量はGである。そこで、フレーム長Lとオーバラップ長Qの比を用いて、以下の式(50)のようになる。ここで、G'はオーバラップ率による補正を行った振幅補正量である。
Figure 0006070953
例えば、オーバラップ率50%の場合は、Q=L/2であるので、以下の式(51)が成立し、オーバラップ率25%の場合には、Q=L/4より以下の式(52)が成立する。
Figure 0006070953
Figure 0006070953
振幅制御部203では、式(50)に基づき、位相制御部202から伝達された補正係数を補正し、強調信号振幅スペクトルを補正する。本実施形態において、フレームオーバーラップ制御部1808以外の構成及び動作については、第2実施形態と同様であるためここではその説明を省略する。
本実施形態によれば、第2実施形態の効果に加えて、フレームのオーバラップ率を自由に設定できる。
(第9実施形態)
本発明の第9実施形態について、図19を用いて説明する。図19では、雑音抑圧部205に雑音記憶部1909が接続されている。本実施形態は、既知の雑音スペクトルを用いて雑音を抑圧する。雑音記憶部1909には、抑圧すべき雑音のスペクトルを記憶させる。その記憶された雑音スペクトルに基づき、雑音抑圧部205において雑音抑圧を行うことで、抑圧対象の雑音のみを抑圧することができる。
ここで、記憶させる雑音のスペクトルは、その雑音の平均スペクトルや最大スペクトル、最小スペクトルなどを用いることができる。あるいは、それらを組み合わせることもできる。本実施形態において、雑音記憶部1909以外の構成及び動作については、第2実施形態と同様であるためここではその説明を省略する。
本実施形態によれば、第2実施形態の効果を、特定の雑音にのみ適用することが可能となり、抑圧したい雑音が明確な場合には、より高品質な強調信号を得ることができる。
(他の実施形態)
以上説明してきた第1乃至第9実施形態では、それぞれ別々の特徴を持つ雑音抑圧装置について説明したが、それらの特徴を如何様に組み合わせた雑音抑圧装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するソフトウェアの信号処理プログラムが、システム或いは装置に直接或いは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、或いはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWWサーバも、本発明の範疇に含まれる。
図20は、第1実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ2000の構成図である。コンピュータ2000は、入力部2001と、CPU2002と、出力部2003と、メモリ2004とを含む。
CPU2002は、信号処理プログラムを読み込むことにより、コンピュータ2000の動作を制御する。すなわち、CPU2002は、メモリ2004に格納された信号処理プログラムを実行し、第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する(S2011)。次に、所定周波数の位相成分を置換する(S2012)。位相成分の置換によって生じる、出力信号における振幅成分又はパワー成分の変化量に応じて、所定周波数の振幅成分又はパワー成分を補正する(S2013)。ステップS2012により置換された位相成分と、ステップS2013により補正された振幅成分又はパワー成分と、を合成する(S2014)。
これにより、第1実施形態と同様の効果を得ることができる。
[実施形態の他の表現]
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換手段と、
所定周波数の前記位相成分を置換させる第1制御手段と、
前記第1制御手段が施した置換による前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御手段と、
前記第1制御手段により置換された位相成分と、前記第2制御手段により補正された振幅成分又はパワー成分と、を合成する合成手段と、
を備えたことを特徴とする信号処理装置。
(付記2)
前記第1制御手段は、前記位相成分の置換量を生成する置換量生成手段を含み、
前記第2制御手段は、前記置換量生成手段から提供された前記置換量に基づいて前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする付記1に記載の信号処理装置。
(付記3)
前記第2制御手段は、
前記位相成分を遅延させる位相成分遅延手段を含み、遅延前後の前記位相成分を比較することにより、前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする付記1に記載の信号処理装置。
(付記4)
前記第2制御手段は、
前記合成手段からの出力と前記混在信号とを比較することにより前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする付記1に記載の信号処理装置。
(付記5)
前記第2制御手段は、前記合成手段からの出力の平均値と前記混在信号の平均値とを比較することにより前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする付記4に記載の信号処理装置。
(付記6)
前記振幅成分又はパワー成分を遅延させる振幅成分遅延手段と、
をさらに有し、
前記第2制御手段は、
前記合成手段からの出力と前記混在信号とを比較することにより前記変化量を算出し、算出した前記変化量に応じて、前記振幅成分遅延手段により遅延した前記振幅成分又はパワー成分を補正することを特徴とする付記1に記載の信号処理装置。
(付記7)
前記変換手段は、前記混在信号を、互いに一部オーバーラップした複数フレームに分割する分割手段を含み、
前記第2制御手段は、さらに、
フレームのオーバーラップ率に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正することを特徴とする付記1乃至6のいずれか1項に記載の信号処理装置。
(付記8)
前記第1制御手段は、前記位相成分の置換によって生じる置換前の位相からの回転量を制限する回転量制限手段を含むことを特徴とする付記1乃至7のいずれか1項に記載の信号処理装置。
(付記9)
第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換ステップと
所定周波数の前記位相成分を置換させる第1制御ステップと、
前記第1制御ステップにおける置換によって生じた前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御ステップと、
前記第1制御ステップにより置換された位相成分と、前記第2制御ステップにより補正された振幅成分又はパワー成分と、を合成する合成ステップと、
を備えたことを特徴とする信号処理方法。
(付記10)
第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換ステップと
所定周波数の前記位相成分を置換させる第1制御ステップと、
前記第1制御ステップにおける置換によって生じた前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御ステップと、
前記第1制御ステップにより置換された位相成分と、前記第2制御ステップにより補正された振幅成分又はパワー成分と、を合成する合成ステップと、
をコンピュータに実行させることを特徴とする信号処理プログラム。
[その他]
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年2月26日に出願された日本出願特願2011−041002を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (10)

  1. 第1信号と第2信号とが混在した混在信号を、複数のサンプルから構成されるフレームに分割し、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換手段と、
    所定周波数の前記位相成分を所定のフレームにおいて置換する第1制御手段と、
    前記第1制御手段が施した前記位相成分の置換によって生じる前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御手段と、
    前記第1制御手段により置換された位相成分と、前記第2制御手段により補正された振幅成分又はパワー成分と、を合成する合成手段と、
    を備えたことを特徴とする信号処理装置。
  2. 前記第1制御手段は、前記位相成分の置換量を生成する置換量生成手段を含み、
    前記第2制御手段は、前記置換量生成手段から提供された前記置換量に基づいて前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする請求項1に記載の信号処理装置。
  3. 前記第2制御手段は、
    前記位相成分を遅延させる位相成分遅延手段を含み、遅延前後の前記位相成分を比較することにより、前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする請求項1に記載の信号処理装置。
  4. 前記第2制御手段は、
    前記合成手段からの出力と前記混在信号とを比較することにより前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする請求項1に記載の信号処理装置。
  5. 前記第2制御手段は、前記合成手段からの出力の平均値と前記混在信号の平均値とを比較することにより前記変化量を算出し、算出した前記変化量に応じて前記振幅成分又はパワー成分を補正することを特徴とする請求項4に記載の信号処理装置。
  6. 前記振幅成分又はパワー成分を遅延させる振幅成分遅延手段をさらに有し、
    前記第2制御手段は、
    前記合成手段からの出力と前記混在信号とを比較することにより前記変化量を算出し、算出した前記変化量に応じて、前記振幅成分遅延手段により遅延した前記振幅成分又はパワー成分を補正することを特徴とする請求項1に記載の信号処理装置。
  7. 前記変換手段は、前記混在信号を、互いに一部オーバーラップした複数フレームに分割する分割手段を含み、
    前記第2制御手段は、さらに、
    フレームのオーバーラップ率に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正することを特徴とする請求項1乃至6のいずれか1項に記載の信号処理装置。
  8. 前記第1制御手段は、前記位相成分の置換によって生じる置換前の位相からの回転量を制限する回転量制限手段を含むことを特徴とする請求項1乃至7のいずれか1項に記載の信号処理装置。
  9. 信号処理装置が、
    第1信号と第2信号とが混在した混在信号を複数のサンプルから構成されるフレームに分割し、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換ステップと、
    所定周波数の前記位相成分を所定のフレームにおいて置換する第1制御ステップと、
    前記第1制御ステップにおける前記位相成分の置換によって生じる前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御ステップと、
    前記第1制御ステップにより置換された位相成分と、前記第2制御ステップにより補正された振幅成分又はパワー成分と、を合成する合成ステップと、
    を含むことを特徴とする信号処理方法。
  10. 第1信号と第2信号とが混在した混在信号を、複数のサンプルから構成されるフレームに分割し、周波数ごとの位相成分及び振幅成分又はパワー成分に変換する変換ステップと
    所定周波数の前記位相成分を所定のフレームにおいて置換する第1制御ステップと、
    前記第1制御ステップにおける前記位相成分の置換によって生じる前記振幅成分又はパワー成分の変化量に応じて、前記所定周波数の前記振幅成分又はパワー成分を補正する第2制御ステップと、
    前記第1制御ステップにより置換された位相成分と、前記第2制御ステップにより補正された振幅成分又はパワー成分と、を合成する合成ステップと、
    をコンピュータに実行させることを特徴とする信号処理プログラム。
JP2013500847A 2011-02-26 2011-12-19 信号処理装置、信号処理方法、及び記憶媒体 Active JP6070953B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011041002 2011-02-26
JP2011041002 2011-02-26
PCT/JP2011/079387 WO2012114628A1 (ja) 2011-02-26 2011-12-19 信号処理装置、信号処理方法、及び記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2012114628A1 JPWO2012114628A1 (ja) 2014-07-07
JP6070953B2 true JP6070953B2 (ja) 2017-02-01

Family

ID=46720429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013500847A Active JP6070953B2 (ja) 2011-02-26 2011-12-19 信号処理装置、信号処理方法、及び記憶媒体

Country Status (3)

Country Link
US (1) US9531344B2 (ja)
JP (1) JP6070953B2 (ja)
WO (1) WO2012114628A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2645368B1 (en) * 2010-11-24 2019-05-08 Nec Corporation Signal processing device, signal processing method and signal processing program
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014136629A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US10726856B2 (en) * 2018-08-16 2020-07-28 Mitsubishi Electric Research Laboratories, Inc. Methods and systems for enhancing audio signals corrupted by noise
JP7152112B2 (ja) * 2018-08-24 2022-10-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01174110A (ja) * 1987-12-28 1989-07-10 Alpine Electron Inc ディジタル位相制御回路
WO2007026691A1 (ja) * 2005-09-02 2007-03-08 Nec Corporation 雑音抑圧の方法及び装置並びにコンピュータプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2687496B1 (fr) * 1992-02-18 1994-04-01 Alcatel Radiotelephone Procede de reduction de bruit acoustique dans un signal de parole.
US5878389A (en) * 1995-06-28 1999-03-02 Oregon Graduate Institute Of Science & Technology Method and system for generating an estimated clean speech signal from a noisy speech signal
JP3532391B2 (ja) 1997-08-28 2004-05-31 アルプス電気株式会社 積層磁心
WO1999030315A1 (fr) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore
JP4230414B2 (ja) 1997-12-08 2009-02-25 三菱電機株式会社 音信号加工方法及び音信号加工装置
JP4358221B2 (ja) 1997-12-08 2009-11-04 三菱電機株式会社 音信号加工方法及び音信号加工装置
US7209567B1 (en) * 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
JP4527175B2 (ja) 1998-08-21 2010-08-18 パナソニック株式会社 スペクトルパラメータ平滑化装置及びスペクトルパラメータ平滑化方法
CN101300623B (zh) 2005-09-02 2011-07-27 日本电气株式会社 用于抑制噪声的方法、设备和计算机程序
CN101627428A (zh) * 2007-03-06 2010-01-13 日本电气株式会社 抑制杂音的方法、装置以及程序
JP4310371B2 (ja) 2007-09-11 2009-08-05 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
JP5257366B2 (ja) * 2007-12-19 2013-08-07 富士通株式会社 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム
US20110125490A1 (en) * 2008-10-24 2011-05-26 Satoru Furuta Noise suppressor and voice decoder

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01174110A (ja) * 1987-12-28 1989-07-10 Alpine Electron Inc ディジタル位相制御回路
WO2007026691A1 (ja) * 2005-09-02 2007-03-08 Nec Corporation 雑音抑圧の方法及び装置並びにコンピュータプログラム

Also Published As

Publication number Publication date
JPWO2012114628A1 (ja) 2014-07-07
US9531344B2 (en) 2016-12-27
US20130332500A1 (en) 2013-12-12
WO2012114628A1 (ja) 2012-08-30

Similar Documents

Publication Publication Date Title
JP6079236B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP6070953B2 (ja) 信号処理装置、信号処理方法、及び記憶媒体
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
WO2014136628A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP5788873B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6064600B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP6300031B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP6119604B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6011536B2 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
WO2011055834A1 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6662413B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP2011100029A (ja) 信号処理方法、情報処理装置、及び信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161220

R150 Certificate of patent or registration of utility model

Ref document number: 6070953

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150