JPWO2014084000A1 - 信号処理装置、信号処理方法、および信号処理プログラム - Google Patents

信号処理装置、信号処理方法、および信号処理プログラム Download PDF

Info

Publication number
JPWO2014084000A1
JPWO2014084000A1 JP2014550099A JP2014550099A JPWO2014084000A1 JP WO2014084000 A1 JPWO2014084000 A1 JP WO2014084000A1 JP 2014550099 A JP2014550099 A JP 2014550099A JP 2014550099 A JP2014550099 A JP 2014550099A JP WO2014084000 A1 JPWO2014084000 A1 JP WO2014084000A1
Authority
JP
Japan
Prior art keywords
phase
signal
amplitude
frequency
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014550099A
Other languages
English (en)
Other versions
JP6300031B2 (ja
Inventor
昭彦 杉山
昭彦 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2014084000A1 publication Critical patent/JPWO2014084000A1/ja
Application granted granted Critical
Publication of JP6300031B2 publication Critical patent/JP6300031B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/01Reducing phase shift
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/69Spread spectrum techniques
    • H04B1/707Spread spectrum techniques using direct sequence modulation
    • H04B1/709Correlator structure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/69Spread spectrum techniques
    • H04B1/707Spread spectrum techniques using direct sequence modulation
    • H04B1/7097Interference-related aspects
    • H04B1/711Interference-related aspects the interference being multi-path interference
    • H04B1/7115Constructive combining of multi-path signals, i.e. RAKE receivers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

高品質な強調信号を得るため、第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換手段と、前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析手段と、前記位相成分よりも相互相関が弱いデータ系列を用いて、所定周波数の前記位相成分の変化量を生成する変化量生成手段と、前記変化量生成手段から提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御手段と、位相制御手段によって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換手段と、を備えた。

Description

本発明は、信号の位相成分を制御する信号処理技術に関する。
信号の位相成分を制御して信号処理を行なう技術の一例として、位相スペクトルに着目した雑音抑圧の技術について、特許文献1や非特許文献1に開示がある。特許文献1や非特許文献1に記載の技術は、雑音に関係する振幅スペクトルを抑圧すると同時に、位相スペクトルをπ/4までのランダム値だけシフトさせる。特許文献1や非特許文献1に記載の技術は、位相スペクトルをランダムにシフトさせることで、雑音スペクトルの減衰だけでは抑圧できない雑音の抑圧を実現する。
国際公開公報WO2007/029536
Akihiko Sugiyama, ``Single-Channel Impact-Noise Suppression with No Auxiliary Information for Its Detection," Proc. IEEE Workshop on Appl. of Sig. Proc. to Audio and Acoustics (WASPAA), pp.127-130, Oct. 2007.
しかしながら、特許文献1や非特許文献1のように、全ての周波数において位相スペクトルをランダムにシフトさせると、演算量または信号品質の面で不具合が生じていた。
本発明は、上述の課題を解決する信号処理技術を提供することを目的とする。
上記目的を達成するため、本発明に係る装置は、
第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換手段と、
前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析手段と、
前記位相成分よりも相互相関が弱いデータ系列を用いて、前記所定周波数の前記位相成分の変化量を生成する変化量生成手段と、
前記変化量生成手段から提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御手段と、
前記位相制御手段によって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換ステップと、
前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析ステップと、
前記位相成分よりも相互相関が弱いデータ系列を用いて、前記所定周波数の前記位相成分の変化量を生成する変化量生成ステップと、
前記変化量生成ステップで提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御ステップと、
前記位相制御ステップによって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換ステップと、
を含むことを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換ステップと、
前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析ステップと、
前記位相成分よりも相互相関が弱いデータ系列を用いて、前記所定周波数の前記位相成分の変化量を生成する変化量生成ステップと、
前記変化量生成ステップで提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御ステップと、
前記位相制御ステップによって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換ステップと、
をコンピュータに実行させることを特徴とする。
本発明によれば、入力信号の一部の周波数の位相成分を効果的に制御する信号処理技術を提供することができる。
本発明の第1実施形態としての信号処理装置の概略構成を示すブロック図である。 本発明の第2実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第2実施形態に含まれる変換部の構成を示すブロック図である。 本発明の第2実施形態に含まれる逆変換部の構成を示すブロック図である。 本発明の第3実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第3実施形態としての雑音抑圧装置に含まれる変化量生成部の概略構成を示すブロック図である。 本発明の第4実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第4実施形態としての雑音抑圧装置に含まれる振幅制御部708の概略構成を示すブロック図である。 本発明の第4実施形態において周波数領域で位相回転を行なわない場合の信号の流れを示す図である。 本発明の第4実施形態において周波数領域で位相回転を行なう場合の信号の流れを示す図である。 本発明の第4実施形態において周波数領域で位相回転を行なわない場合のフレームのオーバーラップ加算を示す図である。 本発明の第4実施形態において周波数領域で位相回転を行なう場合のフレームのオーバーラップ加算を示す図である。 本発明の第4実施形態において周波数領域で位相回転を行なう場合の周波数領域信号をベクトルで示す図である。 本発明の第4実施形態において周波数領域で位相回転を行なわない場合の周波数領域信号をベクトルで示す図である。 本発明の第5実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第6実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第7実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第8実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第9実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第10実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第10実施形態に係る位相制御部と振幅制御部の構成を示すブロック図である。 本発明の第11実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第12実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の第13実施形態としての雑音抑圧装置の概略構成を示すブロック図である。 本発明の他の実施形態としての雑音抑圧装置の概略構成を示すブロック図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
(第1実施形態)
図1は、本発明の第1実施形態に係る信号処理装置100の概略構成を示す図である。図1において、信号処理装置100は、変換部101と位相制御部102と変化量生成部103と逆変換部104と振幅分析部105とを備える。
変換部101は、第1信号と第2信号とが混在した混在信号110を、周波数ごとの位相成分120および周波数ごとの振幅成分またはパワー成分130に変換する。
振幅分析部105は、振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す。変化量生成部103は、位相成分120よりも相互相関が弱いデータ系列を用いて、所定周波数の位相成分の変化量を生成する。また、位相制御部102は、変化量生成部103から提供された変化量を用いて、所定周波数の位相成分120の相関を減ずる制御を行なう。逆変換部104は、位相制御部102によって制御処理を加えられた位相成分140を用いて強調信号170を生成する。
このような構成により、より効果的に位相制御すべき周波数を選択して、位相成分120を制御して、振幅スペクトルの減衰だけでは抑圧できない雑音の抑圧を効果的に実現することができる。
(第2実施形態)
《全体構成》
本発明の第2実施形態としての雑音抑圧装置200について図2乃至図4を用いて説明する。図2は、雑音抑圧装置200の全体構成を示すブロック図である。本実施形態の雑音抑圧装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能するが、本発明はこれに限定されるものではない。雑音抑圧装置200は、入力信号からのノイズ除去を要求されるあらゆる情報処理装置に適用可能である。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に除去する。簡単に説明すると、衝撃音を含む信号を周波数領域信号に変換し、周波数空間における位相成分を、相互相関が弱いデータ系列を用いて制御することにより、衝撃音を適切に除去する。
入力端子206には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子206に劣化信号が供給されると、変換部201は、供給された劣化信号にフーリエ変換などの変換を施して、複数の周波数成分に分割する。変換部201は、複数の周波数成分を各周波数で独立に処理する。ここでは、特定の周波数成分に注目して説明を続ける。変換部201は、複数の周波数成分のうち振幅スペクトル(振幅成分)230を振幅分析部205と逆変換部204に供給する。変換部201は、複数の周波数成分のうち位相スペクトル(位相成分)220を位相制御部202と変化量生成部203に供給する。なお、ここでは、変換部201は、振幅分析部205と逆変換部204に劣化信号振幅スペクトル230を供給しているが、本発明はこれに限定されるものではない。変換部201は、劣化信号振幅スペクトル230の二乗に相当するパワースペクトルを振幅分析部205と逆変換部204に供給してもよい。
変化量生成部203は、変換部201から受けた劣化信号位相スペクトル220を用いて位相の変化量を生成し、位相制御部202に供給する。ここで、位相の「変化量」とは、位相の「回転量」および「置換量」を含む概念であり、位相の制御量を意味する。振幅分析部205は、振幅成分を分析して、位相を制御するべき周波数を求め、位相制御部202に供給する。位相制御部202は、変換部201から供給された劣化信号位相スペクトル220を、振幅分析部205から指定された周波数において、変化量生成部203から供給された変化量を用いて変化させることによって位相の相関を減じ、強調信号位相スペクトル240として逆変換部204へ供給する。逆変換部204は、位相制御部202から供給された強調信号位相スペクトル240と、変換部201から供給された劣化信号振幅スペクトル230とを合成して逆変換を行い、強調信号270として、出力端子207に供給する。
《変換部の構成》
図3は、変換部201の構成を示すブロック図である。図3に示すように、変換部201はフレーム分割部301、窓掛け処理部(windowing unit)302、およびフーリエ変換部303を含む。劣化信号サンプルは、フレーム分割部301に供給され、K/2サンプル毎のフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓掛け処理部302に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t)(t=0,1,...,K/2-1)に対するw(t)で窓掛け(windowing)された信号は、次式(1)で与えられる。
Figure 2014084000
また、窓掛け処理部302は、連続する2フレームの一部を重ね合わせ(オーバーラップ)して窓掛けしてもよい。オーバーラップ長としてフレーム長の50%を仮定すれば、t=0,1,...,K/2-1に対して、以下の式(2)で得られる左辺が、窓掛け処理部302の出力となる。
Figure 2014084000
窓がけ処理部302は、実数信号に対しては、左右対称窓関数を用いてもよい。また、窓関数は、位相制御部202が何も制御をしないときに、変換部201の入力信号と逆変換部204の出力信号が計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1となることを意味する。
以後、連続する2フレームの50%をオーバーラップして窓掛けする場合を例として説明を続ける。窓掛け処理部302は、w(t)として、例えば、次式(3)に示すハニング窓を用いてもよい。
Figure 2014084000
このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓掛けされた出力はフーリエ変換部303に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトルargYn(k)は、位相制御部202と変化量生成部203に、劣化信号振幅スペクトル|Yn(k)|は、逆変換部204に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用してもよい。
《逆変換部の構成》
図4は、逆変換部204の構成を示すブロック図である。図4に示すように、逆変換部204は逆フーリエ変換部401、窓掛け処理部402およびフレーム合成部403を含む。逆フーリエ変換部401は、変換部201から供給された劣化信号振幅スペクトル230(|Xn(k)|)と位相制御部202から供給された強調信号位相スペクトル240(argXn(k))とを乗算して、強調信号(以下の式(4)の左辺)を求める。
Figure 2014084000
逆フーリエ変換部401は、得られた強調信号に逆フーリエ変換を施す。逆フーリエ変換された強調信号は、1フレームがKサンプルを含む時間領域サンプル値系列xn(t)(t=0,1,...,K-1)として、窓掛け処理部402に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t)(t=0,1,...,K/2-1)に対してw(t)で窓掛けされた信号は、次式(5)の左辺で与えられる。
Figure 2014084000
また、窓掛け処理部402は、連続する2フレームの一部を重ね合わせ(オーバーラップ)して窓掛けしてもよい。フレーム長の50%をオーバーラップ長として仮定すれば、t=0,1,...,K/2-1に対して、以下の式の左辺が、窓掛け処理部402の出力となり、フレーム合成部403に伝達される。
Figure 2014084000
フレーム合成部403は、窓掛け処理部402からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0,1,...,K-1における出力信号(式(7)の左辺)を得る。得られた出力信号は、フレーム合成部403から出力端子207に伝達される。
Figure 2014084000
なお、図3と図4において変換部201と逆変換部204における変換をフーリエ変換として説明したが、変換部201、逆変換部204は、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いてもよい。変換部201、逆変換部204がハール変換を用いた場合には、乗算が不要となり、LSI化したときの面積を小さくすることができる。変換部201、逆変換部204がウェーブレット変換を用いた場合には、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
また、変換部201において得られる周波数成分を複数統合してから、変化量生成部203で変化量生成を、位相制御部202で位相の制御を、振幅分析部205で振幅分析を行ってもよい。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、統合後の帯域が広くなるように、よりたくさんの周波数成分を統合して、高い音質を達成することができる。このように、複数の周波数成分を統合してから位相制御を実行すると、位相制御を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
《振幅分析部205の動作》
振幅分析部205は、変換部201から劣化信号振幅スペクトル230の供給を受け、振幅情報を分析することによって位相の相関を減じるべき周波数を決定する。位相制御部202における位相制御の目的は、変換部201に入力される信号に固有な特徴を除去することである。仮に、そのような特徴が残っていても、逆変換部204で位相と振幅が統合されて逆変換を適用されたときに、知覚できない振幅の信号であれば、問題にならない。したがって、振幅分析部205においては、振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出し、その所定周波数において位相制御を行なう。例えば、振幅成分があらかじめ定められた第1閾値よりも大きな周波数を、位相制御するべき周波数と決定することができる。あらかじめ定められた第1閾値より大きな振幅を有する周波数を位相制御するべき周波数と決定することによって、知覚できない振幅の周波数を除外することができ、位相制御に必要な演算量を削減することができる。また、あらかじめ定められた第2閾値よりも小さな振幅を有する周波数を位相制御すべき周波数と決定することにより、音声などの目的信号成分に対して位相相関を減じることがなくなり、目的信号成分の品質低下を防止することができる。第1閾値および/または第2閾値を用いて位相制御対象周波数を規定する方法としては以下のものが挙げられる。
[方法1:第1閾値を絶対可聴閾値に設定]
絶対可聴閾値は、このレベル以下では知覚できないという、人間の最低知覚レベルである。したがって、絶対可聴閾値を第1閾値とすることによって、知覚できないレベルの周波数の位相に対して制御処理を適用することを防ぐことができ、演算量削減につながる。
[方法2:第1閾値をマスキングレベルに設定]
マスキングレベルは、マスカーと呼ばれる振幅の大きな信号成分によるマスキング効果を考慮して絶対可聴閾値を補正したものであり、大きな振幅の成分の近傍周波数にある小さな振幅成分が知覚できない現象を反映したものである。マスキングレベルの計算方法については、ISO/IEC 11172-3:1993, Information technology -- Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s - Part 3 : Audio, Aug. 1993(非特許文献2)に詳しい。マスキングレベルを第1閾値として設定することにより、大きな振幅の成分の近傍周波数にある小さな振幅成分が存在するときでも、知覚できないレベルの周波数の位相に対する制御処理の適用を防ぐことができ、演算量削減につながる。
[方法3:第1閾値と第2閾値の両方を設定]
振幅が大きな周波数を全て選択すると、その中に音声などの目的信号成分を含む場合があり、問題となる。これは、一般的に目的信号成分はそれ以外の信号成分よりも振幅が大きなことが多いからである。したがって、目的信号成分である確率が高い振幅の周波数は、位相制御するべき周波数から除外することが望ましい。これは、第1閾値よりも大きい第2閾値を導入して、第1閾値よりも大きく、第2閾値よりも小さな振幅を有する周波数を位相制御するべき周波数と決定することで達成できる。すなわち、大きくもなく、小さくもない、中程度の振幅を有する周波数を、位相制御するべき周波数と決定することになる。第2閾値を用いた処理を適用することによって、音声などの目的信号成分に対して位相相関を減じることがなくなり、目的信号成分の品質低下を防止することができる。
[方法4:振幅がピークとなる周波数を位相制御対象周波数に含まないよう第1閾値および第2閾値を設定]
目的信号成分の除外は、振幅成分に含まれるスペクトルのピークを利用して行なうこともできる。例えば、音声や音楽などの信号は、明確な複数のピークを含むことが知られている。これらのピーク成分の品質が主観音質に与える影響は、極めて大きい。そこで、振幅成分のうちピーク成分に関しては、位相制御するべき周波数としないように設定することが有効である。振幅成分がピークとなる周波数の検出方法は各種知られているが、例えば、前記の非特許文献2に開示された方法を用いることができる。位相制御する周波数からピークとして検出された周波数を除外することによって、音声などの目的信号成分に対して位相相関を減じることがなくなり、目的信号成分の品質低下を防止することができる。
ここで、ピーク成分として検出された周波数だけでなく、その近傍の周波数も合わせて、位相制御する対象の周波数から除外してもよい。その際に、ピーク周波数の低域側と高域側で、近傍と判定する範囲を異なるものに設定してもよい。例えば、各ピークの低域側にNL、高域側にNH(NL<NH)の周波数範囲を位相制御の対象周波数から除外する。これは、人間の聴覚特性におけるマスキングの影響が、高域側により広く及ぶ現象に基づく。ピークとして検出された周波数に加えてその近傍の周波数を、位相制御する周波数から除外することによって、音声などの目的信号成分に対して位相相関を減じることがなくなり、目的信号成分の品質低下を防止することができる。
[方法5:摩擦音を表わす周波数を位相制御対象周波数に含まないよう第1閾値および第2閾値を設定]
音声の重要成分の一つに摩擦音がある。摩擦音を位相制御の対象周波数から除外することもできる。摩擦音は、低周波数域から高周波数域まで比較的平坦な振幅分布を有することが知られている。これは、相対的に高周波数域の振幅が大きいことを意味する。したがって、高周波数域の振幅成分が通常よりも大きいときに、摩擦音であると判断して、該当する高周波数域を位相制御の対象周波数から除外する。高周波数域として、特定の周波数成分を用いてもよいし、複数の連続または不連続の周波数成分に関する振幅和を求めて用いてもよい。また、通常の高周波数域の振幅成分は、相対的に振幅成分が小さいフレームにおいて、その値を平均して求めることができる。摩擦音の周波数を位相制御の対象周波数から除外することによって、摩擦音における品質低下を防止することができる。
目的信号成分の除外のためには、目的信号区間を検出して、その間は位相制御するべき周波数をなくする(全周波数で位相制御を行なわない)こともできる。目的信号が音声である場合の音声区間検出に関して数々の文献があるが、例えば、R. L. Bouquin-Jeannes and G. Faucon, "Proposal of a voice activity detector for noise reduction," Electron Letters, Volume 30, No. 12, pp.930-932, Dec. 1994(非特許文献3)やJ. Ramirez, J. C. Segura, C. Benitez, L. Garcia, A. Rubio, "Statistical voice activity detection using a multiple observation likelihood ratio test," IEEE Signal Processing Letters, Volume 12, Number 10, pp.689-692, Oct. 2005(非特許文献4)を参照することができる。
[方法6:第1閾値に背景雑音レベルより少し小さな振幅を設定]
さらに、背景雑音(環境雑音)の振幅近傍まで抑圧された周波数成分は、知覚可能であるが、それよりも小さい振幅は背景雑音自体にマスクされて知覚できない。そこで、第1閾値として背景雑音レベルより少し小さな振幅を設定することができる。
背景雑音は、劣化信号の振幅を平均して、推定することができる。平均化の手法としては、有限サンプル数のスライディング窓を用いた方法や漏れ積分を用いた方法を適用することができる。前者は、信号処理の分野では、有限インパルス応答長フィルタの演算として知られており、フィルタのタップ数がスライディング窓の長さに対応する。有限サンプル数をLとすると、次式で平均値を求めることができる。
Figure 2014084000
漏れ積分では、一次漏れ積分が最も広く用いられている。
Figure 2014084000
ただし、βは0<βを満たす定数である。
背景雑音の推定は、劣化信号の振幅が推定背景雑音に近い(所定倍以内または所定値差以内の)ときだけ、行なうこともできる。背景雑音推定の初期値は、劣化信号振幅の平均として求めることができる。初期値を得た後は、背景雑音推定値に近い劣化信号だけを平均化操作に利用する。
これら以外にも、雑音の推定には、M. Kato, A. Sugiyama, and M. Serizawa, "Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA," IEICE Trans. Fundamentals (Japanese Edition), vol.J87-A, no.7, pp.851-860, July 2004.(非特許文献5)やR. Martin, "Spectral subtraction based on minimum statistics," EUSPICO-94, pp.1182-1185, Sept. 1994(非特許文献6)に示されるように、様々な推定方法が利用できる。
第1閾値として背景雑音レベルより少し小さな振幅を設定し、第1閾値よりも大きな振幅を位相制御する周波数として設定することによって、知覚できない振幅成分を位相制御することがなくなり、位相制御の演算量を削減することができる。
また、以上に説明した方法1〜6によって、あらゆる環境において、目的信号成分の品質を向上させることができる。
《変化量生成部の動作》
変化量生成部203は、変換部201から劣化信号位相スペクトル220の供給を受け、位相の相関を減じるための変化量を生成する。変換部201から供給される劣化信号位相スペクトル220はargYn(k)(0≦k<K)であるので、変化量生成部203は、相関低減された強調信号位相スペクトルargXn(k)を、例えば、次のような処理で求めることができる。
Figure 2014084000
これは、位相を1つおきに符号反転することに相当する。当然、1つおきではなく、Kより小さい任意の整数ごとに反転してもよい。
数式(10)の位相制御に必要な回転量ΔargYn(k)は、数式(10)から次式のように得られる。
Figure 2014084000
すなわち、変化量生成部203は、数式(11)に示す回転量ΔargYn(k)を生成する。また、
Figure 2014084000
とすることもできる。mod[k,K]はkをKで割ったときの余りを表す。このときの回転量ΔargYn(k)は、もとの位相をK/2サンプルずらせたものに相当する。ずれ量はK/2に限らず、任意の整数でよいことは明らかである。
また、K/2を中心として元の位相と対称の位置にある位相を回転量ΔargYn(k)としてもよい。そのときには、次式を用いる。
Figure 2014084000
さらに、これら2種類の処理、すなわち符号反転とシフトした位相の加算を組合せて変化量を生成することもできる。すなわち、
Figure 2014084000
または
Figure 2014084000
である。
上記シフト加算に関しては、シフト量K/2を変えることもできる。例えば、シフト量をそのときのフレーム番号nとすれば、時間の経過とともに自動的にシフト量が変化する。同様に、数式(12)、(13)において、数式(11)の代わりに数式(10)を組合わせてもよい。
これら、位相の選択的符号反転とシフト加算の処理に、定数倍を組み合わせることもできる。例えば、式(12)に定数倍を組み合わせると、次式(16)で表わすことができる。
Figure 2014084000
これは、シフト加算する項をその項の位置に対応したkの値で定数倍する例である。
さらに、複数の位相サンプルを交換することもできる。例えば、
Figure 2014084000
を0≦k<K/2なるkに1つおきに適用することができる。1の代わりに、Kより小さい任意の整数を用いてもよい。
これまで、位相の選択的符号反転、シフト加算、定数倍、交換について説明したが、これらの処理をargYn(k)の値に応じて選択的に適用することもできる。例えば、argYn(k)の値が正の値をとるときだけ、上述したような処理を適用することも可能である。数式(12)の処理を例にとれば、
Figure 2014084000
となる。ここに、sgn(・)は符号を取り出す演算子である。右辺の分数は、位相が正の値をとるときだけ1、それ以外はゼロとなるので、argYn(k)の値に応じて選択的に前記処理を適用することができる。これらの回転量を用いた相関除去処理は、相関除去の程度と必要な演算量が異なる。実際に適用する際には、相関除去の程度と必要演算量を考慮して、適切なものを選択し、あるいは組み合わせて使用する。
別の相関除去の方法として、位相サンプルargYn(k)の相関を求めてから、求めた相関を除去する方法もある。例えば、argYn(k)が隣接するN-1サンプルの線形結合で表現される場合を考える。このとき、次式が成立する。
Figure 2014084000
あるいは、逆方向の相関に着目して、
Figure 2014084000
とすることもできる。ここにδL(k)、δR(k)は、非相関成分(相関のない成分)である。
このような関係を用いてargYn(k)を修正すると、
Figure 2014084000
または
Figure 2014084000

なる。上記の式において、全ての非ゼロのajを利用する必要はない。一部のajを利用することによって、演算量を削減することができる。
相関除去の効果は低減するが、値の大きなajを選択的に用いることで、効果の低減を最小化することができる。その最たる例は、最大のajだけを用いて、次式に基づいて位相の相関除去を行なうことである。
Figure 2014084000
ここに、jmaxは相関係数aが最大値をとるjの値である。Nサンプルを用いた相関除去と比較して、相関除去に必要な演算量を削減することができる。
上記線形相関の式における係数ajは、音声符号化では線形予測係数(LPC)として知られている。LPCは、レビンソン・ダービンの再帰法を用いて高速に求めることができる。また、もとの位相サンプル値と予測結果の差分(誤差)を用いて、正規化LMSアルゴリズムなどに代表される、適応フィルタの係数更新アルゴリズムを利用して、LPCを求めることができる。
また、隣接するK-1サンプルの線形結合ではなく、Kj-1サンプルの線形結合(Kj<K)を想定して相関除去を行ってもよい。このように線形結合に想定するサンプル数を削減することによって、相関除去に必要な演算量を削減することができる。
これまでは、一例としてargYn(k)が隣接するK-1サンプルの線形結合で表現される場合を考えたが、同様にK-1サンプルの非線形結合で表現される場合を考えることもできる。すなわち、次式が成立する場合である。
Figure 2014084000
ここに、fNL[・]は非線形関数、δ(k)は非相関成分である。このとき、相関除去に用いる回転量は、
Figure 2014084000
で求めることができる。非線形関数を用いた相関除去により、非線形な相関を有する場合に十分に相関を除去することができる。
非線形関数は、一般的に多項式で近似することができる。非線形関数fNL[・]をargYn(j)の多項式で近似する際に、argYn(j)の種類を限定し、さらにその次数を限定することもできる。例えば、argYn(k)とargYn(k+1)とそれらの2乗だけを用いることにすれば、fNL[・]はargYn(k)、argYn(k+1)およびそれらの2乗を含む4種類の項だけで近似される。このような非線形関数の近似によって、相関除去に必要な演算量を削減することができる。
変化量生成部203は、例えば乱数によって位相の回転量を生成してもよい。その場合、位相制御部202は、変化量生成部203が乱数により生成した回転量を用いて劣化信号位相スペクトルを各周波数で回転させる。
乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがある。ここでは一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生する。ここでは、線形合同法での一様乱数を例に挙げ、説明を続ける。線形合同法で発生させた一様乱数は、0〜(2M)−1の範囲に一様に分布する。
ここで、Mは任意の整数である。位相の回転量φは、0〜2πの範囲に分布させる必要がある。そこで、発生させた一様乱数は、0〜2πの範囲に分布されるように変換される。変換は、以下の式(26)で行なう。ここで、Rは一様乱数である。Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2M)-1となる。
Figure 2014084000
計算の簡単化のために、Rの値を、そのまま位相の回転量としてもよい。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、式(26)により回転量φを求めればよい。
位相制御部202は、変化量生成部203から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、位相制御部202は、その角度に回転量φの値を加算することで回転させる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、位相制御部202は、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させる。
回転量φの正規ベクトルは、式(27)で求められる。ここで、Φは回転ベクトルである。jはsqrt(-1)を示す。なお、sqrtは二乗根を表す。
Figure 2014084000
《位相制御部202の動作》
位相制御部202は、変化量生成部203から供給された回転量ΔargYn(k)を、変換部201から供給された劣化信号位相スペクトル220に加算することにより、強調信号位相スペクトル240argXn(k)を求めて、逆変換部204に供給する。すなわち、次式を実行する。
Figure 2014084000
位相制御部202は、変化量生成部203から供給された回転量ΔargYn(k)を、変換部201から供給された劣化信号位相スペクトル220に加算せずに、劣化信号位相スペクトル220と置換することによって、強調信号位相スペクトル240argXn(k)を求め、逆変換部204に供給することもできる。すなわち、次式を実行することにより、位相の回転量と位相の置換量とが等価となる。なお、ここでは強調信号位相スペクトル自体を減算して回転量を加算することによって置換を実現しているが、単純に位相データを置換量に置き換えることによって置換を実現してもよい。
Figure 2014084000
以上説明したとおり、変化量生成部203が生成した回転量ΔargYn(k)を用いて、位相制御部202がΔargYn(k)の値を変化させることにより、劣化信号位相スペクトル220の形状を変化させる。この形状の変化により、劣化信号位相スペクトル220の相関が弱くなり、入力された信号の特徴を弱めることができる。
なお、これまで説明してきた位相の処理に先立って、位相展開を適用することもできる。これは、劣化信号位相スペクトル220が±πの範囲を値域とするためである。すなわち、位相展開を行って、値域が±πに限定されないようにする。位相展開をすることによって、数式(17)、(18)、(22)などで表される相関を求める際に、高精度に相関を求めることができる。位相展開に関しては、B. Rad and T. Virtanen, "Phase spectrum prediction of audio signals," Proc. ISCCSP2012, CD-ROM, May 2012.(非特許文献7)や S. T. Kaplan and T. J. Ulrych, "Phase Unwrapping: A review of methods and a novel technique," Proc. 2007 CSPG CSEG Conv. Pp.534-537, May 2007. (非特許文献8)に示されるように、様々な方法を適用することができる。
(第3実施形態)
《全体構成》
本発明の第3実施形態としての雑音抑圧装置500について図5を用いて説明する。図5は、雑音抑圧装置500の全体構成を示すブロック図である。本実施形態の雑音抑圧装置500は、第2実施形態の雑音抑圧装置200と比較して、変化量生成部503以外の構成は、同一である。そこで、変化量生成部503に関してだけ説明し、その他の構成要素に関する詳細な説明は省略する。
《変化量生成部503の構成》
図6は位相制御部202および変化量生成部503の構成を示すブロック図である。図6に示すように、変化量生成部503は振幅保持部601と振幅分析部602とを含む。振幅保持部601は、劣化信号振幅スペクトル230を保持し、振幅分析部602に供給する。
位相制御部202には、変換部201から劣化信号位相スペクトル220が供給され、変化量生成部503から位相の回転量が供給される。位相制御部202は、劣化信号位相スペクトル220を、変化量生成部503から供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル240として逆変換部204へ供給する。
《振幅を用いた回転量算出1》
振幅分析部602は、例えば、振幅保持部601が保持した劣化信号振幅スペクトルにπを乗じて得られた積を回転量とする。あるいは、振幅保持部601が保持した劣化信号振幅スペクトルをそのまま回転量としても、同様の効果が得られる。位相制御部202は、変化量生成部503が劣化信号振幅スペクトルにより生成した変化量を用いて、劣化信号位相スペクトルを各周波数で変化(回転または置換)させる。位相制御部202が行なう制御により、劣化信号位相スペクトル220の形状が変化する。この形状の変化により、雑音の特徴を弱めることができる。
《振幅を用いた回転量算出2》
振幅分析部602は、また、振幅保持部601が保持した劣化信号振幅スペクトル230を正規化したものを回転量として位相制御部202に供給してもよい。この場合、振幅分析部602は、まず、劣化信号振幅スペクトル230(全て正の値K個)の平均を求める。求めた平均値で劣化信号振幅スペクトルを除して得られた商にπを乗じて得られた積を回転量とする。なお、このときにπを乗じずに商をそのまま回転量としても、類似の効果が得られる。正規化なしの場合と比べて分散を相対的に大きくすることができるので、回転させられる位相に対する相関除去の効果を強化することができる。また、平均を求める際に、最初に極端に他と異なる値(外れ値)を除外してから、平均を求めることもできる。外れ値の悪影響を排除することができ、より効果的な回転量を求めることができる。
《振幅を用いた回転量算出3》振幅分析部602は、また、劣化信号振幅スペクトル230の分布を正規化してから回転量とすることもできる。まず、振幅分析部602は劣化信号振幅スペクトル230(全て正の値K個)の最大値|Xn|maxと最小値|Xn|minとを求める。次に、劣化信号振幅スペクトルから最小値を減算して、最大値と最小値の差で除する。この商にπを乗じて得られた積を回転量とする。すなわち、回転量ΔargYn(k)を次式で求める。
Figure 2014084000
このように回転量を求めることによって、回転量は0とπの間に分布するので、回転させられる位相に対する相関除去の効果を強化することができる。なお、このときにπを乗じずに商をそのまま回転量としても、類似の効果が得られる。
《振幅を用いた回転量算出4》
変化量生成部503は、また、劣化信号振幅スペクトルの分布を自身の包絡線で正規化して、回転量とすることもできる。包絡線は、例えば、劣化信号振幅スペクトルの回帰曲線をN個のサンプルから求めて、回帰曲線の値で各サンプルを除する。N個のサンプルのうち、一部を用いて回帰曲線を求めてもよいし、外れ値を除外してから回帰曲線を求めることもできる。外れ値の除外によって、外れ値の悪影響を除外することができ、より効果的な回転量を求めることができる。このようにして得られた商は、1を中心とした分布となる。
この商に、既に数(30)を用いて説明した最大値と最小値の正規化を適用すると、回転量ΔargYn(k)は次式(31)で求めることができる。
Figure 2014084000
式(31)において、|Xチルダn(k)|は、包絡線で正規化した劣化信号振幅スペクトルである。このようにして回転量を求めることによって、回転量が均一にπと-πの間に分布し、相関除去の効果を強化することができる。なお、このときにπを乗じずに商をそのまま回転量としても、類似の効果が得られる。
(第4実施形態)
本発明の第4実施形態について、図7を用いて説明する。本実施形態に係る雑音抑圧装置700は、位相制御部202での位相の制御による出力レベルの低下を、振幅制御部708を用いて補填する点で第2実施形態と異なる。他の構成および動作は第2実施形態と同様であるためここではその説明を省略する。
図8に示すとおり、振幅制御部708は、補正量算出部881と振幅補正部882とを備える。補正量算出部881は、変化量生成部203から伝達された位相の回転量を用いて振幅補正係数を算出する。振幅補正部882は、算出した振幅補正係数を変換部201から供給された劣化信号振幅スペクトルに乗じ、逆変換部204に供給する。振幅補正係数を乗じることにより、劣化信号位相スペクトル220を制御して強調信号位相スペクトル240を得た場合の出力レベル低下を解消することができる。
まず、相関除去を通じた位相の回転により出力レベルの低下が生じることを、図9および図10を用いて説明する。
図9および図10は、劣化信号が図7に示すブロック図で処理された場合の信号を示している。図9と図10の違いは位相回転の有無である。図9は位相回転を行なわない場合の信号を、図10は位相回転をフレーム3から行った場合の信号を示している。
まず、位相を回転しない場合の信号について図9を用いて説明する。図9の最上部に描かれているのは、劣化信号である。劣化信号はフレーム分割部301においてフレーム分割される。点線で区切られた、上から2番目の信号が、フレーム分割後の信号である。図9では、連続した4フレーム分の信号を図示した。また、フレームのオーバーラップ率は50%としている。
窓掛け処理部302は、フレームに分割された信号に窓掛けを行なう。点線で区切られた、上から3番目の信号が窓掛け処理後の信号である。図9では位相回転による影響を明確に示すため、矩形窓による重み付けをしている。
次に、フーリエ変換部303によって、周波数領域の信号に変換されるが、図9では周波数領域での信号は省略した。位相回転の点線より下部は、逆変換部204の逆フーリエ変換部401により、時間領域へ変換された信号を図示している。点線で区切られた、上から4番目の信号が位相回転後の信号である。ただし、図9では位相回転を行っていないため、窓掛け処理後の信号から変化していない。
逆変換部204の逆フーリエ変換部401から出力された強調信号は、窓掛け処理部402で窓掛け処理を再度実施される。図9では、矩形窓による重み付けを実施した場合を示している。窓掛け処理された信号は、フレーム合成部403において、合成される。この時、フレーム間の時間を揃える必要がある。フレームのオーバーラップ率が50%であるので、ちょうど半分ずつフレームが重なる。位相の回転を実施していない場合、図9のように入力信号と出力信号は一致する。
一方、位相を回転する場合の信号について図10を用いて説明する。図10に示したのは位相回転をフレーム3から実施した場合の信号である。最上部に描かれているのは、図9と同じ劣化信号である。フレーム分割後および窓掛け処理後の信号も図9と同様である。
図10では、フレーム3から一定の位相回転を実施した場合を描いている。位相回転処理により、フレーム3および4の信号が時間方向にシフトしている。位相回転を施した信号は、再度窓掛け処理が行なわれ、フレーム合成される。このとき、フレーム2とフレーム3が重なるiiの区間で、フレーム2とフレーム3の信号に違いが生じる。これにより、フレーム合成後の出力信号レベルがiiの区間において小さくなる。つまり、位相の回転を実施する場合、図10のiiの区間で出力信号レベルが低下する。
この位相回転による出力信号レベルの低下は、時間領域における加算を周波数領域の加算に置き換え、周波数領域のベクトル合成でも説明できる。
図11に、フレーム分割および窓掛け処理後の連続した2フレームの劣化信号を、x1[n]およびx2[m]として示す。なお、オーバーラップ率は50%としている。ここで、nはx1の離散時間を表す。mはx2の離散時間を表す。オーバーラップ率が50%の場合には、以下の式(32)が成立する。
Figure 2014084000
また、x1とx2の関係は、以下の式(33)のようになる。
Figure 2014084000
まず、時間領域信号から周波数領域信号への変換および逆変換の式を示す。周波数領域信号X[k]は、時間領域信号x[n]のフーリエ変換によって、以下の式(34)のように表現される。ここで、kは離散周波数を表し、Lはフレーム長である。
Figure 2014084000
また、周波数領域信号X[k]を逆変換により、時間領域信号x[n]に戻すと、以下の式(35)のように表現される。
Figure 2014084000
これに基づいて、時間領域信号x1[n],x2[m]を、周波数領域信号X1[k],X2[k]に変換すると、以下の式(36)、式(37)のように表現される。
Figure 2014084000
Figure 2014084000
周波数領域信号X1[k],X2[k]を、逆変換によってそれぞれ時間領域信号x1[n],x2[m]に戻すと、式(35)より、以下の式(38)、式(39)のように表現される。
Figure 2014084000
Figure 2014084000
逆フーリエ変換部401は、逆フーリエ変換により周波数領域信号を時間領域信号に変換する。その後、フレーム合成部403は、前フレームと現フレームの強調音声をオーバーラップ加算する。
例えば、図示した例のオーバーラップ率50%では、フレーム合成部403は、離散時間m=L/2〜L-1の区間で隣接フレームの加算を行なう。この加算区間m=L/2〜L-1を考える。
時間領域の加算に、式(38)および式(39)を代入すると、以下の式(40)のように表現される。
Figure 2014084000
さらに、式(40)中の周波数領域信号X1[k],X2[k]に式(36),式(37)を代入すると、以下の式(41)のように表現される。
Figure 2014084000
さらに、式(41)を展開すると、以下の式(42)のように表現される。
Figure 2014084000
ここで、式(42)の各項に含まれる総和演算を考える。任意の整数gを導入し、以下の式(43)が成立する。
Figure 2014084000
デルタ関数δ[g]のフーリエ逆変換式は、式(44)で示される。
Figure 2014084000
ここで、デルタ関数δ[g]は、以下の式(45)で示される。
Figure 2014084000
式(44)より、式(43)は、以下の式(46)に変形できる。
Figure 2014084000
式(46)の関係から、式(42)は、以下の式(47)で表わされる。
Figure 2014084000
よって、式(42)は、以下の式(48)となる。
Figure 2014084000
さて、ここで周波数領域信号X2[k]に対し、位相回転を行った場合を考える。このときの時間領域信号は、図12のようになる。
X2[k]の位相スペクトルを、φ[k]回転させたとき、その逆変換は以下の式(49)となる。
Figure 2014084000
これを、式(40)に代入すると、以下の式(50)が成立する。
Figure 2014084000
これを展開すると、以下の式(51)が成立する。
Figure 2014084000
ここで、オーバーラップ率50%と仮定し、オーバーラップ区間のn=L/2〜L-1について考える。オーバーラップ区間では、式(51)より、以下の式(52)のように展開できる。
Figure 2014084000
ここで、それぞれの項にある括弧内の項(式(53)に示す)は、ベクトル合成であるから、特定の周波数kに注目すると、図13のように描ける。
Figure 2014084000
もし、位相回転が行なわれていないとき、つまりφ[k]=0の場合は、図14のようになる。
式(53)の絶対値を求めると、以下の式(54)となる。
Figure 2014084000
よって、式(53)の絶対値が最大になる条件は、φ[k]=0の場合であり、その値は2である。つまり、位相回転が行なわれると、出力信号の大きさが小さくなることがわかる。
この出力信号レベルの低下量を補正するように、補正量算出部881は、強調信号振幅スペクトルの振幅補正量を決定する。
続いて、補正量の算出方法を具体的に説明する。ここでは、問題簡単化のため、位相の回転による大きさの変動に着目し、それぞれの周波数成分が単位ベクトルに正規化されているものとする。
まず、位相回転を行なわない場合を考える。連続するフレーム間で位相が同じ場合の合成ベクトルは、図14に示されるベクトルSのようになり、そのベクトルの大きさ|S|は、以下の式(55)で表わされる。
Figure 2014084000
一方、正規乱数により位相回転を行なう場合、連続するフレーム間位相差がφとなる場合の合成ベクトルは、図13に示されるベクトルS´のようになる。そのベクトルの大きさ|S´|は、以下の式(56)で表わされる。
Figure 2014084000
さて、ここで、期待値E(|S´|2)を求めると、以下の式(57)のようになる。
Figure 2014084000
正規乱数の場合φの発生確率が正規分布により決定される。そのため、正規乱数による位相回転を実施した場合のパワー期待値を求めるには、φの発生確率に基づいた重み付けが行なわれる必要がある。
具体的には、φの発生確率に基づいた、重み関数f(φ)を導入する。その重み関数f(φ)により、cos(φ)は、重みづけされる。さらに、重み付け関数f(φ)の積分値で正規化することにより、パワー期待値を求めることができる。
正規乱数による位相回転を行った場合の出力パワー期待値E(S´2)は、一様正規乱数の出力パワー期待値である式(57)に、重み付け関数f(φ)およびその積分値を導入することで、以下の式(58)のように表現される。
Figure 2014084000
重み関数f(φ)は、正規分布により表現できるので、以下の式(59)が成立する。
Figure 2014084000
ここで、σは分散をμは平均を表している。
例えば、平均値μ=0,分散σ=1の標準正規分布では、以下の式(60)となるので、これを式(58)に代入すると、式(61)のようになる。
Figure 2014084000
Figure 2014084000
ここで、式(61)の右辺、第2項を数値計算すると、式(62)が成立するので、位相の回転をしない場合の、E(|S2|)との比は、式(63)で表わされる。
Figure 2014084000
Figure 2014084000
補正量算出部881は、位相を標準正規分布の正規乱数で回転させる場合、振幅補正部882に補正係数をsqrt(1/0.805)として、伝達する。位相制御部202は、位相回転を全ての周波数に対して行ってもよいし、一部の周波数に対して行ってもよい。振幅制御部708は、振幅補正を、位相回転が行なわれた周波数に対してのみ行なう。よって、位相回転を行なわない周波数の補正係数は、1.0とする。位相回転を行った周波数の補正係数のみ導出した値とする。
なお、全ての位相回転特性が正規分布で完全に表現できるわけではないが、正規分布で近似することによって、上記の補正量計算法を適用することができる。そのためには、変化量生成部203の発生する変化量の値と出現頻度に基づく統計をとり、式(59)の正規分布における平均値μと分散σを求める必要がある。続いて、式(59)から式(63)までの計算を行って、その逆数の平方根として補正係数を求める。
以上のように、本実施形態に係る雑音抑圧装置700は、位相スペクトルを制御することによる出力信号レベルへの影響を振幅制御部708により取り除くことができる。そのため、雑音抑圧装置700は、高品質な強調信号を得ることができる。
(第5実施形態)
本発明の第5実施形態にかかる雑音抑圧装置1500について、図15を用いて説明する。本実施形態では、振幅制御部708を備えている点で、第3実施形態の構成と異なる。振幅制御部708以外の構成については、第3実施形態と同様であり、振幅制御部708は、第4実施形態と同様であるため、同じ構成については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、劣化信号振幅スペクトルまたはそれから求めた値を用いて、劣化信号位相スペクトルを回転または置換することで、位相由来の雑音を効率的に抑圧でき、かつ、振幅制御により、位相制御に伴う出力レベルの低下を抑制できる。
(第6実施形態)
本発明の第6実施形態に係る雑音抑圧装置1600について、図16を用いて説明する。本実施形態では、位相の回転量の上限を制限する点で第2実施形態と異なる。それ以外の構成および動作については第2実施形態と同様であるためここでは詳しい説明を省略する。
図16は、本実施形態に係る雑音抑圧装置1600の構成を示すブロック図である。図16に示すように、本実施形態における雑音抑圧装置1600は、第2実施形態で説明した変化量生成部203と位相制御部202に加え、変化量制限部1601を含む。変化量生成部203は、変化量制限部1601からの制限を受けつつ、劣化信号位相スペクトルの変化量を生成し、位相制御部202に供給する。
変化量制限部1601は、変化量生成部203によって生成される回転量を一定範囲内に制限する。つまり、変化量制限部1601は、φの分布を、0〜2πから任意の範囲に制限する。例えば、変化量制限部1601は、φの分布を、0〜π/2のように制限する。これにより、強調信号位相スペクトルに劣化信号位相スペクトルの特徴がある程度残ることになる。完全に位相をランダムに回転させる場合に比較し、劣化信号の特徴がある程度保持されるため、目的音への影響が少なくなる。そのため、目的音の歪が軽減される。
本実施形態によれば、第2実施形態の効果に加えて、位相の回転量を制限することにより、目的音の劣化を低減させることができる。
(第7実施形態)
本発明の第7実施形態について、図17を用いて説明する。本実施形態に係る本発明は、位相成分を遅延させ、フレーム間での位相成分の差分を求めた上でそこから補正量を算出する点で第4実施形態と異なる。つまり、振幅制御部1708の内部構成において第2実施形態と異なる。他の構成および動作は第2実施形態と同様であるためここではその説明を省略する。
図17は、本実施形態における振幅制御部1708の構成を示すブロック図である。図17に示すように、本実施形態における位相制御部202は、回転後の位相を振幅制御部1708に供給する。また振幅制御部1708は、位相成分遅延部1781、補正量算出部1782および振幅補正部882を含む。
位相成分遅延部1781は、位相制御部202から供給された強調信号位相スペクトルを1フレーム分保持し、補正量算出部1782に供給する。
補正量算出部1782は位相成分遅延部1781からの1フレーム前の強調信号位相スペクトルと位相制御部202からの現在の強調信号位相スペクトルから振幅補正量を算出し、振幅補正部882に伝達する。
本実施形態によれば、第2実施形態の効果に加えて、位相の変化量から数学的に出力レベルの期待値を導出できない場合でも出力レベルを補正することができる。
補正量算出部1782は、前フレームと現フレームの強調信号位相スペクトルから各周波数で合成ベクトルの大きさを求め、その大きさから補正係数を決定する。前フレームの位相をα,現フレームの位相をβとすると、その合成ベクトルの大きさ|S´|は、以下の式(64)で表わされる。
Figure 2014084000
連続するフレームで位相が一致する場合の合成ベクトルの大きさ|S|は、式(55)において既に導出しているように|S|=2である。よって、振幅補正量は、以下の式(65)で表わされる。
Figure 2014084000
本実施形態は、この値を、振幅制御部708に供給し、強調信号振幅スペクトルを補正することで、出力レベルの低下を解消することができる。本実施形態において、振幅制御部以外の構成および動作については、第2実施形態と同様であるためここではその説明を省略する。
(第8実施形態)
本発明の第8実施形態について、図18を用いて説明する。図18は、本実施形態に係る位相制御部202および振幅制御部1808の構成を示すブロック図である。
本実施形態は、入出力比算出部1881を含む点で、図8(第4実施形態)と異なる。入出力比算出部1881は、入力端子206からの劣化信号および逆変換部204からの強調信号を受け取り、その入出力レベル比を算出する。入出力比算出部1881は、入出力レベル比を補正量算出部1882に供給する。補正量算出部1882は、強調信号のレベルが劣化信号と同等になるように、補正量を算出する。振幅補正部882は、算出された補正量により強調信号振幅スペクトルを補正する。
入出力比算出部1881は、劣化信号と強調信号の時間領域信号から、そのレベルの比を求める。
第nフレームの劣化信号yn(t)と第nフレームの強調信号xn(t)のレベル比Rは、以下の式(66)で表わされる。ここで、tはサンプル時間を示す。Lはフーリエ変換のフレーム長を示す。
Figure 2014084000
補正量算出部1882は、この比の値Rと位相回転を行った周波数成分の数により、振幅補正量Gを求める。時間領域信号が変換部によりN個の周波数成分に分割され、そのうちM個の位相スペクトルに対し、位相回転を行った場合、振幅補正量Gは、以下の式(67)のように求められる。
Figure 2014084000
また、振幅補正部882は、変化量生成部203から伝達された位相回転の有無の情報より、位相回転が行なわれた周波数のみで振幅補正を行なう。本実施形態において、入出力比算出部1881および補正量算出部1882以外の構成および動作については、第4実施形態と同様であるためここではその説明を省略する。
本実施形態によれば、時間領域の信号から補正係数を求めているため、位相回転量がいかなる方法で決定されても、出力レベルを補正できる。
(第9実施形態)
本発明の第9実施形態について、図19を用いて説明する。図19は、本実施形態に係る振幅制御部1908の構成を示すブロック図である。図19に示すように、本実施形態における振幅制御部1908は、第8実施形態に含まれる入出力比算出部1881に加え、平均化処理部1981を含む。平均化処理部1981以外の構成および動作については、第8実施形態と同様であるためここではその説明を省略する。
平均化処理部1981は、入力端子206から劣化信号を受け取り、平均化処理を施した上で、その平均値を入出力比算出部1881に供給する。また、平均化処理部1981は逆変換部204から強調信号を受け取り、平均化処理を施した上で、その平均値を入出力比算出部1881に供給する。入出力比算出部1881は平均化処理部1981から劣化信号および強調信号の平均値を受け取り、そのレベル比を算出する。
平均化処理部1981は、任意の時間長で劣化信号および強調信号のレベルを平均化する。具体的には、平均化処理部1981は、移動平均や漏れ積分などを用いて劣化信号および強調信号のレベルを平均化する。
本実施形態によれば、第8実施形態の効果に加えて、平均化されたレベルを使用するため、補正量の変動が抑制され、出力信号の品質向上が実現できる。
(第10実施形態)
本発明の第10実施形態について、図20および図21を用いて説明する。図20は、本実施形態に係る雑音抑圧装置2000の構成を示す図である。本実施形態に係る雑音抑圧装置2000は、第2実施形態の図2の構成に加え、振幅成分遅延部2011、位相成分遅延部2012および逆変換部2013を含む。また、振幅制御部2008の内部構成にも差異がある。本実施形態において、振幅成分遅延部2011、位相成分遅延部2012および振幅制御部2008以外の動作については、第2実施形態と同様であるためここではその説明を省略する。
入力端子206に供給された劣化信号210は、変換部201と振幅制御部2008に供給される。変換部201は、劣化信号振幅スペクトル230を振幅成分遅延部2011および逆変換部2013に供給する。また、変換部201は、劣化信号位相スペクトル220を位相制御部202および変化量生成部203に供給する。位相制御部202は、変換部201から供給された劣化信号位相スペクトル220を、変化量生成部203で生成された変化量を用いて制御し、強調信号位相スペクトルとして逆変換部2013および位相成分遅延部2012に供給する。また、変化量生成部203は、各周波数における位相回転の有無を、振幅制御部2008へ伝達する。
逆変換部2013は、変換部201から供給された劣化信号振幅スペクトル230と位相制御部202から供給される劣化信号位相スペクトルを用いて、位相回転によるレベル低下の生じた信号を振幅制御部2008に伝達する。
振幅成分遅延部2011は、変換部201からの劣化信号振幅スペクトル230を遅延させ、振幅制御部2008に供給する。
位相成分遅延部2012は、位相制御部202からの強調信号位相スペクトルを遅延させ、逆変換部204に供給する。振幅制御部2008は、逆変換部2013の出力と劣化信号210とを用いて、振幅成分遅延部2011から供給される劣化信号振幅スペクトルを制御し、補正振幅スペクトル750を生成する。
逆変換部204は、位相制御部202から位相成分遅延部2012を介して供給された、強調信号位相スペクトル240と、振幅制御部2008から供給された補正振幅スペクトル750とを合成して逆変換を行い、強調信号として、出力端子207に供給する。
劣化信号位相スペクトル220は、位相制御部202で制御され、逆変換部2013において時間領域の信号に変換される。振幅制御部2008は、その信号と劣化信号210とを用いて、位相回転によるレベルの変動量を求める。
この変動量は位相制御部202による回転処理のみの変動である。そのため、振幅制御部2008は、位相の回転によるレベル変動を正確に捉えることができる。振幅制御部2008は、このレベル比を用いて振幅補正を行なうが、求まるレベル比は1フレーム前のものである。
そこで、振幅成分遅延部2011と位相成分遅延部2012を導入し、1フレーム前の周波数成分に対して、振幅制御部2008において振幅補正を行なう。
図21は、本実施形態に係る位相制御部202および振幅制御部2008の内部構成を説明するためのブロック図である。入出力比算出部2181は、入力端子206から供給される劣化信号と逆変換部2013から供給される、位相回転によるレベル低下分を含んだ信号から、レベル比を算出し、補正量算出部2182に供給する。
補正量算出部2182は、変化量生成部203から各周波数における位相回転の有無の情報を受け取り、振幅補正量を算出する。振幅補正部882は、その振幅補正量に基づいて、強調信号振幅スペクトルを各周波数で補正し、逆変換部204へ供給する。
本実施形態に係る雑音抑圧装置2000は、第8実施形態の効果に加え、第8実施形態および第9実施形態では不可避だった入出力比の遅延を回避でき、より正確な出力レベルの補正を実現できる。
(第11実施形態)
本発明の第11実施形態について、図22を用いて説明する。図22に示すように、本実施形態に係る雑音抑圧装置2200は、第4実施形態の構成に加え、フレームオーバーラップ制御部2208を含む。フレームオーバーラップ制御部2208は、変換部201および逆変換部204において、フレーム分割、合成されるときのオーバーラップ率の制御を行なう。フレームオーバーラップ制御部2208は、そのオーバーラップ率を振幅制御部708に供給する。既に説明したとおり、位相回転によるレベル低下はオーバーラップによって生じる。このレベル低下量はオーバーラップ率により変化し、オーバーラップ率が大きくなるほど、低下量も大きくなる。よって、オーバーラップ率が変化した場合には、振幅補正量を制御する必要がある。具体的には、オーバーラップ率50%の場合の振幅補正量Gを基準に補正量を求める。
オーバーラップ率が0%のとき振幅補正は必要ない。また、オーバーラップ率50%のとき振幅補正量はGである。そこで、フレーム長Lとオーバーラップ長Qの比を用いて、以下の式(68)のようになる。ここで、G´はオーバーラップ率による補正を行った振幅補正量である。
Figure 2014084000
例えば、オーバーラップ率50%の場合は、Q=L/2であるので、以下の式(69)
が成立する。オーバーラップ率25%の場合には、Q=L/4より以下の式(70)が成立する。
Figure 2014084000
Figure 2014084000
振幅制御部708は、式(68)に基づき、位相制御部202から伝達された補正係数を補正し、強調信号振幅スペクトルを補正する。本実施形態において、フレームオーバーラップ制御部2208以外の構成および動作については、第4実施形態と同様であるためここではその説明を省略する。
本実施形態に係る雑音抑圧装置2200は、第4実施形態の効果に加えて、フレームのオーバーラップ率を自由に設定できる。
(第12実施形態)
本発明の第12実施形態としての雑音抑圧装置2300について図23を用いて説明する。図23は、雑音抑圧装置2300の全体構成を示すブロック図である。本実施形態の雑音抑圧装置2300は、振幅分析部205と振幅抑圧部2306を有する。これら以外の構成要素とその動作は、第2実施形態と等しいので詳細な説明を省略する。
本実施形態は、振幅抑圧を行った結果に対して振幅分析を行い、位相制御を適用する周波数を決定する。振幅抑圧を行って目的とする信号の振幅を強調した結果を分析するので、より正確な分析を行なうことができ、目的信号成分の品質低下を防止することができる。
本実施形態は、振幅分析部205の入力が振幅抑圧部2306の出力であるため、抑圧後の振幅情報を用いた振幅分析を行なうこともできる。例えば、抑圧の結果、背景雑音(環境雑音)の振幅近傍まで抑圧された周波数成分は、知覚可能であるが、振幅自体は小さい。しかし、振幅抑圧によって抑圧前の位相をそのまま用いると振幅と位相の組合せに大きな違和感を生じる。そこで、第1の閾値として背景雑音レベルより少し小さな振幅を設定する。
第1閾値として背景雑音レベルより少し小さな振幅を設定し、第1閾値よりも大きな振幅を位相制御する周波数として設定することによって、位相制御をしないときに強調信号の違和感の大きくなる周波数で確実に位相制御を行なうことができるので、目的信号成分の品質を向上させることができる。また、前記の方法で背景雑音を適応的に推定することによって、あらゆる環境において、目的信号成分の品質を向上させることができる。
(第13実施形態)
本発明の第13実施形態としての雑音抑圧装置2400について図24を用いて説明する。図24は、雑音抑圧装置2400の全体構成を示すブロック図である。本実施形態の雑音抑圧装置2400において、振幅分析部2405は、振幅抑圧部2306で振幅抑圧する前と後の振幅に対して振幅分析を行い、位相制御を適用する周波数を決定する。これら以外の構成要素とその動作は、第3実施形態と等しいので詳細な説明を省略する。
本実施形態によれば、振幅抑圧の程度に応じて位相制御する周波数を決定することができるので、目的信号成分の品質を向上させることができる。
振幅分析部2405には、変換部201から劣化信号振幅スペクトルが、振幅抑圧部2306から強調信号振幅スペクトルが供給される。振幅分析部2405は、振幅抑圧する前と後の振幅に対して振幅分析を行い、位相制御を適用する周波数を決定する。例えば、振幅抑圧前後の振幅差(あるいは比)が大きい場合は、強調信号の位相として劣化信号の位相をそのまま利用すると違和感が大きくなる。そこで、前記振幅差または振幅比があらかじめ定められた第4閾値を超えるときに、その周波数を位相制御の対象と設定する。位相制御をしないときに強調信号の違和感の大きくなる周波数で確実に位相制御を行なうことができるので、目的信号成分の品質を向上させることができる。
さらに、振幅分析部2405は、振幅差または振幅比があらかじめ定められた第4閾値を超え、抑圧後の振幅が推定背景雑音の推定振幅に近いときに、その周波数を位相制御の対象と設定してもよい。強調信号の主観品質に影響の大きい背景音近傍レベルの振幅に対応した周波数で、確実に位相制御することができ、非目的信号成分の品質を向上させることができる。
(他の実施形態)
以上説明してきた第1乃至第13実施形態では、それぞれ別々の特徴を持つ雑音抑圧装置について説明したが、それらの特徴を如何様に組み合わせた雑音抑圧装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用してもよいし、単体の装置に適用してもよい。さらに、本発明は、実施形態の機能を実現するソフトウェアの信号処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWWサーバも、本発明の範疇に含まれる。
図25は、第1実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ2500の構成図である。コンピュータ2500は、入力部2501と、CPU2502と、出力部2503と、メモリ2504とを含む。
CPU2502は、信号処理プログラムを読み込むことにより、コンピュータ2500の動作を制御する。すなわち、CPU2502は、メモリ2504に格納された信号処理プログラムを実行し、第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および振幅成分またはパワー成分に変換する(S2511)。次に、CPU2502は、前記振幅成分またはパワー成分を分析して、それらがあらかじめ定めた条件に適合する所定周波数を導き出す(S2512)。位相成分よりも相互相関が弱いデータ系列を用いて、所定周波数の位相成分の変化量を生成する(S2513)。生成された変化量に応じて、CPU2502は、所定周波数の位相成分を制御する(S2514)。CPU2502は、ステップS2514により制御処理を加えられた位相成分を用いて強調信号を生成する(S2515)。
これにより、第1実施形態と同様の効果を得ることができる。なお、第2〜第13実施形態についても同様であり、それらの実施形態の機能を実現する信号処理プログラムをCPUが実行することにより構成されたシステムも本発明の範疇に含まれる。この出願は、2012年11月27日に出願された日本出願特願2012−259219号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (9)

  1. 第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換手段と、
    前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析手段と、
    前記位相成分よりも相互相関が弱いデータ系列を用いて、前記所定周波数の前記位相成分の変化量を生成する変化量生成手段と、
    前記変化量生成手段から提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御手段と、
    前記位相制御手段によって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換手段と、
    を備えたことを特徴とする信号処理装置。
  2. 前記振幅分析手段は、絶対可聴閾値より大きな振幅を有する周波数を位相制御すべき前記所定周波数と決定することを特徴とする請求項1に記載の信号処理装置。
  3. 前記振幅分析手段は、マスキングレベルより大きな振幅を有する周波数を位相制御すべき前記所定周波数と決定することを特徴とする請求項1または2に記載の信号処理装置。
  4. 前記振幅分析手段は、第1閾値より大きく第2閾値よりも小さな振幅を有する周波数を位相制御すべき周波数として決定することを特徴とする請求項1、2または3に記載の信号処理装置。
  5. 前記振幅分析手段は、前記振幅成分に含まれるスペクトルのピークとして検出された周波数を位相制御すべきでない周波数として決定することを特徴とする請求項1乃至4のいずれか1項に記載の信号処理装置。
  6. 前記振幅分析手段は、高周波数域の前記振幅成分が所定値よりも大きい場合に、該高周波数域を位相制御すべきでない周波数として決定することを特徴とする請求項1乃至5のいずれか1項に記載の信号処理装置。
  7. 前記振幅分析手段は、背景雑音レベルに基づいて、位相制御すべきでない周波数を決定することを特徴とする請求項1乃至6のいずれか1項に記載の信号処理装置。
  8. 第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換ステップと、
    前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析ステップと、
    前記位相成分よりも相互相関が弱いデータ系列を用いて、前記所定周波数の前記位相成分の変化量を生成する変化量生成ステップと、
    前記変化量生成ステップで提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御ステップと、
    前記位相制御ステップによって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換ステップと、
    を含むことを特徴とする信号処理方法。
  9. 第1信号と第2信号とが混在した混在信号を、周波数ごとの位相成分および周波数ごとの振幅成分またはパワー成分に変換する変換ステップと、
    前記振幅成分またはパワー成分があらかじめ定めた条件に適合する所定周波数を導き出す振幅分析ステップと、
    前記位相成分よりも相互相関が弱いデータ系列を用いて、前記所定周波数の前記位相成分の変化量を生成する変化量生成ステップと、
    前記変化量生成ステップで提供された変化量を用いて、前記所定周波数の前記位相成分を制御する位相制御ステップと、
    前記位相制御ステップによって制御処理を加えられた位相成分を用いて強調信号を生成する逆変換ステップと、
    をコンピュータに実行させることを特徴とする信号処理プログラム。
JP2014550099A 2012-11-27 2013-11-01 信号処理装置、信号処理方法、および信号処理プログラム Active JP6300031B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012259219 2012-11-27
JP2012259219 2012-11-27
PCT/JP2013/079702 WO2014084000A1 (ja) 2012-11-27 2013-11-01 信号処理装置、信号処理方法、および信号処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2014084000A1 true JPWO2014084000A1 (ja) 2017-01-05
JP6300031B2 JP6300031B2 (ja) 2018-03-28

Family

ID=50827646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014550099A Active JP6300031B2 (ja) 2012-11-27 2013-11-01 信号処理装置、信号処理方法、および信号処理プログラム

Country Status (3)

Country Link
US (1) US9401746B2 (ja)
JP (1) JP6300031B2 (ja)
WO (1) WO2014084000A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
US9312826B2 (en) 2013-03-13 2016-04-12 Kopin Corporation Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
CN107045874B (zh) * 2016-02-05 2021-03-02 深圳市潮流网络技术有限公司 一种基于相关性的非线性语音增强方法
JP6668995B2 (ja) * 2016-07-27 2020-03-18 富士通株式会社 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP7352383B2 (ja) * 2019-06-04 2023-09-28 フォルシアクラリオン・エレクトロニクス株式会社 ミキシング処理装置及びミキシング処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257049A (ja) * 2007-04-06 2008-10-23 Yamaha Corp 雑音抑圧装置およびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4006770B2 (ja) 1996-11-21 2007-11-14 松下電器産業株式会社 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
DE69712537T2 (de) * 1996-11-07 2002-08-29 Matsushita Electric Industrial Co., Ltd. Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
JP4230414B2 (ja) * 1997-12-08 2009-02-25 三菱電機株式会社 音信号加工方法及び音信号加工装置
EP1041539A4 (en) * 1997-12-08 2001-09-19 Mitsubishi Electric Corp METHOD AND DEVICE FOR PROCESSING THE SOUND SIGNAL
JP4308345B2 (ja) 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US8233636B2 (en) * 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
WO2012070671A1 (ja) 2010-11-24 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
US8724828B2 (en) * 2011-01-19 2014-05-13 Mitsubishi Electric Corporation Noise suppression device
JP6070953B2 (ja) 2011-02-26 2017-02-01 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257049A (ja) * 2007-04-06 2008-10-23 Yamaha Corp 雑音抑圧装置およびプログラム

Also Published As

Publication number Publication date
US20150318902A1 (en) 2015-11-05
US9401746B2 (en) 2016-07-26
WO2014084000A1 (ja) 2014-06-05
JP6300031B2 (ja) 2018-03-28

Similar Documents

Publication Publication Date Title
JP6300031B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6079236B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
US10811026B2 (en) Noise suppression method, device, and program
JP5310494B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6070953B2 (ja) 信号処理装置、信号処理方法、及び記憶媒体
JP5788873B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6064600B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
JP2011100031A (ja) 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6011536B2 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP2011100029A (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JP6662413B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6119604B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP2018031820A (ja) 信号処理装置、信号処理方法、及び、信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180214

R150 Certificate of patent or registration of utility model

Ref document number: 6300031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150