JP6438786B2 - 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム - Google Patents

信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム Download PDF

Info

Publication number
JP6438786B2
JP6438786B2 JP2015020902A JP2015020902A JP6438786B2 JP 6438786 B2 JP6438786 B2 JP 6438786B2 JP 2015020902 A JP2015020902 A JP 2015020902A JP 2015020902 A JP2015020902 A JP 2015020902A JP 6438786 B2 JP6438786 B2 JP 6438786B2
Authority
JP
Japan
Prior art keywords
frequency
sine component
phase
output
frequency bin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015020902A
Other languages
English (en)
Other versions
JP2015165300A (ja
Inventor
利信 吉田
利信 吉田
Original Assignee
利信 吉田
利信 吉田
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 利信 吉田, 利信 吉田 filed Critical 利信 吉田
Priority to JP2015020902A priority Critical patent/JP6438786B2/ja
Publication of JP2015165300A publication Critical patent/JP2015165300A/ja
Application granted granted Critical
Publication of JP6438786B2 publication Critical patent/JP6438786B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

本発明は、入力信号に含まれる正弦成分の周波数、その振幅及び位相を抽出する正弦成分抽出装置及び正弦成分抽出方法ならびにその正弦成分抽出方法を適用したプログラムに関する。
雑音除去、音声強調の研究において、雑音重畳音声から元音声を取り出す際に音声の振幅を統計的に推定し、位相には雑音重畳音声の位相が用いられてきた。
この位相については、雑音重畳音声の位相を用いることの是非が議論されているが、近年,元音声の位相を推定して雑音除去性能を向上させる研究が非特許文献1などに見受けられるようになってきた。
一方、音声信号などの入力信号に含まれる正弦成分を抽出する研究がなされてきた。例えば、特許文献1には,微分方程式とその積分表現を用いて正弦成分の周波数,振幅及び位相を抽出することについての記載がある.特許文献2には、音声信号の正弦成分を瞬時周波数アトラクタとして抽出することにより、正弦成分を抽出することについての記載がある。特許文献3には、瞬時周波数アトラクタを用いた周期信号の基本周波数(周期の逆数)を抽出する方法についての記載がある。
WO2008/136443号公報 特開2004−109809号公報 特開2006−171008号公報
Matthew McCallum and Bernard Guillemin: "Stochastic−Deterministic MMSESTFT Speech Enhancement With General APriori Information,"IEEE TRANSACTION ON AUDIO,SPEECH,AND LANGUAGE PROCESSING,VOL.21,NO.7,pp.1445−1457,JULY 2013. ALBERT H. NUTTALL: "Some Windows eith Very Good Sidelobe Behavior," IEEE TRANSACTION ON ACOUUSTICS, SPEECH,AND SIGNAL PROCESSING, VOL. ASSP−29, NO.1,pp.84−91, FEBRUARY 1981.
特許文献1及び特許文献2に記載されたように、信号に含まれる正弦成分を検出する様々な方法が従来から提案されている。また、特許文献3に記載されたように、周期信号の基本周波数の検出についても様々な方法が提案されている。さらに、非特許文献1に記載されているように、音声信号の雑音除去や音声強調などにおいても、元音声の位相まで含めた正弦成分を利用する方法が提案されている。
しかしながら、これら従来から提案されている方法では正弦成分の検出精度がそれほど高くないという問題があった。
本発明は、雑音が重畳している信号から正弦成分を抽出するための基礎となる方法として、雑音が重畳していない信号について、窓関数の特性を利用して入力信号に含まれる正弦成分の周波数、その振幅及び位相を検出する正弦成分抽出装置、正弦成分抽出方法及びプログラムを提供することを目的とする。
本発明の信号中に含まれる正弦成分抽出装置は、フーリエ変換部と、正弦成分検出部と、比算出部と、周波数検出部と、正弦成分算出部とを備える。
フーリエ変換部は、入力信号に窓関数を乗算してフーリエ変換する。
正弦成分検出部は、フーリエ変換部が変換して得た周波数ビンの出力の振幅と位相に対し、特定の周波数ビンの近傍の周波数ビンの出力の振幅よりも、その特定の周波数ビンの出力の振幅が大きく、かつ、近傍の周波数ビンの出力の位相がその特定の周波数ビンの出力の位相とほぼ同じであるような特定の周波数ビンを検出する。
比算出部は、正弦成分検出部が検出した特定の周波数ビンの出力と、その周波数ビンの近傍の周波数ビンの出力から、それらの出力の振幅の比を算出する。
周波数検出部は、比算出部が得た比から入力信号に含まれる正弦成分の周波数を検出する。
正弦成分算出部は、フーリエ変換部が変換して得た特定の周波数ビンの出力と、周波数検出部が検出した正弦成分の周波数から、窓関数の特性を利用して、その正弦成分の振幅及び位相を算出する。
ただし、周波数が互いに数ビン程度近接している正弦成分がある場合、これらの周波数に近い中心周波数を持つそれぞれのビンの信号の値には、これらの正弦成分をフーリエ変換した信号の和が表れる。したがって、この場合はそれぞれの正弦成分の周波数に最も近い中心周波数を持つそれぞれのビンの出力の振幅は、必ずしもそれらの近傍のビンの出力の振幅より大きいとは限らず、また、近傍のビンの出力の位相は、ほぼ同じ位相にならないことがある。このような場合については、それぞれの正弦成分の近傍のビン間の振幅・位相に対して別々に、比算出部、周波数検出部、正弦成分算出部を用い、正弦成分を分離する。
本発明の正弦成分抽出方法は、入力信号に窓関数を乗算してフーリエ変換するフーリエ変換工程と、フーリエ変換工程で変換して得た特定の周波数ビンの出力の振幅と位相と、その周波数ビンの近傍の周波数ビンの出力の振幅と位相から入力信号に含まれる正弦成分を検出する正弦成分検出工程を含む。また、正弦成分検出工程により検出した特定の周波数ビンの出力と、その周波数ビンの近傍の周波数ビンの出力から、それらの出力の振幅の比を算出する比算出工程と、比算出工程により算出した比から入力信号に含まれる正弦成分の周波数を検出する周波数検出工程を含む。
さらに、フーリエ変換部が変換して得た特定の周波数ビンの出力と、周波数検出部が検出した正弦成分の周波数から、窓関数の特性を利用して、その正弦成分の周波数、振幅及び位相を検出する正弦成分算出工程を含む。
ただし、周波数が互いに数ビン程度近接している正弦成分がある場合、それぞれの正弦成分の近傍のビン間の振幅・位相に対して別々に、比算出工程、周波数検出工程、正弦成分算出工程を経ることにより正弦成分を分離する。
本発明のプログラムは、入力信号に窓関数を乗算してフーリエ変換するフーリエ変換手順と、フーリエ変換手順で変換して得た特定の周波数ビンの出力の振幅と位相と、その周波数ビンの近傍の周波数ビンの出力の振幅と位相から入力信号に含まれる正弦成分を検出する正弦成分検出手順と、正弦成分検出手順により検出した特定の周波数ビンの出力と、その周波数ビンの近傍の周波数ビンの出力から、それらの出力の振幅の比を算出する比算出手順と、比算出手順により得られた比から入力信号に含まれる正弦成分の周波数を検出する周波数検出手順を実装し、さらに、フーリエ変換部が変換して得た特定の周波数ビンの出力と、周波数検出部が検出した正弦成分の周波数から、窓関数の特性を利用して、その正弦成分の振幅及び位相を算出する正弦成分算出手順を、コンピュータに実装して実行させる。
ただし、周波数が互いに数ビン程度近接している正弦成分がある場合、それぞれの正弦成分の近傍のビン間の振幅・位相に対して、別々に比算出、周波数検出、正弦成分算出をする手順を含む。
本発明によると、フーリエ変換して得た各周波数ビンの出力が入力信号に含まれる正弦成分の位相と等しいことを利用して、その検出した正弦成分の周波数を正確に求めることができる。また、本発明によると、フーリエ変換して得た周波数ビンの出力と、検出した周波数を利用して、検出した正弦成分の振幅と位相を抽出することができる。
本発明の実施の形態例による正弦成分抽出装置の構成を示すブロック図である。 本発明の実施の形態例による正弦成分抽出処理を示すフローチャートである。 窓関数の特性例を示す図である。 隣接する周波数ビンの重なりの例を示す図である。 隣接する周波数ビンへの出力の例を示す図である。 それぞれの周波数ビンの正弦成分の例を示す図である。 第k番目の周波数ビンの出力の振幅に対する第k+i番目の周波数ビンの出力の振幅の比の例を示す図である。 周波数ビンの出力の振幅の比に対する周波数の例を示す図である。 近接した正弦成分がある場合の例を示す図である。 近接した正弦成分がある場合の各周波数ビンの出力の例を示す図である。 本発明の適用例(その1)を示すブロック図である。 本発明の適用例(その2)を示すブロック図である。
[1.実施の形態例の装置構成]
図1に、本発明の実施の形態例の正弦成分抽出装置の構成例を示す。
入力端子11に得られる入力信号が、乗算器13に供給される。
乗算器13は、入力信号に、窓関数入力端子12に得られる窓関数をずらしながら乗算する。窓関数は後段の離散フーリエ変換回路14でのフーリエ変換用の窓関数である。窓関数は実数値偶関数である。
乗算器13で窓関数が乗算された入力信号は、フーリエ変換部である離散フーリエ変換回路14に供給される。離散フーリエ変換回路14は、窓関数が乗算された入力信号を短時間フーリエ変換する。離散フーリエ変換に高速フーリエ変換を用いることができる。
離散フーリエ変換回路14がフーリエ変換した信号は、記憶部15に供給され記憶される。記憶部15は、離散フーリエ変換回路14がフーリエ変換した信号を、フーリエ変換によって生成された周波数ビンごとに記憶する。
そして、記憶部15に記憶された信号は、正弦成分検出部16に供給され、正弦成分を含むビンが検出される。
入力端子11に得られる入力信号中に正弦成分が複数あり、それらの周波数が互いに十分離れていて、一つのビンに複数の正弦成分が現れない場合に、正弦成分検出部16は、記憶部15で記憶された周波数ビンの信号の内で、振幅が極大、すなわち、近傍のビンの出力の振幅よりも大きく、かつ、位相が同相、すなわち、近傍のビンの出力の位相と等しい周波数ビンを検出する。例えば、正弦成分検出部16が周波数ビンkを検出したとき、周波数ビンkに近接した周波数ビンk−1,k−2,…と周波数ビンk+1,k+2,…の信号の振幅は周波数ビンkの信号の振幅より小さく、これらの近接した周波数ビンの信号の位相は周波数ビンkの信号の位相と等しい。周波数ビンkに近接した周波数ビンk−1,k−2,…と周波数ビンk+1,k+2,…の範囲は窓関数に依存して決まる。
入力端子11に得られる入力信号中に正弦成分が複数あり、周波数が互いに数ビン程度近接している正弦成分がある場合、これらの周波数の間に中心周波数を持つビンの信号の出力には、これらの正弦成分をフーリエ変換した信号の和が表れる。したがって、このビンの信号の位相は、この近傍のビンの信号の位相とは必ずしも同位相にはならない。しかし、低い周波数の正弦成分に最も近いビンに対して、そのビンより低い周波数のビンでは、高い周波数の正弦成分の影響は少なくなり、それらのビン間の位相は同相になる。同様に、高い周波数の正弦成分に最も近いビンに対しても、そのビンより高い周波数のビンでは、低い周波数の正弦成分の影響は少なくなり、それらのビン間の位相は同相になる。
具体的には、ある特定の周波数ビンで第1の正弦成分の位相の信号を検出し、その特定の周波数ビンに近接した周波数ビンで第1の正弦成分の位相とほぼ同じ位相の信号を検出したとき、それらの周波数ビンの信号を記憶部15から読み出して、比算出部17に供給する。また、これらの読み出した周波数ビンとは別の周波数ビンから第2の正弦成分の位相の信号を検出し、第2の正弦成分の位相の信号を検出した周波数ビンに隣接した周波数ビン(又は近傍の周波数ビン)で第2の正弦成分の位相とほぼ同じ位相の信号を検出したとき、その2つの周波数ビンの信号を記憶部15から読み出して、比算出部17に供給する。
正弦成分検出部16の指示で記憶部15から読み出された特定の周波数ビンとその近接した周波数ビンの信号は、比算出部17に供給される。比算出部17は、供給される特定の周波数ビンに対するその近接した周波数ビンの出力の振幅の比をそれぞれ算出する。比算出部17での算出結果は、周波数検出部18に供給され、特定の周波数ビンに対するその近傍の周波数ビンの出力との比の算出結果から入力信号に含まれる正弦成分の周波数を抽出し、出力端子19から出力する。特定の周波数ビンに対するその近接した周波数ビンの出力の振幅の比を算出する数式の例については後述する。
また、周波数検出部18が抽出した正弦成分の周波数は、正弦成分算出部20に供給される。正弦成分算出部20は、特定の周波数ビンの信号と正弦成分の周波数から、窓関数の特性を利用して、正弦成分の振幅と位相を算出して、その振幅値Aと位相値φを振幅・位相出力端子21に供給する。
[2.実施の形態例の処理工程]
次に、図2のフローチャートを参照して、実施の形態例の正弦成分抽出装置で行われる処理の流れを説明する。
まず、離散フーリエ変換回路14が、窓関数が乗算された入力信号の短時間フーリエ変換処理を行う(ステップS21)。この短時間フーリエ変換処理のために乗算された窓関数は、窓長の時間軸中点を時刻0とする実数値偶関数である。また、離散フーリエ変換回路14は、乗算器13で入力信号に窓掛けをすることによって短時間フーリエ変換を行うことができる。
そして、正弦成分検出部16は、正弦成分を含む周波数ビンを検出する(ステップS22)。短時間フーリエ変換で得た周波数ビンの出力の振幅が近傍のビンの出力の振幅よりも大きく、かつ、近傍のビンの出力の位相と等しい周波数ビンがあるか否かを判断する。入力した信号に近接した正弦成分が含まれるときは、振幅が近傍のビンの出力の振幅よりも大きくても、位相が近傍のビンの出力の位相と等しくなるとは限らないが、その場合には、近傍のビン間で位相が等しいビンを検出する。
正弦成分を含む周波数ビンが検出できない場合には、処理を終了する。
次に、比算出部17が、ステップS22で選ばれた周波数ビン間の出力の振幅の比を算出する(ステップS23)。周波数検出部18がその比の値から正弦成分の周波数fを抽出する(ステップS24)。さらに、正弦成分算出部20が、周波数検出部18で抽出した正弦成分の周波数f、窓関数の特性、および、正弦成分を含む周波数ビンの出力から振幅Aと位相φを算出する(ステップS25)。
次に、ステップS22の判断に戻り、正弦成分検出部16が、別の正弦成分を含む周波数ビンがあるか否かを判断する。
[3.具体的な検出状態の例]
次に、実施の形態例で示した処理を行う具体的な例について説明する。
まず、入力端子11に得られる入力信号x(t)が、以下の[数1]式で示すように、振幅Aと初期位相φを持つ周波数fの正弦成分であるとする。
Figure 0006438786
この正弦成分に対して、窓関数w(t)を用いて以下に示す[数2]式で定義される短時間フーリエ変換を行う。ここで、Lは窓長であり、窓関数w(t)は、窓長Lの時間軸中点を時刻0とする実数値偶関数である。X(k,t)は、短時間フーリエ変換で得られたk番目の周波数ビンの出力であり、W(ξ)は、[数3]式で定義される窓関数w(t)のフーリエ変換である。(厳密には W(-ξ)が窓関数w(t)のフーリエ変換であるが、窓関数w(t)が実数値偶関数であることから、W(ξ)は W(-ξ)等しい。)[数2]式と[数3]式から[数4]式に示されるように,信号x(t)のW(fL−k)倍が、k番目の周波数ビンの出力X(k,t)である。
Figure 0006438786
Figure 0006438786
Figure 0006438786
窓関数w(t)は、実数値で偶関数であることから、[数3]式のようにW(ξ)を定義すると、この値W(ξ)は実数になる。
したがって、[数4]式より、周波数ビンkに依らずにX(k,t)の位相はx(t)の位相に等しく、振幅はx(t)のW(fL−k)倍である。
例えば、非特許文献2に示されているnタームの窓では、窓関数w(t)は[数5]式のように定義される。
Figure 0006438786
この[数5]式の窓関数を用いたとき、W(ξ)は、以下の[数6]式で表される。
Figure 0006438786
非特許文献2に示されているように、[数3]式で定義されるW(ξ)は矩形窓を除きメインローブの幅が2ビン以上ある。例えばハミング(Hamming)窓やハニング(Hanning)窓などの2タームの窓では、前後2ビン、合計4ビンの幅を持ち、ミニマム3ターム(Minimum 3-term)窓などの3タームの窓では、前後3ビン、合計6ビンの幅を持つ。また、一般にnタームの窓では、前後nビン、合計2nビンの幅を持つ。
上記のようにnタームの窓関数のメインローブの幅が2nビンであることから、正弦成分の周波数が(k−n)/L<f<(k+n)/Lの範囲(ξ=fL−kと置くと、−n<ξ<nの範囲)にあれば、周波数ビンkのメインローブの中に正弦成分x(t)の周波数fがあり、周波数ビンkの出力X(k,t)に正弦成分x(t)が現れる。
また、このことは周波数fの正弦成分の短時間フーリエ変換は、fL−n<k<fL+nの範囲の周波数ビンkのそれぞれのメインローブの中にあり、正弦成分x(t)はそれぞれの周波数ビンkの出力X(k,t)にも現れる。
図3に、窓関数がミニマム3ターム(Minimum 3-term)窓の場合のW(ξ)の例を示す。図3において横軸はξの値であり、縦軸がデシベル値である。この図3から分かるように、ミニマム3ターム窓を用いたとき、周波数ビンのサイドローブは、―71.48dB以下に抑えられていることが分かる。ミニマム4ターム窓では、サイドローブはー98.17dB以下に抑えられる。
図4は、窓関数がミニマム3ターム(Minimum 3-term)窓の場合の近接する周波数ビンの重なりを示す図である。この図4に示すように、W(ξ)はW(ξ−3)、W(ξ−2)、W(ξ−1)、W(ξ+1)、W(ξ+2)、W(ξ+3)と重なっている。
窓関数がミニマム3ターム(Minimum 3-term)窓の場合、図3からわかるように、周波数fの正弦成分に対する周波数ビンkにおけるξが、ξ=fL−kであることから、周波数ビンkの出力には、−3<ξ<3、すなわち(k−3)/L<f<(k+3)/Lの範囲の周波数の正弦成分が含まれる。
このことは逆に、窓関数のサイドローブにおける|W(ξ)|が十分小さければ、周波数fの信号は、その近傍の周波数ビンにだけ出力が現れる。ミニマム3ターム(Minimum 3-term)窓に対しては、周波数ビンkについて、ξ=fL−kより、図4の−0.5<ξ<0.5の範囲の周波数fの正弦成分は、k−3番目の周波数ビンからk+3番目の周波数ビンに出力が現れる。
たとえば、周波数fがξ=fL−k=−0.4となる正弦成分に対しては、図5に示すように、周波数ビンk−2には信号x(t)にW(−0.4+2)を掛けた信号が、周波数ビンk−1にはW(−0.4+1)を、周波数ビンk,k+1,k+2には、それぞれW(−0.4),W(−0.4−1),W(−0.4−2)を掛けた信号が出力される。
周波数fがξ=fL−k=−0.4となる正弦成分に対する、ある時刻tにおけるX(k,t)のフェーザを図6に示す。このように、[数4]式からも分かるように、X(k,t)の近傍のビンの出力は同じ位相を示す。すなわち、図6に示すそれぞれの周波数ビンの信号は、位相を示す傾きが等しく、信号の振幅が異なっている。図1に示す正弦成分検出部16では、それぞれの周波数ビンの位相(図6での傾き)が同じであることが検出される。
次に、このように示される周波数ビンの内の2つのビン間の出力の比から、正弦成分が求まることを説明する。
まず、正弦成分の周波数fに最も近い中心周波数を持つ周波数ビンをkとする。このとき、ξ=fL−kと置くと、ξは−0.5<ξ<0.5の範囲にある。
周波数fの正弦成分の近傍に他の正弦成分がない場合は、[数4]式から近傍の周波数ビンk+i(i=・・・,−2,−1,0,1,2,・・・)での値は、次のようになる。
Figure 0006438786
Figure 0006438786
ここで、W(ξ−i)とW(ξ)が実数であることより、X(k+i,t)とX(k,t)はx(t)と同位相となり、それぞれの振幅の比をとるとx(t)の振幅が約分され、以下に示すようにW(ξ−i)とW(ξ)の比になる。
Figure 0006438786
この[数9]式の右辺は信号に依存せず、窓関数w(t)だけで定まる。そこで、右辺のdB値を以下のように、ξの関数r(ξ)と定義する。
Figure 0006438786
(ξ)の逆関数r −1(r)も信号に依存せず、窓関数だけで定まる。
X(k+i,t)とX(k,t)の振幅の比のdB値rを、次式[数11]のように求める。
Figure 0006438786
正弦成分に対しては[数9]式が成り立つことより、[数10]式および[数11]式からr=r(ξ)が得られる。したがって、正弦成分の周波数fを、逆関数r −1(r)を用いて、次式[数12]、[数13]のように求めることができる。
Figure 0006438786
Figure 0006438786
さらに、この周波数fを用いると、W(ξ)を計算することができ、[数4]式よりx(t)を、次式[数14]より求めることができる。
Figure 0006438786
次に、窓関数がミニマム3ターム(Minimum 3-term)窓のときの例を示す。
ミニマム3ターム窓に対しては、正弦成分の周波数fと周波数ビンkに対してξ=fL−kとすると、r(ξ)[dB]は、図7に示すようになる。この図7は、第k番目の周波数ビンの出力に対する第k+i番目の周波数ビンの出力の比を示す。
ここで、ミニマム3ターム窓の場合には、r(ξ)の逆関数r −1(r)を、例えば、以下の[数15]式に示すように逆正接関数を用いて近似することができる。図8は、この逆関数を示す図であり、周波数ビンの出力の比に対するξを示す。
Figure 0006438786
ここで、周波数ビン間の出力の比から正弦成分を求める手順をまとめると、以下のようになる。
1.信号x(t)の短時間フーリエ変換X(k,t) (k=0,1,・・・ )を求める。
2.信号x(t)中に複数の正弦成分があっても、それらの周波数が互いに十分離れ、X(k+i,t) (i=・・・,−2,−1,0,1,2,・・・)に複数の正弦成分が含まれていない場合は、その正弦成分について以下を行う。
(a)正弦成分の周波数fに最も近い中心周波数を持つ周波数ビンをkとし、ξ=fL−kとする。近傍に他の正弦成分がないときには、X(k+i,t)(i=・・・,−2,−1,0,1,2,・・・)はx(t)と同位相になる。
(b)[数11]式を用いて、X(k+i,t)とX(k,t)の振幅の比のdB値rを求める。
(c)[数12]式,[数13]式を用いて周波数fを計算する。
(d)周波数fからW(ξ)を計算し、[数14]式を用いてx(t)を求める。
(e)[数1]式からx(t)の振幅A、位相φを求める。
次に、周波数が近接する2つの正弦成分がある場合の具体的な検出状態について説明する。
ここでは、信号x(t)が第1の正弦成分x(t)と第2の正弦成分x(t)の和x(t)=x(t)+x(t)であり、それぞれの周波数fとfが近接している場合を考える。これらの周波数に近い周波数ビンの短時間フーリエ変換の値X(k,t)は、[数16]式となる。
Figure 0006438786
周波数fと周波数fが互いに数ビン程度近接している場合は、W(fL−k)とW(fL−k)が共に無視できない値を持つ。そのため、正弦成分が一つの場合のように単純に|X(k+i,t)|と|X(k,t)|の比を取ることはできない。
ここで、ξ=f1L−kと置き、−0.5<ξ<0.5とし、x(t)の周波数がηビン離れ、fL=fL+ηとする。
まず、ηが正の場合、つまり、低い周波数の正弦成分をx(t)とする場合を説明する。
信号x(t)が、ηビン離れた2つの正弦成分x(t)とx(t)の和であることから、次の[数17]式,[数18]式で表される。
Figure 0006438786
Figure 0006438786
ηが正で、ある程度大きい場合は、次の[数19]式が成立し、[数17]式[数18]式は[数20]式のように近似できる。
Figure 0006438786
Figure 0006438786
このとき、X(k−2,t)とX(k−1,t)は、x(t)とほぼ同位相になる。
そこで、[数11]式及び[数9]式から、次の[数21]式が成立する。
Figure 0006438786
また、正弦成分x(t)の周波数fを逆関数r−1 −1(r)を用いて、次の[数22]式及び[数23]式のように求めることができる。
Figure 0006438786
Figure 0006438786
この周波数f1を用いて、W(ξ+1)を求め、次の[数24]式からx1(t)を求め、その振幅と位相を求めることができる。
Figure 0006438786
但し、ηが正であっても、その値が余り大きくない場合、つまり、2つの周波数が非常に接近している場合は、[数19]式が成立せず、この方法を用いることはできない。
次に、ηが負の場合、つまり、高い周波数の正弦成分をx(t)とする場合を説明する。
ηが負の場合、次の[数25]式及び[数26]式で示される。
Figure 0006438786
Figure 0006438786
ここで、ηが負で、その絶対値がある程度大きい場合は、次の[数27]式が成立し、[数25], [数26]式は[数28]式に近似できる。
Figure 0006438786
Figure 0006438786
このとき、X(k+1,t)とX(k+2,t)は、x(t)とほぼ同位相になり、ηが正のときと同様に、次の[数29]式が成立する。
Figure 0006438786
正弦成分x(t)の周波数fを逆関数r −1(r)を用いて、次の[数30]式及び[数31]式のように求めることができる。
Figure 0006438786
Figure 0006438786
この周波数fを用いて、W(ξ−1)を求め、次の[数32]式からx(t)を求め、その振幅と位相を求めることができる。
Figure 0006438786
なお、このηが負の場合にも、2つの周波数が非常に接近している場合は、この手法を用いることはできない。
次に、周波数が互いに数ビン程度近接している正弦成分がある場合の例として、窓関数がミニマム3ターム窓のときの例を示す。
ここでは、図9に示すように、周波数fがξ=fL−k=−0.4となる正弦成分と2ビン離れたξ=1.6の正弦成分が存在する場合を想定する。
図10は、この周波数fがξ=fL−k=−0.4とξ=1.6の正弦成分に対するある時刻tにおけるX(k,t)と、その成分X(k,t)及びX(k,t)を示す。
図10において、破線のラインがξ=−0.4のX(k,t)成分であり、一点鎖線のラインがξ=1.6のX(k,t)成分である。そして、実線の欄がこれらを合成したX(k,t)である。なお、図1に示す構成で、実際に各ビンで検出される信号は、合成した成分である。
この図10に示すように、近接したビンに正弦成分がある場合は、各ビンの出力はそれぞれの成分を合わせたものとなり、同じ位相にはならない。しかしながら、他の正弦成分から離れたビン間では、同じ位相となる。図1の構成では、この同じ位相のビンを検出して、x(t)やx(t)の推定を行うものである。
ここで、周波数が近接する二つの正弦成分がある場合に、それぞれの正弦成分を求める手順をまとめると以下のようになる。
1.x(t)の短時間フーリエ変換X(k,t)(k=0,1,・・・ )を求める。
2.x(t)中に複数の正弦成分があり、近接する信号成分の周波数が近接しすぎず、[数19]式あるいは、[数27]式が成り立つ場合は、以下のように正弦成分の抽出を行う。
(a)[数21]式あるいは[数29]式を用いて、周波数fの正弦成分に対応するビンから離れたビン間の振幅の比rを計算する。
(b)この比rから、[数22]式あるいは[数30]式を用いて、ξを計算する。
(c)ξから、[数23]式あるいは[数31]式を用いて、周波数fを計算する。
(d)周波数fから、[数24]式あるいは[数32]式を用いて、x(t)を求め、その振幅と位相を求める。
以上説明したように本発明の正弦成分抽出装置によると、信号を短時間フーリエ変換をし、正弦成分の周波数に近い中心周波数を持つ周波数ビンの出力に対する近傍のビンの出力の振幅の比から、窓関数の特性を用いることでその正弦成分の周波数fを求めることができ、また、各ビンからの出力が正弦成分の位相と等しいことを利用して、正弦成分の振幅と位相を抽出することができる。
このため、本発明によると、信号中から正弦成分が抽出できるようになり、信号の周波数推定、ピッチ同期分析、波動の到来方向推定など様々な分野で本発明が利用できる。また、本発明は、雑音が重畳している信号から正弦成分を抽出するための基礎となる方法であり、雑音除去、音声強調,音声や楽曲などの信号分離の基礎技術として期待できる。
[4.適用例]
図11は、本発明の正弦成分抽出装置を音解析に適用した例である。
すなわち、図11に示すように、マイクロフォン1と音入力装置2とを接続する。そして、音入力装置2は、マイクロフォン1から入力された信号による音信号を生成する。音入力装置2により生成された音信号は、音声解析装置3に供給される。
また、音入力装置2により生成された音信号は、正弦成分抽出装置4に供給される。この正弦成分抽出装置4は、図1に示す構成の装置であり、音信号に含まれる正弦成分として、音信号に含まれる基本周波数の正弦成分やその高調波の正弦成分を抽出する。そして、正弦成分抽出装置4で抽出された正弦成分の周波数,振幅,位相の情報が、音声解析装置3に供給される。音声解析装置3は、正弦成分抽出装置4から供給される正弦成分の周波数,振幅,位相の情報に基づいて、入力した音信号の解析を行い、解析結果を出力端子5に出力する。
図12は、本発明の正弦成分抽出装置を音源分離に適用した例である。
すなわち、図12に示すように、マイクロフォン1から音入力装置2に入力された信号による音信号を生成し、その生成された音信号が音源分離装置6に供給される。音源分離装置6は、マイクロフォン1に入力された音が、複数の正弦成分からなる音である場合に、その複数の音源成分を分離するものである。
ここで、音入力装置2が生成した音信号が、正弦成分抽出装置4に供給され、この正弦成分抽出装置4が音信号に含まれる正弦成分を抽出し、抽出された正弦成分の周波数,振幅,位相の情報が、音源分離装置6に供給される。音源分離装置6は、正弦成分抽出装置4から供給される正弦成分の周波数,振幅,位相の情報に基づいて、入力信号に含まれるそれぞれの音源からの正弦成分を分離し、個別の出力端子7,8に出力する。例えば入力信号が複数の楽曲の演奏信号であるときには、図12の構成を利用して、1つ1つの楽器ごとの演奏信号を分離することができる。
これら図11,図12は正弦成分抽出装置の適用例のごく一部の例であり、その他の各種信号処理に適用可能である。音信号や楽曲の演奏信号に適用することも一例であり、その他の信号に含まれる周波数成分の抽出に適用が可能である。
また、図1に示した正弦成分抽出装置の構成は、好適な一例を示したものであり、本発明の正弦成分抽出装置及び抽出方法は、図1に示す構成のものに限定されない。例えば、実施の形態例のフーリエ変換処理を行うプログラムを実装したコンピュータ装置を用意して、そのコンピュータ装置での演算処理で、同様の正弦成分抽出処理を行うようにしてもよい。コンピュータ装置に実装するプログラムとしては、例えば図2に示した手順を実行するものとする。
1…マイクロフォン、2…音入力装置、3…音声解析装置、4…正弦成分抽出装置、5,7,8…出力端子、6…音源分離装置、11…信号入力端子、12…窓関数入力端子、13…乗算器、14…離散フーリエ変換回路、15…記憶部、16…正弦成分検出部、17…比算出部、18…周波数検出部、19…周波数出力端子、20…正弦成分算出部、21…振幅・位相出力端子

Claims (8)

  1. 入力信号に窓関数を乗算してフーリエ変換するフーリエ変換部と、
    前記フーリエ変換部が変換して得た特定の周波数ビンの出力の振幅と位相と、その周波数ビンの近傍の周波数ビンの出力の振幅と位相から入力信号に含まれる正弦成分を検出する正弦成分検出部と、
    前記正弦成分検出部が検出した特定の周波数ビンの出力の位相と、その周波数ビンの近傍の周波数ビンの出力の位相がほぼ同じである周波数ビンについて、それらの出力の振幅の比を算出する比算出部と、
    前記比算出部が算出した比から前記入力信号に含まれる正弦成分の周波数を検出する周波数検出部とを備える
    信号中に含まれる正弦成分抽出装置。
  2. 前記比算出部が算出して抽出した周波数を、正弦成分を定義する式に代入して、正弦成分の振幅又は位相を算出する正弦成分算出部を備えた
    請求項1に記載の信号中に含まれる正弦成分抽出装置。
  3. 前記窓関数は、窓長の時間軸中点を時刻0とする実数値偶関数で窓の両端で値が小さくなる特性を持つ関数であり、前記窓長を有限に設定することで、前記フーリエ変換部が短時間フーリエ変換を行う
    請求項1または2に記載の信号中に含まれる正弦成分抽出装置。
  4. 前記フーリエ変換部が変換して得た周波数ビンの出力の位相として、第1の正弦成分の位相と第2の正弦成分の位相が含まれ、それぞれの正弦成分の位相が別の複数の周波数ビンの出力から検出されたとき、前記比算出部は、それぞれの位相の2つの周波数ビンの出力の比を算出して、入力信号に含まれる複数の正弦成分を検出する
    請求項1〜3に記載の信号中に含まれる正弦成分抽出装置。
  5. 前記比算出部が比を算出する周波数ビンは、前記フーリエ変換部が変換して得た周波数ビンの出力の内の極大を検出した周波数ビンと、その極大を検出した周波数ビンの近傍の周波数ビンで位相が等しいあるいはほぼ等しいビンである
    請求項1〜3のいずれかに記載の信号中に含まれる正弦成分抽出装置。
  6. 前記入力信号は音声信号であり、前記比算出部が算出する周波数は、音声信号に含まれる基本周波数である
    請求項1〜5のいずれかに記載の信号中に含まれる正弦成分抽出装置。
  7. 入力信号に窓関数を乗算してフーリエ変換するフーリエ変換工程と、
    前記フーリエ変換工程で変換して得た特定の周波数ビンの出力の振幅と位相と、その周波数ビンの近傍の周波数ビンの出力の振幅と位相から入力信号に含まれる正弦成分を検出する正弦成分検出工程と、
    前記正弦成分検出工程により検出した特定の周波数ビンの出力の位相と、その周波数ビンの近傍の周波数ビンの出力の位相がほぼ同じである周波数ビンについて、それらの出力の振幅の比を算出する比算出工程と、
    前記比算出工程で算出した比から前記入力信号に含まれる正弦成分の周波数を検出する周波数検出工程とを含む
    信号中に含まれる正弦成分抽出方法。
  8. 入力信号に窓関数を乗算してフーリエ変換するフーリエ変換手順と、
    前記フーリエ変換手順で変換して得た特定の周波数ビンの出力の振幅と位相と、その周波数ビンの近傍の周波数ビンの出力の振幅と位相から入力信号に含まれる正弦成分を検出する正弦成分検出手順と、
    前記正弦成分検出手順により検出した特定の周波数ビンの出力の位相と、その周波数ビンの近傍の周波数ビンの出力の位相がほぼ同じである周波数ビンについて、それらの出力の振幅の比を算出する比算出手順と、
    前記比算出手順で算出した比から前記入力信号に含まれる正弦成分の周波数を検出する周波数検出手順とを、
    コンピュータに実装して実行させる
    プログラム。
JP2015020902A 2014-02-05 2015-02-05 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム Active JP6438786B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015020902A JP6438786B2 (ja) 2014-02-05 2015-02-05 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014020582 2014-02-05
JP2014020582 2014-02-05
JP2015020902A JP6438786B2 (ja) 2014-02-05 2015-02-05 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2015165300A JP2015165300A (ja) 2015-09-17
JP6438786B2 true JP6438786B2 (ja) 2018-12-19

Family

ID=54187796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015020902A Active JP6438786B2 (ja) 2014-02-05 2015-02-05 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6438786B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6438921B2 (ja) * 2016-08-09 2018-12-19 利信 吉田 信号中に含まれる周波数や振幅が変動する正弦成分の抽出装置、抽出方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3316965B2 (ja) * 1993-09-17 2002-08-19 日本精工株式会社 周波数スペクトル分析装置

Also Published As

Publication number Publication date
JP2015165300A (ja) 2015-09-17

Similar Documents

Publication Publication Date Title
JP6138015B2 (ja) 音場測定装置、音場測定方法および音場測定プログラム
US9031248B2 (en) Vehicle engine sound extraction and reproduction
JP2019053321A (ja) 音声信号を検出するための方法および装置
WO2015129760A1 (ja) 信号処理装置、方法及びプログラム
US20160196828A1 (en) Acoustic Matching and Splicing of Sound Tracks
JP5915281B2 (ja) 音響処理装置
JP6438786B2 (ja) 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム
JP5994639B2 (ja) 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
JP5387442B2 (ja) 信号処理装置
JP6151619B2 (ja) 音場測定装置、音場測定方法および音場測定プログラム
JP2020076907A (ja) 信号処理装置、信号処理プログラム及び信号処理方法
JP2016131343A (ja) 収音装置、その方法及びプログラム
JP2010185682A (ja) 一般調和解析装置および周波数分析装置
US11408963B2 (en) Wave-source-direction estimation device, wave-source-direction estimation method, and program storage medium
JP7152112B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2008281898A (ja) 信号処理方法及び装置
JP5807914B2 (ja) 音響信号解析装置、方法、及びプログラム
JP6438921B2 (ja) 信号中に含まれる周波数や振幅が変動する正弦成分の抽出装置、抽出方法及びプログラム
JP2018049228A (ja) 音響処理装置および音響処理方法
JP7056739B2 (ja) 波源方向推定装置、波源方向推定方法、およびプログラム
JP5495858B2 (ja) 音楽音響信号のピッチ推定装置及び方法
JP5131172B2 (ja) 周期特定装置およびプログラム
JP6226465B2 (ja) オーディオ信号処理装置、録音再生装置およびプログラム
US20220342026A1 (en) Wave source direction estimation device, wave source direction estimation method, and program recording medium
JP6252274B2 (ja) 背景雑音区間推定装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171218

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20171218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20171218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181119

R150 Certificate of patent or registration of utility model

Ref document number: 6438786

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250