JP6241131B2 - 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム - Google Patents

音響用フィルタ装置、音響用フィルタリング方法、およびプログラム Download PDF

Info

Publication number
JP6241131B2
JP6241131B2 JP2013171611A JP2013171611A JP6241131B2 JP 6241131 B2 JP6241131 B2 JP 6241131B2 JP 2013171611 A JP2013171611 A JP 2013171611A JP 2013171611 A JP2013171611 A JP 2013171611A JP 6241131 B2 JP6241131 B2 JP 6241131B2
Authority
JP
Japan
Prior art keywords
frequency
filter
unit
pitch
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013171611A
Other languages
English (en)
Other versions
JP2015040963A (ja
Inventor
崇史 山谷
崇史 山谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2013171611A priority Critical patent/JP6241131B2/ja
Publication of JP2015040963A publication Critical patent/JP2015040963A/ja
Application granted granted Critical
Publication of JP6241131B2 publication Critical patent/JP6241131B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

本発明は、音響用のフィルタ装置、フィルタリング方法、およびプログラムに関する。
従来より、与えられる音響信号を表現するデジタル波形信号に対して、各音階に対応する周波数に関する周波数スペクトルのレベルを検知するために時分割で異なる特性のデジタルフィルタリング処理を順次実行して、その音響信号に含まれる1つ以上の音階音をリアルタイムで検知する技術が知られている(例えば特許文献1)。
このようにして1つ以上の音階音が求まれば、プリンタやディスプレイ上に各音階による和音を表示、印字させたり、楽譜(五線譜)形式で表示、印字させたり、あるいは楽音発生回路を介して曲の自動演奏を行ったりすることができる。
特許第2775651号公報
しかしながら、検知される音階音の正確性は、入力される音響信号に対して実行されるデジタルフィルタリング処理の性能に大きく左右される。従来技術で用いられていたデジタルフィルタリング処理は、音響信号から例えば音階音を抽出することに対して必ずしも最適なフィルタ特性を有しているとはいえず、最適な性能の音響用フィルタを実現できているとはいえないという問題点を有していた。
本発明は、音響信号に対し、干渉している成分の分解、変換、合成に最適なフィルタバンクを提供することを目的とする。
態様の一例では、音響信号が入力される音響信号入力手段と、複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、
式で示される対数周波数特性h(f)を有するフィルタと、を備える。
本発明によれば、音響信号に対し、干渉している成分の分解、変換、合成に最適なフィルタバンクを提供することが可能となる。
隣接音高A4とA#4の各々の周波数特性と、それらを加算した周波数特性の例を示す周波数特性図である。 本発明の実施形態における、A4の音高に対応する|g(t)|のフィルタ特性を示す図である。 本実施形態によるフィルタ特性との比較のために、フィルタ形状が矩形の場合の|g(t)|のフィルタ特性を示す図である。 本実施形態によるフィルタ特性との比較のために、フィルタ形状が三角形の場合の|g(t)|のフィルタ特性を示す図である。 本実施形態によるフィルタ特性との比較のために、フィルタ形状が台形の場合の|g(t)|のフィルタ特性を示す図である。 第1の実施形態のブロック図である。 第1の実施形態におけるフィルタバンク部102の詳細な構成例を示すブロック図である。 第2の実施形態におけるフィルタバンク部102の詳細な構成例を示すブロック図である。 第3の実施形態におけるフィルタバンク部102の詳細な構成例を示すブロック図である。 第1、第2、または第3の実施形態を実現可能なコンピュータのハードウェア構成例を示す図である。
以下、本発明を実施するための形態について図面を参照しながら詳細に説明する。
本発明の実施形態は、デジタル化された音響信号、特に実際の楽曲データに対し、音高の表示、音響分析、和音など干渉している成分の分解、変換、合成に最適なフィルタバンクを提供するものである。
以下、音響信号に対するフィルタバンクについて一般的に考えられる技術とその課題について説明した後に、本発明の実施形態について説明する。
音楽とは非定常な信号であり、音響信号x(t)は振幅A(t)と位相φ(t)とを用いて数2式のように表すことができる。
多くの信号処理(例えばアナログ回路など)と同様に、音響信号は、数3式に示す複素信号y(t)であると考えるのが本質である。
なお、jは虚数単位である。このy(t)を観測したものがx(t)、つまり、下記数4式に示すように、y(t)の実部がx(t)と等しいと考える。
人間の耳には、x(t)がそのまま知覚される訳ではなく、蝸牛にある多数の共振器を通して、周波数毎の刺激の強度として知覚される。このとき周波数、強度共に対数化したものが人間にはリニアに感じられる。この聴覚特性に対応して、1オクターブを所定の分割数dで分割した音高が定義される。例えば、西洋音楽では12分割(d=12)である。なお、dは用途によって任意に設定することもできる。
また、楽曲を構成する楽器音や歌声は発音の仕組みから調波構造(基音と呼ばれる周波数とその整数倍音)を持つことが知られている。これもまた対数周波数で扱うと周波数の配置が固定になるので都合がいい。
以上より、一般的な音響信号処理では、x(t)からA(t)とφ(t)を推定するのではなく、下記数5式に示すように、音響信号を周波数f毎の信号に分離し、Af(t)とφf(t)を推定することが行われる。
この分離は、時間周波数解析と呼ばれている。
時間周波数解析手法としては、主に以下の3つの手法が知られている。これらはフィルタバンクである。
(1)短時間フーリエ変換(Short−Time Fourier Transform、以下STFT)
(2)定Qフィルタバンク(CQT:Constant Q Transform、以下CQT)
Judith C.Brown,”Calculation of a constant Q spectral transform”,J.Acoust.Soc.Am.,89(1):425−434,1991
(3)複素連続ウェーブレット変換(Complex Continuos Wavelet Transform、以下CCWT)
これらの手法のうちで、最もよく用いられるのがSTFTである。
STFTは、観測時刻tを中心とする所定時間の信号を切り出し、この切り出した信号に対してフーリエ変換を実行する。フーリエ変換は周期信号に適用することが前提であるが、切り出した信号は一般的に周期性を持たないので両端で不連続になり、不要な高周波成分が発生する。この対策として、この不連続性を緩和する窓関数w(t)を乗算する。つまり、下記数6式に示すように、x(t)にw(t)を時間シフトしたものを乗じて信号の切り出しを行い、この切り出した信号に対してフーリエ変換(STFT)を実行することにより、X(f,t)が算出される。
なお、w(t)は一般的にt=0でピークを持ち、所定の範囲外で0であり、|t|が大きいほど|w(t)|が小さくなる偶関数として定義される。
実際にはx(t)は、サンプリング周波数fsで観測された離散的かつ長さMの信号である。このときのサンプル周期T(=1/fs)とすると、実際の観測はt=mT(m=0,1,…,M−1)の離散的な時刻での信号x(mT)であり、これをx[m]と表現する。なお、範囲外の観測は0を仮定する。
このような離散的な観測では、フーリエ変換は離散フーリエ変換となる。そして、窓関数の長さをNとすると、fは、下記数7式に示すように、fs/Nの整数k倍かつ|f|がナイキスト周波数fs/2未満になる。
以上より、数6式に離散信号を適応すると、STFTの結果X[k,m]は、下記数8式のようになる。
数7式から明らかなように、STFTの周波数分解能は、Nのみによって決定され、周波数によらず一定である。
もし高い周波数分解能が必要ならば、Nを大きくすればよいが、数8式はNに比例した時間の積算なので、時間分解能が低下する。このような時間分解能と周波数分解能のトレードオフは不確定性原理と呼ばれている。
この不確定性原理から、低い周波数の音高では高い周波数分解能が、高い周波数の音高では低い周波数分解能が望ましい。しかし、STFTでは音高に関わらずNが共通なのでこれを満たさない。
この問題に対処したものとして、CQTやCCWTによるフィルタバンク分析がある。
CQTは、単純に音高(周波数)毎に異なるNを用いたSTFTである。
フィルタの分離性能を表す指標にQ値と呼ばれるものがある。ここではQ値を、下記数9式で表す。なお、δfはフィルタの帯域幅(分解能に相当)である。
不確定性原理を考慮すれば、フィルタバンクを構成する全てのフィルタのQ値を等しくすること、つまり定Q性を持つことが望ましい。これは対数周波数上で各フィルタの形状が同一(合同)であればよい。勿論、振幅スケールで正規化したものが合同でも定Q性を持たせることもできるが、音高毎に振幅スケールが異なるのは音響用のフィルタとしては望ましくない。
時間領域でのフィルタをg(t)とすると、X(f,t)は、下記数10式に示すように、x(t)とg(t)の畳込みから求めることができる。
周波数領域でのこのフィルタの周波数特性G(f)は、下記数11式に示すように、g(t)をフーリエ変換したものである。
同様にg(t)は、下記数12式に示すようにG(f)を逆フーリエ変換したものになる。
前述したたように、対数周波数上で合同なフィルタは、周波数上では、周波数方向に拡大縮小したものになる。G(f)をb倍に拡大したフィルタは時間領域では、下記数13式に示すgb (t)になる。
ここでfb を、下記数14式で定義すると、数13式は数15式のように変形される。
これはg(t)を時間方向にb分の1に縮小し、振幅方向にb倍に拡大したものである。以上のケースは、Nを変化させたときの望ましい振幅スケールである。
次に、音高毎のNをN[k]とし、このN[k]について説明する。
或る音高と隣接する音高の周波数の比Dは、下記数16式で示される。
この比はδfに等しいので、Qは下記数17式のようになる。
数7式より、δfは数18式となる。
数18式と数17式から、N[k]は下記数19式のようになる。
数8式に数7式、数19式を適用し、数15式のスケールを考慮すると、X[k,m]は、下記数20式になる。
CQTでは、w(t)としては、下記数21式に示すハミング窓を使う。
CQTの周波数特性については後述する。
CCWTは、スケーリングの仕方、窓関数、Q値が異なるだけで、CQTと類似している。
マザーウェーブレットψ(t)を、時間方向にa倍(周波数上ではa分の1倍)にスケールしたウェーブレットをψaとすると、ψaは、数22式のようになる。
このとき振幅は√a分の1倍になり、数15式のスケールの仕方と異なり、音響向きではない。
なお、ψaによる変換結果Xa(t)は、下記数23式で定義される。
マザーウェーブレットで最もよく知られ一般的に利用されているものとして、モレット(ガボールとも呼ぶ)がある。これは窓関数がガウス分布で、これに複素正弦波を乗算し、周波数シフトしたものになる。
他の主要なマザーウェーブレットとしてはメキシカンハットがあるが、窓関数が、LoG(Laplacian of Gaussian)、つまりガウス分布を2階微分したものである。これは信号の変化点を検出するためのものであり音響向きではない。
モレットの周波数特性については後述する。
ここでは音響用フィルタバンクとして理想的な特徴を列挙する。
・基本性能
(1)適切な周波数分解能、時間分解能
(2)フィルタ長が短い、収束性・局所性が高い
・周波数特性
(1)隣接音高のフィルタの中心周波数で漏洩がゼロ、それ以外のフィルタで漏洩がゼロ
(2)隣接音高のオーバーラップの加算がフラット
(3)形状が滑らかに変化する
(4)中心周波数付近でフラットに近い形状
基本性能(1)は、STFTが不適切である理由から容易に導き出される。
基本性能(2)は、一般的に高性能のフィルタは無限長のものが多いが、実際の計算上有限の長さに丸める必要がある。収束性・局所性が高いほうがこの丸めの影響が少なくてすむ。またフィルタ長が短いほうが、計算時間が短くすむ。
周波数特性(1)は、単純にフィルタの分離性能の良さを表している。この特性を満たせば、フィルタ結果を単純に振幅スペクトログラムや対数スペクトログラムとして表示すれば、どの音高(整数倍音含む)がなっているか簡単にわかる。漏洩が範囲・振幅などで大きければ表示前に何らかの後処理が必要になるし、音響データはダイナミックレンジが広いので、ある音高で観測されたデータが他の音高の大きな音の漏洩かこの音高の小さい音がなっているかの判断が難しい。なお、隣接音高への漏洩をある程度許容しているのは基本性能(2)を考慮している。
周波数特性(2)は、表示以外の用途を考慮したものである。特に干渉成分の分解を考慮している。或る周波数成分は音高が隣接する2つ以下のフィルタで観測される。このとき元の成分はその周波数に応じた所定の比率に分割され、各々のフィルタで観測される。もし、干渉成分を構成する周波数が既知で、その分割比率が異なるならば、干渉前の成分に分解できる可能性がある。その他としては、周波数特性(2)を満たすならば、フィルタバンク全体の通過帯域でフラットになる。このことは分析、変換、合成などで音質を保つことにも役立つ。
周波数特性(3)は、基本性能(2)を考慮したものである。形状が急峻に変化すると時間領域での収束性・局所性が低下する。
周波数特性(4)は、チューニングの違いが与える影響を小さくするためのものである。一般的にはA4の音高が440Hzになるように楽器は調律する。但し、楽曲によっては、調律用の基準周波数ftが440Hzと異なるものも存在する。従って、例えばftが約446Hz(440Hzに対して8分の1音高い)になっても、表示上の破綻が少ない特性が望ましい。
以下に、CQTとCCWTのモレットの周波数特性について説明する。
まずは、数10式と数6式から、STFTやCQTでは、g(t)は下記数24式のように表せる。
これは、w(t)を時間反転したものを周波数変調したものである。同様に、数10式と数23式より、g(t)は下記数25式のようになる。
モレットも前述したようにガウス分布を周波数変調したものであるから、g(t)は、ガウス分布を時間反転したものを周波数変調したものに等しい。
ハミング窓もガウス分布も実偶関数なので、時間反転しても変わりはない。よって、各々のg(t)は窓関数を周波数変調したものであるから、G(f)は、窓関数をフーリエ変換したものを変調周波数分シフトしたものになる。
窓関数は実偶関数なので、そのフーリエ変換も実偶関数になる。つまりG(f)は、変調周波数を中心に周波数に対し対称な形状になる。これでは、対数周波数上では非対称な形状になるため、周波数特性(2)を満たす見込みがない。
特にモレットの場合は、周波数特性(2)を近似的に満たすこともない。なぜなら、ガウス分布をフーリエ変換したものはガウス分布になることが知られているが、異なるガウス分布を加算してもオーバーラップがフラットになることはないからである。さらに本質的には周波数特性(1)を満たさない。また、3σが隣接音高の周波数になるようにして近似的に打ち切るとしても、この場合は周波数特性(4)を満たすことはできない。つまり周波数特性(1)と周波数特性(4)をバランスよく満たすことはできない。なお、約446Hzの信号を440Hzのフィルタで分析すると、元の信号の約0.5836倍で観測される。
次に隣接音高A4とA4#の各々の周波数特性と、それらを加算した周波数特性を、図1に示す。図1(a)がCQTの場合で、図1(b)がモレットの場合である。図1で、点線がA4、破線がA4#、実線が加算である。
図1(a)よりCQTは、周波数特性(1)を満たさないことが見て取れる。また、CQTは、周波数特性(2)も満たしていない。
図1(b)よりモレットも、周波数特性(2)を満たしていない。また、モレットは、周波数特性(1)と周波数特性(4)をバランスよく満たすことができないことが見て取れる。
以上より、一般的に考えられる時間周波数分析は音響用に適さないという課題がある。
これらの課題を解決する本発明の実施形態について、以下に詳細に説明する。
まず、本発明の実施形態における音響向けフィルタバンクについて、前述した理想的な特徴をもとに説明する。
前述した周波数特性(1)から、時間領域ではなく、周波数領域でフィルタを設定する必要がある。また前述した周波数特性(2)から、対数周波数上において、フィルタの中心周波数fcで対称な形状とする。以上より、本実施形態では、フィルタの形状を対数周波数上で設定し、これに対応するG(f)を逆フーリエ変換して、時間領域でのg(t)を求めるものとする。
ここからは、フィルタの形状に関しては対数周波数上で、そしてこれに対応する周波数上の形状をh(f)として説明する。なお、h(f)はナイキスト周波数未満の正の周波数のみを考える。また全ての周波数で実数のみをもつ。つまり、フィルタによって位相は変化しないものとする。
フィルタの形状について説明する前に、h(f)とG(f)の関係を先に説明する。実数の信号x(t)から複素数の信号y(t)を推定するので、g(t)は複素数である必要がある。また、h(t)は実数のみをとるので、G(f)も実数のみとする。もし、G(f)が実偶関数ならば、g(t)は実偶関数になるので、g(t)の実部は、負の周波数が、下記数26式を満たせばよい。
一方、G(f)が実奇関数ならば、g(t)は虚奇関数になるので、g(t)の虚部については、負の周波数が、下記数27式を満たせばよい。
そして、g(t)は実部と虚部を加算したものに等しいが、負の周波数は相殺されゼロになり、結局、下記数28式に示すように、G(f)はh(f)を2倍したものになる。
前述した周波数特性(1)から、h(f)は下記数29式を満たす。
また、前述した周波数特性(2)から、h(f)は下記数30式を満たす。
なお、h(f)は対数周波数上でfcに対して対称形をなすので、下記数31式を満たす。
これらを満たす形状として、三角形、台形、ハン窓(ハニング窓ともいう)がある。
さらに、前述した周波数特性(3)と周波数特性(4)を条件として加えると、三角形と台形は不適格である。以上より、ハン窓を、本実施形態で提案する形状とする。ハン窓では、約446Hzの信号を440Hzのフィルタで分析すると、元の信号の約0.8536倍で観測される。これは、モレットと比較すると、前述した周波数特性(4)への適合が圧倒的に優れる。また、前述した周波数特性(1)を満たしていることから、周波数特性(1)と周波数特性(4)をバランスよく満たしているといえる。
よって、本実施形態で提案するフィルタのh(f)は、下記数32式となる。
なお、調律用の基準周波数をft、基準周波数より低い音高の数をNL、基準周波数より高い音高の数をNHとすると、fcは、下記数33式のようになる。
そして、数28式、数12式から、g(t)は、下記数34式のようになる。
上記数34式は、解析的に解くことができないので、数値積分で計算を実行する。このとき、h(f)の周波数分解能は、例えば0.01〜0.1Hz程度あれば、実用上問題ない。
また、g(t)は、|t|を大きくしてもゼロにはならないので、有限の長さに打ち切る必要がある。ここでは、数値積分したg(t)をg[n]とし、打ち切り後の長さを2L+1とすると、下記数35式に示すようなg[n]の絶対値和の比率が定義できる。
この比率が所定値以上になるLを求めて打ち切りを行えばよい。例えばこの所定値を0.99〜0.999程度にする。なお、絶対値和の変わりに2乗和を用いてもよい。この場合は、所定値をより大きくとる必要がある。
図2は、本実施形態における、A4の音高に対応する|g(t)|のフィルタ特性を示す図である。図2から、このフィルタ特性は、収束性・局所性があることが見て取れる。つまり、前述した基本性能(2)を満たす。
また、図3A、図3B、および図3Cは、本実施形態によるフィルタ特性との比較のために、フィルタ形状が矩形、三角形、台形の場合の|g(t)|の各フィルタ特性を示す図である。図3Aから、矩形は収束性・局所性が明らかに悪いことがわかる。また、図3Bに示される三角形、図3Cに示される台形も、本実施形態で提案するフィルタ特性に比べて、収束性・局所性が悪いことがわかる。
以上のようにして、以下の第1、第2、第3の実施形態で使用される音響用フィルタバンクとして、理想的な特性を有するフィルタが実現される。
上述の理想的なフィルタ特性を有するフィルタバンクを時間領域で効果的に演算することのできる本発明の第1の実施形態について、以下に説明する。
第1の実施形態では、逐次入力される音響データを、対数スペクトログラム表示することを可能にする。
図4は、第1の実施形態の構成例を示すブロック図である。図4において、101は音響データ取得部、102はフィルタバンク部、103は対数スペクトル演算部、104は表示データ生成部、105は表示部である。
音響データ取得部101は、逐次入力されるデータx[m]を取得し、フィルタバンク部102に供給する。
フィルタバンク部102は、x[m]をフィルタ処理し、音高毎のX[m]、X[p,m](p=−NL,−NL+1,…,NH)を計算する。なお、X[p,m]は1秒当たりfs個計算することができるが、用途が表示用の場合これは明らかに過大性能であり、S個に1回計算すれば十分である。よって、X[p,Sの倍数]のデータのみ計算すればよい。例えば、x[m]が、CDと同等のfs=44100Hzの場合で表示が1秒当たり100点、つまり10msに一回あればよければ、S=441になる。Sの値は、用途により適切に設定する。
対数スペクトラム演算部103は、フィルタバンク部102で計算したX[p,m]の複素数から、下記数36式に示すように振幅の対数を計算する。
実際には、上記数36式のようにパワーの対数を0.5倍したほうが計算は速い。なお、数36式において、XR[p,m]は下記数37式に示すようにX[p,m]の実部を、XI[p,m]は下記数38式に示すようにX[p,m]の虚部を意味する。
表示データ生成部104は、対数スペクトラム演算部103での演算結果に基づいて、対数スペクトログラムを表示用データとして生成する。具体的には、横軸が時間、縦軸が音高の2次元画像で、画素値としては、対数スペクトルに応じたグレイスケールやカラーのデータが与えられる。
表示部105は、表示データ生成部104で生成した表示用データに基づいて、2次元画像を表示する。
図5は、第1の実施形態におけるフィルタバンク部102(時間領域を示す記号tを付けた参照番号102tを付与する)の詳細な構成例を示すブロック図である。図5において、201は折り返し加算部、202は折り返し減算部、203は実部演算部、204は虚部演算部、205は実部虚部統合部である。
前述した数10式から、X[p,m]は、下記数39式のようになる。ここでg[p,n]は対応する音高のg[n]を、L[p]は対応する音高のLを表す。
g[p,n]の実部gR[p,n]を下記数40式のように、虚部gI[p,n]を下記数41式のように定める。
g[n]は、実部が偶関数、虚部が奇関数なので、下記数42式および下記数43式を満たす。
前述した数39式に前述した数37式、数40式、および数42式を適用すると、XR[p,m]は、下記数44式のようになる。
ここで、R[m,n]は、下記数45式のように定める。
前述した数39式に前述した数38式、数41式、および数43式を適用すると、XI[p,m]は、下記数46式のようになる。
ここで、I[m,n]は、下記数47式のように定める。
R[m,n]とI[m,n]は全ての音高で共有可能で、最長でも最低音高のL[p]に対応する分を予め計算すれば、フィルタ処理の計算量を半分にできる。但し、最低音高でもフィルタ処理自体は半分になるが、前処理としてR[m,n]とI[m,n]の計算かあるので相殺され速くはならない。つまり、全体としては最低音高以外のフィルタ処理の計算量が半分になる。
以上を踏まえて、図5のブロック図を説明する。
折り返し加算部201は、前述した数45式に示すR[m,n]の計算を行う。この計算は全ての音高で共通である。
折り返し減算部202は、前述した数47式に示すI[m,n]の計算を行う。この計算も全ての音高で共通である。
実部演算部203は、前述した数44式に示すXR[p,m]の計算によりフィルタ処理を行う。この計算は音高毎に行う。
虚部演算部204は、前述した数46式に示すXI[p,m]の計算によりフィルタ処理を行う。この計算も音高毎に行う。
実部虚部統合部205は、実部演算部203で計算したXR[p,m]と、虚部演算部204で計算したXI[p,m]を統合して、X[p,m]を求める。
以上によりフィルタバンク処理を実行することができる。また、第1の実施形態の構成によれば、前述したように計算量を半分とまではいかないが大幅に減らすことができる。さらに、保持すべきフィルタ係数g[p,n]も半分に減らすことができる。
なお、第1の実施形態で説明した効率的なフィルタバンク演算方法は、表示以外の用途にも適用可能である。
以上説明した第1の実施形態では、前処理として折り返し加減算処理を行うことによって、フィルタ処理本体の計算量を約半分に削減することが可能となる。これにより、時間領域でのフィルタバンク処理を高速化することが可能となる。
次に、前述した理想的なフィルタ特性を有するフィルタバンクを周波数領域で効果的に演算することのできる本発明の第2の実施形態について、以下に説明する。
第2の実施形態では、蓄積済み音響データを、対数スペクトログラム表示することを可能にする。
第2の実施形態の構成例を示すブロック図は、第1の実施形態の場合の図4と同様である。第1の実施形態の場合との違いは、音響データ取得部101が取得するデータが、逐次入力ではなく、蓄積済みデータを一括で取得可能な点である。
音響データが一括で取得可能な場合は、畳み込み定理により周波数領域上でフィルタを演算したほうが一般的に計算が速い。
図6は、第2の実施形態におけるフィルタバンク部102(周波数領域を示す記号fを付けた参照番号102fを付与する)の詳細な構成例を示すブロック図である。図6において、301はパディング量決定部、302はFFT(高速フーリエ変換演算部)、303はフィルタ処理部、304はIFFT(逆高速フーリエ変換演算部)、305はオンデマンドIDFT(逆離散フーリエ変換演算部)、306はIFFT計算時間推定部、307はオンデマンドIDFT計算時間推定部、308は低域決定部である。
パディング量決定部301は、一括取得した音響データの末尾に値ゼロをパディングする量を決定する。なお、「パディング」とは、例えば桁数(文字数)やデータ数等が所定数に足りないデータに対して、その前後等にゼロなどのデータを補うことをいう。時間領域での畳み込みは、周波数領域での乗算に相当する。このような計算はデータが周期性を持っていれば問題ないが、音響データは一般的に周期性を持たないので音響データの先頭部分と末尾部分が干渉しないようにパディングを行う。音楽は無音から始まり無音で終わるのでパディングはゼロで行う。この際、最低でも最低音高のL[p]*2のパディング量が必要である。さらに、効率的にFFTを実行するため全体のパディング量を決定する。パディング後のデータ数をMp とし、このMp は、下記数48式のように、素数Pr [i]の積に因数分解されるものとする。
FFTは、Mp が因数分解可能な場合に、DFTに対して演算量を劇的に減らすことができる演算方法である。DFTの計算時間TDFT が下記数49式であるのに対し、FFTの計算時間TFFT は下記数50式のようになる。
よって、FFTはDFTに比べ圧倒的に速い。また、上記数50式より、なるべく小さい素数で構成されたMp の方が計算時間は短くなる。ただし、無理に小さい素数に分解しようとしてもパディング量が増えてMp が大きくなり計算時間が増えるので、バランスを考慮する。なお、多くのFFTライブラリでは、素数が小さい場合はより高速に演算可能な工夫がされていることがあり、素数毎の補正係数CFFT [Pr ]を用いて、TFFT は、下記数51式のように求めることができる。
そして、TFFT が最小になるMp を逆算し、パディング量を決定する。ところで、多くの場合、Mp の候補はそれほど多くないので、予めMp の候補をテーブルなどで保持し、これを元にパディング量を決めてもよい。
FFT302では、x[m]の高速フーリエ変換を実行し、周波数領域の信号X[k]に変換する。この処理は全ての音高で共通である。なお、ここでは、パディング量決定部301で決定したパディングを行う。実際多くのFFTライブラリでは、入力データ数Mより大きいMp を計算データ数として指定すると、不足データ数分のゼロパディングを行う。
フィルタ処理部303では、FFT302で求めたX[k]と、前述した数28式および数32式から計算したG[k]の乗算を行う。この処理は音高毎に行う。
IFFT304では、フィルタ処理部303の処理結果を、逆高速フーリエ変換により時間領域に戻す。この処理は、低域決定部308により非低域とされた音高のみで実行される。
オンデマンドIDFT305では、フィルタ処理部303の処理結果を、逆離散フーリエ変換により時間領域に戻す。このとき、オンデマンドの計算、つまりG[k]が非ゼロの周波数のみ、また間引き後の時間のみの計算を行う。この処理は、低域決定部308により低域とされた音高のみで実行される。
IFFT計算時間推定部306は、IFFTの計算時間TIFFTを推定する。前述した数50式と同様にして、TIFFTは、下記数52式から求めることができる。
ここで、CIFFT[Pr ]は補正係数である。この推定は全ての音高で共通である。なお、Mp はそれほど多くないので、IFFT計算時間を予め計測したものをテーブルなどで保持し、これを参照するようにしてもよい。
さらに、オンデマンドIDFT計算時間推定部307は、オンデマンドIDFTの計算時間TIDFT[p]の推定を行う。TIDFT[p]は、下記数53式から求めることができる。
ここで、CIDFTは補正係数、Lf [p]はG[k]の非ゼロの係数の数である。この推定は音高毎に行う。
低域決定部308は、ある音高が低域かどうかを決定する。TIFFTは、前述した数52式よりMp のみに依存し、SやLf [p]には依存しない。つまり、TIFFTは、音高に関わらず一定である。一方、TIDFT[p]は、不要部分の計算をする必要がなく、前述した数53式より、Sが大きいつまり間引き量が多いほど、また、Lf [p]が小さいつまり音高が低いほど、その計算は速くなる。よって、TIDFT[p]<TIFFTになる音高を、低域とする。
以上により、音高が低域の場合はオンデマンドIDFTを、非低域の場合はIFFTを選択的に実行することで、周波数領域でのフィルタバンクを効果的に演算することができる。
なお、第2の実施形態で説明した効率的なフィルタバンク演算方法は表示以外の用途にも適用可能である。
以上説明した第2の実施形態では、逆フーリエ変換として、IFFTの他にオンデマンドIDFTを追加し、IFFTの計算時間の推定値と音高毎のオンデマンドIDFTの計算時間の推定値から、音高毎により短い方を選択的に実行する。これにより、周波数領域でのフィルタバンク処理を高速化することが可能となる。
続いて、前述した理想的なフィルタ特性を有するフィルタバンクを効果的に演算することのできる本発明の第3の実施形態について、以下に説明する。
第3の実施形態でも、上述した第2の実施形態と同様に、蓄積済み音響データを、対数スペクトログラム表示することを可能にする。
第3の実施形態の構成例を示すブロック図は、第2の実施形態の場合の図4と同様である。第3の実施形態では、第2の実施形態の場合と同様に、音響データ取得部101は蓄積済みデータを一括で取得可能とする。
音響データが一括で取得可能な場合は、畳み込み定理により周波数領域上でフィルタを演算したほうが一般的に計算が速いが、条件によっては時間領域で演算したほうが演算が速い場合がある。
図7は、第3の実施形態におけるフィルタバンク部102の詳細な構成例を示すブロック図である。図7において、102tは時間領域フィルタバンク部、102fは周波数領域フィルタバンク部、401は時間領域フィルタ計算時間推定部、402は周波数領域フィルタ計算時間推定部、403は高域決定部である。
時間領域フィルタバンク部102tは、第1の実施形態における図5に示される構成を有するものと同等のものである。この処理は、高域決定部403により高域とされた音高のみで実行される。なお、折り返し加算部201および折り返し減算部202は、実行する音高のうち最も低い音高のL[p]に対応する分のみで十分である。
周波数領域フィルタバンク部102fは、第2の実施形態における図6に示される構成を有するものと同等のものである。この処理は、高域決定部403により非高域とされた音高のみで実行される。
次に、時間領域フィルタ計算時間推定部401は、時間領域におけるフィルタの計算時間TTD[p]を推定する。TTD[p]は、下記数54式から求めることができる。
ここで、CTDは、補正係数である。この推定は音高毎に行う。
一方、周波数領域フィルタ計算時間推定部402は、周波数領域におけるフィルタの計算時間TFD[p]を推定する。TFD[p]は、下記数55式から求めることができる。
ここで、CFMは、補正係数である。この推定も音高毎に行う。
高域決定部403は、ある音高が高域かどうかを決定する。TTD[p]は、上記数54式より、Sが大きいつまり間引き量が多いほど、また、L[p]が小さいつまり音高が高いほど、その計算は速くなる。一方、TFD[p]は、上記数55式より、Lf [p]が大きいつまり音高が高いほど、その計算は遅くなる。よって、TTD[p]<TFD[p]になる音高を、高域とする。
以上により、音高が高域の場合は時間領域フィルタバンクを、非高域の場合は周波数領域フィルタバンクを選択的に実行することで、フィルタバンクを効果的に演算することができる。
ここでは、不可避かつ固定のコストとして、折り返し加減算の計算時間やFFTの計算時間を考慮しないで高域を決定したが、これらを考慮して高域を決定してもよい。実際に折り返し加減算の計算時間は固定ではないし、高域の境界に多少影響がある。また、全ての音高が高域かの判定にはFFTの計算時間が影響する。
なお、第3の実施形態で説明した効率的なフィルタバンク演算方法は、表示以外の用途にも適用可能である。
以上説明した第3の実施形態では、時間領域でのフィルタバンク処理、周波数領域でのフィルタバンク処理を共に備え、音高毎に時間領域での計算時間の推定値と周波数領域での計算時間の推定値から、音高毎により短い方を選択的に実行する。これにより、フィルタバンク処理を高速化することが可能となる。
図8は、前述した第1、第2、または第3の実施形態の構成をソフトウェア処理として実現可能なコンピュータのハードウェア構成例を示す図である。
図8に示すコンピュータは、CPU(中央演算処理装置)501、メモリ502、入力装置503、出力装置504、外部記憶装置505、可搬記録媒体509が挿入される可搬記録媒体駆動装置506、及び通信インタフェース507を有し、これらがバス508によって相互に接続された構成を有する。同図に示す構成は上記システムを実現できるコンピュータの一例であり、そのようなコンピュータはこの構成に限定されるものではない。
CPU501は、当該コンピュータ全体の制御を行う。メモリ502は、プログラムの実行、データ更新等の際に、外部記憶装置505(或いは可搬記録媒体509)に記憶されているプログラム又はデータを一時的に格納するRAM等のメモリである。CUP501は、プログラムをメモリ502に読み出して実行することにより、全体の制御を行う。
入力装置503は、ユーザによるキーボードやマウス等による入力操作を検出し、その検出結果をCPU501に通知する。
また、入力装置503は、外部から逐次入力される音響データを受信して、CPU501に通知する。あるいは、外部記憶装置505などに蓄積済みの音響データを読み出して、CPU501に通知する。
出力装置504は、CPU501の制御によって送られてくるデータを、表示装置や印刷装置に出力する。
外部記憶装置505は、例えばハードディスク記憶装置である。主に各種データやプログラムの保存に用いられる。
可搬記録媒体駆動装置506は、光ディスクやSDRAM、コンパクトフラッシュ(登録商標)等の可搬記録媒体509を収容するもので、外部記憶装置505の補助の役割を有する。
通信インターフェース507は、例えばLAN(ローカルエリアネットワーク)又はWAN(ワイドエリアネットワーク)の通信回線を接続するための装置である。
上述した第1、第2,または第3の実施形態によるシステムは、図4から図7までのブロック図で実現される機能を搭載したプログラムをCPU501が実行することで実現される。そのプログラムは、例えば外部記憶装置505や可搬記録媒体509に記録して配布してもよく、或いはネットワーク接続装置507によりネットワークから取得できるようにしてもよい。
以上の第1、第2,または第3の実施形態に関して、更に以下の付記を開示する。
(付記1)
音響信号が入力される音響信号入力手段と、
複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた前記音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、数32式で示される対数周波数特性h(f)を有するフィルタと、を備える、
ことを特徴とする音響用フィルタ装置。
(付記2)
前記音響信号は楽音信号であり、
1オクターブの音高の分割数をd、調律用の基準周波数をft、基準周波数より低い音高の数をNL、基準周波数より高い音高の数をNHとしたときに、数34式、数33式、数16式で示される時間域フィルタ応答g(t)を有するフィルタを備える、
ことを特徴とする付記1に記載の音響用フィルタ装置。
(付記3)
前記フィルタは、
前記音響信号入力手段から入力された音響信号の実部に対し、数45式で示される折り返し加算を行う折り返し加算部と、
前記音響信号入力手段から入力された音響信号の虚部に対し、数47式で示される折り返し減算を行う折り返し減算部と、
前記折り返し加算部の出力に対し、数44式で示されるフィルタ処理を行う実数演算部と、
前記折り返し減算部の出力に対し、数46式で示されるフィルタ処理を行う虚数演算部と、
前記実数演算部で算出された実数部出力と、前記虚数演算部で算出された虚数部出力とを統合する実部虚部統合部と、
を備えることを特徴とする付記1または2に記載の音響用フィルタ装置。
(付記4)
前記音響信号入力手段は、前記音響信号が一括で取得可能であり、
前記フィルタは、
前記音響信号入力手段から入力された音響信号に対し高速フーリエ変換を行うFFT部と、
前記音響信号の音高ごとに、前記FFT部からの出力と、数28式、数32式により求められるGとの乗算を行うフィルタ処理部と、
前記フィルタ処理部において現在処理対象となった前記音響信号の音高が低域であるか非低域であるかを決定する低域決定部と、
前記低域決定部により前記音高が非低域であると判断された場合に、前記フィルタ処理部の出力に対し、逆高速フーリエ変換を行うIFFT部と、
前記低域決定部により前記音高が低域であると判断された場合に、前記フィルタ処理部の出力に対し、前記Gの非ゼロの周波数で間引きされた時間における逆離散フーリエ変換を行うオンデマンドIDFT部と、
を備えることを特徴とする付記1から3のいずれかに記載の音響用フィルタ装置。
(付記5)
パディング量を決定するパディング量決定部と、
前記FFT部の処理に際して前記パディング量決定部によって決定された前記パディング量のパディングを前記音響信号入力手段から入力された音響信号に対し行うパディング部と、数52式で示される式により、前記IFFT部でのIFFT処理時間を推定するIFFT計算時間推定部と、数53式で示される式により、前記オンデマンドIDFT部でのオンデマンドIDFT処理時間を推定するオンデマンドIDFT計算時間推定部と、
をさらに備え、
前記低域決定部は、前記IFFT計算時間推定部によって推定されたIFFT処理時間と、前記オンデマンドIDFT計算時間推定部によって推定されたオンデマンドIDFT処理時間とを比較することにより、前記音高が低域であるか非低域であるかを決定することを特徴とする、付記4に記載の音響用フィルタ装置。
(付記6)
前記音響信号入力手段は、前記音響信号が一括で取得可能であり、
前記フィルタは、
該フィルタにおいて現在処理対象となった前記音響信号の音高が高域であるか非高域であるかを決定する高域決定部と、
前記高域決定部により前記音高が高域であると判断された場合に、付記3に記載のフィルタ装置としてのフィルタを実行する時間領域フィルタ部と、
前記高域決定部により前記音高が非高域であると判断された場合に、付記4または5に記載のフィルタ装置としてのフィルタを実行する周波数領域フィルタ部と、
を備えることを特徴とする付記1または2に記載の音響用フィルタ装置。
(付記7)
数54式で示される式により、前記時間領域フィルタ部での時間領域フィルタ処理時間を推定する時間領域フィルタ計算時間推定部と、数55式で示される式により、前記周波数領域フィルタ部での周波数領域フィルタ処理時間を推定する周波数領域フィルタ計算時間推定部と、
をさらに備え、
前記高域決定部は、前記時間領域フィルタ計算時間推定部によって推定された時間領域フィルタ処理時間と、前記周波数領域フィルタ計算時間推定部によって推定された周波数領域フィルタ処理時間とを比較することにより、前記音高が高域であるか非高域であるかを決定することを特徴とする、付記6に記載の音響用フィルタ装置。
(付記8)
音響信号を入力し、
複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた前記音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、数32式で示される対数周波数特性h(f)を有するフィルタ処理を実行する、
ことを特徴とする音響用フィルタリング方法。
(付記9)
音響信号を入力するステップと、
複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた前記音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、数32式で示される対数周波数特性h(f)を有するフィルタリングを実行するステップと、
をコンピュータに実行させることを特徴とする音響用フィルタリングプログラム。
101 音響データ取得部
102、102t、102f フィルタバンク部
103 対数スペクトラム演算部
104 表示データ生成部
105 表示部
201 折り返し加算部
202 折り返し減算部
203 実部演算部
204 虚部演算部
205 実部虚部統合部
301 パディング量決定部
302 FFT(高速フーリエ変換演算部)
303 フィルタ処理部
304 IFFT(逆高速フーリエ変換演算部)
305 オンデマンドIDFT(逆離散フーリエ変換演算部)
306 IFFT計算時間推定部
307 オンデマンドIDFT計算時間推定部
308 低域決定部
401 時間領域フィルタ計算時間推定部
402 周波数領域フィルタ計算時間推定部
403 高域決定部
501 CPU
502 メモリ
503 入力装置
504 出力装置
505 外部記憶装置
506 可搬記録媒体駆動装置
507 通信インタフェース
508 バス
509 可搬記録媒体

Claims (9)

  1. 音響信号が入力される音響信号入力手段と、
    複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた前記音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、
    で示される対数周波数特性h(f)を有するフィルタと、を備える、
    ことを特徴とする音響用フィルタ装置。
  2. 前記音響信号は楽音信号であり、
    1オクターブの音高の分割数をd、調律用の基準周波数をft、基準周波数より低い音高の数をNL、基準周波数より高い音高の数をNHとしたときに、
    で示される時間域フィルタ応答g(t)を有するフィルタを備える、
    ことを特徴とする請求項1に記載の音響用フィルタ装置。
  3. 前記フィルタは、
    m及びnを離散時間のサンプル番号としたときに、前記音響信号入力手段から入力された離散的音響信号x[m]、x[m−n]、及びx[m+n]に対し、
    で示される折り返し加算を実行することにより出力R[m,n]を算出する折り返し加算部と、
    前記音響信号入力手段から入力された離散的音響信号x[m−n]及びx[m+n]に対し、
    で示される折り返し減算を実行することにより出力I[m,n]を算出する折り返し減算部と、
    基準周波数より低い音高の数をNL、基準周波数より高い音高の数をNHとしたときの音高番号pをp=−N L ,−N L +1,・・・0,1,・・・,N H −1,N H とし、前記音高番号pに対する前記フィルタの離散時間nに対する時間応答の実部をg R [p,n]とし、L[p]を前記音高番号pに対する前記時間応答を有限の長さに打ち切ったときの長さが2L[p]+1となる数としたときに、前記折り返し加算部の出力R[m,n]を用いて
    で示されるフィルタ処理を実行することにより実数部出力X R [p,m]を算出する実数演算部と、
    前記音高pに対する前記フィルタの前記離散時間nに対する前記時間応答の虚部をg I [p,n]としたときに、前記折り返し減算部の出力I[m,n]を用いて
    で示されるフィルタ処理を実行することにより虚数部出力X I [p,m]を算出する虚数演算部と、
    前記実数演算部で算出された実数部出力 R [p,m]と、前記虚数演算部で算出された虚数部出力 I [p,m]とを統合する実部虚部統合部と、
    を備えることを特徴とする請求項1または2に記載の音響用フィルタ装置。
  4. 前記音響信号入力手段は、前記音響信号が一括で取得可能であり、
    前記フィルタは、
    前記音響信号入力手段から入力された音響信号に対し高速フーリエ変換を行うFFT部と、
    前記音響信号の音高ごとに、前記FFT部からの出力と、
    により求められるGとの乗算を行うフィルタ処理部と、
    前記フィルタ処理部において現在処理対象となった前記音響信号の音高が低域であるか非低域であるかを決定する低域決定部と、
    前記低域決定部により前記音高が非低域であると判断された場合に、前記フィルタ処理部の出力に対し、逆高速フーリエ変換を行うIFFT部と、
    前記低域決定部により前記音高が低域であると判断された場合に、前記フィルタ処理部の出力に対し、前記Gの非ゼロの周波数で間引きされた時間における逆離散フーリエ変換を行うオンデマンドIDFT部と、
    を備えることを特徴とする請求項1から3のいずれかに記載の音響用フィルタ装置。
  5. パディング量を決定するパディング量決定部と、
    前記FFT部の処理に際して前記パディング量決定部によって決定された前記パディング量のパディングを前記音響信号入力手段から入力された音響信号に対し行うパディング部と、
    で示される式により、前記IFFT部でのIFFT処理時間を推定するIFFT計算時間推定部と、
    で示される式により、前記オンデマンドIDFT部でのオンデマンドIDFT処理時間を推定するオンデマンドIDFT計算時間推定部と、
    をさらに備え、
    前記低域決定部は、前記IFFT計算時間推定部によって推定されたIFFT処理時間と、前記オンデマンドIDFT計算時間推定部によって推定されたオンデマンドIDFT処理時間とを比較することにより、前記音高が低域であるか非低域であるかを決定することを特徴とする、請求項4に記載の音響用フィルタ装置。
  6. 前記音響信号入力手段は、前記音響信号が一括で取得可能であり、
    前記フィルタは、
    該フィルタにおいて現在処理対象となった前記音響信号の音高が高域であるか非高域であるかを決定する高域決定部と、
    前記高域決定部により前記音高が高域であると判断された場合に、請求項3に記載のフィルタ装置としてのフィルタを実行する時間領域フィルタ部と、
    前記高域決定部により前記音高が非高域であると判断された場合に、請求項4または5に記載のフィルタ装置としてのフィルタを実行する周波数領域フィルタ部と、
    を備えることを特徴とする請求項1または2に記載の音響用フィルタ装置。
  7. で示される式により、前記時間領域フィルタ部での時間領域フィルタ処理時間を推定する時間領域フィルタ計算時間推定部と、
    で示される式により、前記周波数領域フィルタ部での周波数領域フィルタ処理時間を推定する周波数領域フィルタ計算時間推定部と、
    をさらに備え、
    前記高域決定部は、前記時間領域フィルタ計算時間推定部によって推定された時間領域フィルタ処理時間と、前記周波数領域フィルタ計算時間推定部によって推定された周波数領域フィルタ処理時間とを比較することにより、前記音高が高域であるか非高域であるかを決定することを特徴とする、請求項6に記載の音響用フィルタ装置。
  8. 音響信号を入力し、
    複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた前記音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、
    で示される対数周波数特性h(f)を有するフィルタ処理を実行する、
    ことを特徴とする音響用フィルタリング方法。
  9. 音響信号を入力するステップと、
    複数種の音高毎に定められた各周波数に対応させた中心周波数をfcとし、当該中心周波数fcに対応させた前記音高の周波数と当該音高に隣接する音高の周波数の比率をDとしたときに、
    で示される対数周波数特性h(f)を有するフィルタリングを実行するステップと、
    をコンピュータに実行させることを特徴とする音響用フィルタリングプログラム。
JP2013171611A 2013-08-21 2013-08-21 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム Active JP6241131B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013171611A JP6241131B2 (ja) 2013-08-21 2013-08-21 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013171611A JP6241131B2 (ja) 2013-08-21 2013-08-21 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2015040963A JP2015040963A (ja) 2015-03-02
JP6241131B2 true JP6241131B2 (ja) 2017-12-06

Family

ID=52695159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013171611A Active JP6241131B2 (ja) 2013-08-21 2013-08-21 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6241131B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6677069B2 (ja) * 2016-04-28 2020-04-08 株式会社明電舎 定q変換の成分演算装置および定q変換の成分演算方法
US10186247B1 (en) * 2018-03-13 2019-01-22 The Nielsen Company (Us), Llc Methods and apparatus to extract a pitch-independent timbre attribute from a media signal
JP7294422B2 (ja) * 2019-07-04 2023-06-20 日本電気株式会社 音モデル生成装置、音信号処理システム、音モデル生成方法、およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0758882B2 (ja) * 1986-03-05 1995-06-21 株式会社日立製作所 デイジタル帯域フイルタ
JP2002287788A (ja) * 2001-03-23 2002-10-04 Ricoh Co Ltd 録音周波数特性測定方法、録音周波数特性変換方法および音声認識方法
JP3556190B2 (ja) * 2001-10-02 2004-08-18 独立行政法人 科学技術振興機構 拡散変調装置、拡散変調方法、プログラム、ならびに、情報記録媒体
JP2005202354A (ja) * 2003-12-19 2005-07-28 Toudai Tlo Ltd 信号解析方法
JP4722738B2 (ja) * 2006-03-14 2011-07-13 三菱電機株式会社 楽曲分析方法及び楽曲分析装置

Also Published As

Publication number Publication date
JP2015040963A (ja) 2015-03-02

Similar Documents

Publication Publication Date Title
RU2720495C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
Boashash Time-frequency signal analysis and processing: a comprehensive reference
JP6592634B2 (ja) 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測
CN103999076B (zh) 包括将声音信号变换成频率调频域的处理声音信号的系统和方法
Magron et al. Model-based STFT phase recovery for audio source separation
JP5275612B2 (ja) 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
RU2518682C2 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
US20210193149A1 (en) Method, apparatus and device for voiceprint recognition, and medium
Caetano et al. Improved estimation of the amplitude envelope of time-domain signals using true envelope cepstral smoothing
JP6241131B2 (ja) 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム
Nongpiur et al. Impulse-noise suppression in speech using the stationary wavelet transform
JP3251555B2 (ja) 信号分析装置
CN108806721A (zh) 信号处理器
JP5093108B2 (ja) 音声合成装置、方法、およびプログラム
WO2016006079A1 (ja) ピーク周波数検出装置、方法およびプログラム
JP2006215228A (ja) 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体
JP6964872B2 (ja) 船舶エンジン回転数推定装置、船舶エンジン回転数推定方法および船舶エンジン回転数推定プログラム
JP4760179B2 (ja) 音声特徴量算出装置およびプログラム
Sueur et al. Introduction to Frequency Analysis: The Fourier Transformation
RU2801960C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
RU2810281C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
JP2015210419A (ja) 変換装置、方法、およびプログラム
JP4958241B2 (ja) 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体
WO2021193637A1 (ja) 基本周波数推定装置、アクティブノイズコントロール装置、基本周波数の推定方法及び基本周波数の推定プログラム
RU2796943C2 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170718

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171023

R150 Certificate of patent or registration of utility model

Ref document number: 6241131

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150