JP2013506145A - 波形の精密測定方法 - Google Patents

波形の精密測定方法 Download PDF

Info

Publication number
JP2013506145A
JP2013506145A JP2012532058A JP2012532058A JP2013506145A JP 2013506145 A JP2013506145 A JP 2013506145A JP 2012532058 A JP2012532058 A JP 2012532058A JP 2012532058 A JP2012532058 A JP 2012532058A JP 2013506145 A JP2013506145 A JP 2013506145A
Authority
JP
Japan
Prior art keywords
maximum
cell
digital signal
signal processing
maximum value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012532058A
Other languages
English (en)
Other versions
JP6105286B2 (ja
Inventor
リード スミス,ポール
ダブリュー スミス,ジャック
エム スレイ,フレデリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Paul Reed Smith Guitars LP
Original Assignee
Paul Reed Smith Guitars LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Paul Reed Smith Guitars LP filed Critical Paul Reed Smith Guitars LP
Publication of JP2013506145A publication Critical patent/JP2013506145A/ja
Application granted granted Critical
Publication of JP6105286B2 publication Critical patent/JP6105286B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R23/00Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
    • G01R23/16Spectrum analysis; Fourier analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Measurement Of Current Or Voltage (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

データ記憶領域からまたはアナログ信号の変換からデジタル信号を得るステップと、そのデジタル信号から1つまたは複数の測定行列を求めるステップとを備える、コンピュータ化されたデジタル信号処理のための、機械によって実施される方法。それぞれの測定行列は複数のセルを有し、それぞれのセルは、タイムスライスごとの周波数ビン内の信号エネルギに対応する振幅を有する。タイムスライスおよび/または周波数ビンに沿って最大振幅を有する、それぞれの測定行列内のセルが、最大値セルとして識別される。時間および周波数の点で一致する最大値が識別され、一致する最大値を示す、「精密測定行列」と呼ばれる相関性がある最大値行列が構築され、隣接する、印を付けられた最大値が部分チェーンへと結合される。

Description

[関連出願の相互参照]
本出願は、参照によりその内容が本明細書に完全に組み込まれる、2009年11月12日に出願されたPCT特許出願第PCT/US2009/064120号の優先権の利益を主張する。
本発明は、波形および合成波形の時間−周波数−振幅の解析および測定に関する。単語「信号」は、より一般的な「波形」の、普及している同義語であり、ここでは両方を区別なく使用することができることに留意されたい。合成波形は、一緒に混合された複数の波形(または信号)からなる。本明細書の大部分は可聴周波数範囲について言及するが、本発明での波形は、どんな特定の周波数の範囲または複雑さにも限定されない。
合成波形が与えられた場合、いくつかの発信源によって引き起こされている可能性がある、波形およびその成分を正確に測定することが望ましい。時間および周波数の点で重複する様々な発信源によって作り出される信号、より高いエネルギの信号によって覆い隠される低エネルギ信号、周波数の急激な変化、および/または振幅の急激な変化を波形が含む場合、波形およびその成分を正確に測定することは困難である。これらの波形をより正確に測定/解析することができる場合、それらの波形が何を含み、それらの波形をどのように修正するのかを我々が理解する能力をかなり高めることになる。
波形の解析は、従来より時間領域および周波数領域において遂行されてきた。典型的には、これらの波形は、まず、時間単位で振幅のサンプルとしてデジタルでキャプチャされ、それから、それらの信号を測定するために一連の変換が使用され、その結果が行列の状態で表示される。時系列データから周波数/振幅情報を抽出するために、多岐にわたる技法が開発されてきた。しかし、時間を基準にして周波数および振幅がどのように変化するのかを表すことは、特に、突然の周波数および/もしくは振幅の変化があるとき、または複数の発信源からの信号が同じ時間領域および周波数領域を占有するとき、困難であり得る。
時間、周波数、および振幅情報を得るためのある一般的な変換は、離散フーリエ変換(DFT)である。不都合なことに、DFTのサイズ(次元)に起因する、周波数分解能と時間分解能との間のトレードオフがある。DFTによって調べられる時間ウィンドウは、DFTの次元に比例する。したがって、大きな次元のDFTは、小さな次元のDFTよりも大きい時間ウィンドウを調べる。このより大きな時間ウィンドウは、大きな次元のDFTが動的変化に反応するのを遅くする。
逆に、大きな次元のDFTは周波数範囲をより細かい断片へとスライスする。DFTによって測定される最大周波数は、デジタル化された信号のサンプリングレートの半分である。次元XのDFTは、0から最大値までの周波数範囲をX/2個の同じサイズの「ビン」へと分割する。したがって、DFTにおける各周波数ビンのサイズは、DFTの次元で割られるサンプリングレートの2倍に等しい。
そのため、より高次元のDFTは、より高い周波数分解能を有するが、より低い時間分解能を有する。より低次元のDFTは、より高い時間分解能を有するが、より低い周波数分解能を有する。このトレードオフが原因で、実務者は、動的で経時変化する波形を時間および周波数の両方において良好な分解能で正確に表すための、修正されたDFTまたは他の代替的方法を捜し求めてきた。
スペクトグラム、離散ウェーブレット変換、ウィグナー−ビレ、ガボール、およびウィンドウイング技法は、時間、周波数、および振幅の点で変化する動的信号についてのより正確な時間−周波数表現を作成しようとするために使用される技法の一部に過ぎない。それぞれの技法には独自の長所と短所があり、それはつまり、計算の複雑さ(すなわち処理の負荷)、アーティファクト/歪み、時間の正確さおよび分解能、周波数の正確さおよび分解能、ならびに振幅の正確さおよび分解能である。本発明は、新たな変換技法ではないが、既存の(または新たな)任意の技法を使用する複数の変換を組み合わせる方法である。
本発明を、複数のフーリエ変換データ(FTデータ)を組み合わせる、漠然と似ているがより洗練されていないスペクトル相関と呼ばれる形式と混同すべきではない。従来技術で見出されるように、スペクトル相関では同じサイズのFTが計算され、FTデータが同時には取られない。したがって、本発明とは対照的に、スペクトル相関は、時間および周波数の分解能/正確さの同時的改善策を活用しない。また、スペクトル相関は時間の経過とともに情報を不鮮明にもする。これを回避するために考案されたのが本技法である。
本発明者らは、参照により本明細書に組み込まれるいくつかの特許を発行してきた。それらの特許とは、Fast Find Fundamental Method、米国特許第6,766,288(B1)号、Method of Modifying Harmonic Content of a Complex Waveform、米国特許第7,003,120(B1)号、およびMethod of Signal Shredding、米国特許第6,798,886(B1)号である。2008年11月26日に出願した仮出願第61/119198号も、参照により本明細書に組み込まれる。
本発明は、時間および周波数の分解能/正確さの同時的改善策と、時間の経過とともに情報を不鮮明にするのを回避する技法を提供することを目的とする。
本発明は、アナログ信号の変換からまたはデータ記憶領域からデジタル信号を得るステップと、特定の時間および周波数についての振幅を含むセルからなる、1つまたは複数の測定行列(MM:Measuring Matrices)を構築するステップと、セルの振幅を比較することに基づき、その1つまたは複数の行列内の最大値(maxima)に印を付けるステップと、時間および周波数の点で一致する複数の測定行列から、相関性がある最大値セルを識別するステップとを含む、デジタル信号処理のための、機械によって実施される方法を提供する。次いで、その印を付けられた相関性がある最大値を使い、精密測定行列(PMM:Precision Measuring Matrix)と呼ばれる新たな行列が生成される。(注:これら全ての最大値は局所的最大値だが、簡潔にするためにそれらの最大値を単純に「最大値」と呼ぶ。それらの最大値は大域的最大値とすることもできるが、それはここでは問題にはならない。)
それぞれの測定行列は、例えば高速フーリエ変換(FFT)を使用し、入力信号を反復変換することによって典型的には生成される。それぞれの変換は、入力信号の中のタイムスライスと呼ばれる時間の一部分を表し、周波数ビンと呼ばれる周波数範囲にそれぞれのセルが対応する、セルの列をもたらす。それぞれのセルは、そのセルの対応する周波数ビン/タイムスライスの信号強度を表す振幅でポピュレートされる。それぞれのタイムスライスおよび/または周波数ビンに沿って最大振幅を有する、それぞれの測定行列内のセルが識別され、印を付けられる。多くの種類の最大値を生み出す、最大値を識別するための多くの方法を使用することができる。時間および周波数の点で一致する、様々な行列内の最大値および/または様々な種類の最大値が、「精密測定行列」(PMM)と呼ばれる新たな行列内で印を付けられる。次いで、このPMM内の隣接し相関性がある最大値が、部分チェーンとして一緒に結合される。この得るステップ、求めるステップ、識別するステップ、選択するステップ、印を付けるステップ、および結合するステップは、機械を使って実施される。
最大値セルは、そのセルの振幅を隣接するセルの振幅と比較することにより、または他の特に関係するセルの振幅を比較することによって識別される。セルは、そのセルの振幅がある隣接するセルの振幅よりも大きい場合、単純最大値セルであると判定される。(以下に定義する)他の種類の最大値には、関連する「弟(little brother)」最大値、角度最大値、および侵入(burglar)最大値が含まれる。同じタイムスライスおよび周波数ビンについて複数の最大値が(異なるMM内に、および/または同じMM/セル内に複数の種類の最大値が)見つかる場合、それらの最大値は一致し、特定のテスト基準に応じて、相関性がある最大値としてPMM内の対応するセルに印を付けることができる。PMM内のそれぞれのセル内の振幅は、元になるMM内の対応するセル内の値の関数を使って(例えば重み付き平均で)ポピュレートされる。
[定義]
本明細書では以下の定義を使用する。
FT:フーリエ変換−波形について、スペクトルの振幅を計算する方法。
DFT:離散フーリエ変換−離散(デジタル化された)波形について、スペクトルの振幅を計算するアルゴリズム。このDFTの出力は、複素数または単に実振幅とすることができる。開示する本発明の実施形態の多くは、実振幅のみ必要とする。複素数として特に記載しない限り、本明細書のDFTへのあらゆる言及は、実出力を伴うDFTについてである。
FFT:高速フーリエ変換−とても普及しているので、その名前がしばしばDFTと同じ意味で使われる、高速実行されるDFT方法。本明細書では、DFTとFFTとを同じ意味で使用する。
FIR:有限インパルス応答−本明細書で使用されるとき、FIRとは、FIRフィルタを指す。FIRの集まりは、実振幅出力を伴うFFTの時間および周波数情報と同様の時間および周波数情報を作り出すことができる。
IIR:無限インパルス応答−本明細書で使用されるとき、IIRとは、IIRフィルタを指す。IIRの集まりは、実振幅出力を伴うFFTの時間および周波数情報と同様の時間および周波数情報を作り出すことができる。
ウィンドウ:フーリエ変換(または等価の技法)で使用する、時間の一部分。DFTでは、(サンプルにおける)ウィンドウのサイズは、そのDFTの次元として知られる。例えば、ある信号が1秒当たり8000個のサンプルでデジタル化される場合、次元が4000のDFTは、4000個のデータサンプルに対して(2分の1秒)演算を行う。
ウィンドウィング技法:ウィンドウ内のサンプルが全て等しくは処理されない、普及しているDFT方法。例えば、次元が4000の単純なDFTは単純に4000個のサンプルを変換する。ウィンドウィング技法を使うと、中央のサンプルにより多くの重みを与え、冒頭および末尾のサンプルにはより少ない重みを与えるようにその4000個のサンプルが変調される。ウィンドウィング技法は、DFTの周波数応答におけるサイドローブ/アーティファクトを減らすことを目的とする。
dB:デシベル−例えば音響学や電気(電子)工学の測定および計算において使用される測定値の対数比。
dBFS:dBフルスケール−デジタル表現内の最大ピーク水準に対するdB。
タイムスライス:時間の一部分。タイムスライスは、例えばデータの特定の時間ウィンドウ上のFFTの実行によって表すことができる。ただし、そのウィンドウは、典型的にはそのウィンドウが表すタイムスライスよりもはるかに大きく、そのタイムスライスに中心を置くことになる。タイムスライスのサイズは、ウィンドウのサイズによってではなく、連続するFFTの実行間の間隔によって決定される。1秒当たり8000個のサンプルでデジタル化される信号に関し、8個のサンプルごとに新たなFFTが実行される場合、タイムスライスは8サンプル(1ミリ秒)幅である。FFTウィンドウは、4000サンプル(2分の1秒、または500タイムスライス)幅とすることができる。
周波数ビン:小範囲の周波数(例えば1702Hz〜1704Hz)。
セル:行列におけるユニット。典型的には、セルはタイムスライス内の周波数ビンを表し、dBFS単位の振幅を含む。
MM:測定行列−経時的な波形のスペクトル振幅を表す、セルの行列。測定行列は、反復されるFFT(または他の変換もしくは等価物)によって生成される。それぞれのFFTは、そのタイムスライスにつき、セルの行(または列)を作成し、セルは周波数ビンごとに1つである。それぞれのセル内の振幅は、そのタイムスライス内のその周波数ビンに関する振幅である。次いで、それらのセルは調べられ、必要に応じて最大値として印を付けられる。連続信号をほぼ実時間で処理するとき、測定行列は無限の長さのものとすることができる。限られた時間の波形では、測定行列は有限の長さのものとすることができる。同様に、少なくとも2つの測定行列を測定行列と呼ぶことができる。
最大値セル:1つまたは複数の種類の最大値を有するとして印を付けられたセル。
単純最大値セル:その振幅が、直接隣接するセルよりも大きいセル。あるセルの振幅が、時間的にそのセルの直前および直後の、同じ周波数ビン内のセルの振幅よりも大きい場合、そのセルは時間ピークの単純最大値(time peak simple maximum)である。あるセルの振幅が、周波数的にそのセルのすぐ上のおよびすぐ下の、同じタイムスライス内のセルの振幅よりも大きい場合、そのセルは周波数ピークの単純最大値である。単一のセルが、時間の単純最大および周波数の単純最大の両方となることもできる。時間ピークおよび周波数ピークの単純最大値セルは、区別して印を付けることができ、または同義語として扱い、単に「単純最大値セル」、または短縮して「単純最大値」もしくは「局所的最大値」と呼ぶことができる。
関連する最大値(「弟」)セル:その振幅が単純最大値の指定された閾値の範囲内にあり、かつ反対側のセルの振幅よりも大きい、単純最大値に隣接するセル。あるセルが時間ピークの単純最大値である場合、そのセルにすぐ先行するおよびそのセルのすぐ後に続く、同じ周波数ビン内のセルは関連する最大値の候補である。例示的実施形態では、単純最大値に先行する候補セル内の振幅が、その単純最大値の振幅の2dB範囲内にあり、かつその候補セルに先行するセルの振幅よりも大きい場合、その候補セルに弟として印が付けられることになる。同じように、あるセルが周波数ピークの単純最大値である場合、周波数的にその単純最大値のすぐ上のおよびすぐ下の、同じタイムスライス内のセルは関連する最大値の候補である。例示的実施形態では、周波数的に単純最大値のすぐ上の候補セル内の振幅が、その単純最大値の振幅の3dB範囲内にあり、かつ周波数的にその候補セルのすぐ上のセルの振幅よりも大きい場合、その候補セルに弟として印が付けられることになる。時間的に隣接する弟のdB閾値は、周波数的に隣接する弟のdB閾値と同じである必要はない。時間および周波数の弟は、区別して印を付けることができ、または同義語として扱い、単に弟として印を付けることができる。単一のセルが、両方となることもできる。
角度最大値セル:自らと、隣接する両側のセルとの間の振幅の差が、所与の閾値を上回って変化するセル。例示的実施形態では、あるセルが、時間的にそのセルにすぐ先行する、同じ周波数ビン内のセルよりも4dB大きいが、そのセルの後に続くセルよりも1dBだけ小さい場合、その3dBの差は角度最大値(とりわけ時間角度最大値)としてそのセルを適格とする。周波数角度最大値は、あるセルの振幅を、周波数的にそのセルのすぐ上のおよびすぐ下の、同じタイムスライス内のセルの振幅と比較することにより同じように見つけられる。角度最大値は、周波数角度最大値および/または時間角度最大値として区別して印を付けることができ、または同義語として扱い、単に角度最大値として印を付けることができる。単一のセルが、両方となることもできる。
侵入最大値セル:信号ピークがDFTウィンドウに入り、出て行くときの振幅の変化を測定することにより最大値が検出される最大値セル。周波数ビン内のエネルギピークは、そのビンの中の全てのセルの振幅に影響を与え、そのピークはセルの変換ウィンドウの範囲内にある。その変換ウィンドウが、例えば500タイムスライス幅の場合、そのピークはウィンドウの500タイムスライス(セル)に入ってから出て行く。振幅の増加を500タイムスライス後の低下と比較することにより、かつそれらの両方を指定された閾値と比較することにより、侵入最大値を言明することができる。次いで、中央の1つまたは複数のセルに印が付けられる。ピークの持続時間が1つのタイムスライスよりも長い場合、エネルギがいくつかのセル(タイムスライスまたは行)にわたって傾斜を上り、500セル後に再び同様に傾斜を下り、侵入最大値として中央の複数のセルに印が付けられる。したがって、他の種類の最大値とは異なり、侵入最大値は、あるセルをそのすぐ隣接するセルと比較することによっては検出されない。ウィンドウの幅は単一のタイムスライスよりもかなり広くてよいので、印が付けられる1つまたは複数のセルから遠く離れたセル内で振幅の変化を見ることができる。また、単純最大値、関連最大値、および角度最大値とは異なり、侵入最大値は時間最大値としてのみ存在することができ、類似の周波数最大値はない。
相関性がある最大値セル:複数のMM内の最大値セルに対応するPMM内のセル。複数のMM内の最大値セルが、時間および周波数の点で重複(すなわち部分的にまたは完全に一致)するとき、それらのセルには相関性があると言われ、これらの相関性があるセルの重複部分と時間および周波数の点で対応するPMM内のセルは、相関性がある最大値セルと呼ばれる(注:「一致する」または「対応する」は等価語である)。
部分:印を付けられた最大値セル、または印を付けられた関係する最大値セルのクラスタ(例えば単純最大値とその弟)。
部分チェーン:一緒に結合された部分の集まり。部分チェーンは、タイムスライス当たり1つまたは複数の部分を含むことができる。部分チェーンは、直線、曲線、および/または傾斜線としてタイムスライスを横切ることができる。部分チェーンは、その近接性が原因で、結合されたセルとみなされる。
DnMM:次元Nの測定行列−N個の周波数ビンを有する測定行列。例えば、D500MMは、500個の周波数ビンを有する測定行列である。MMに名前を付ける際、潜在的には無限である時間の次元は使用しない。
PMM:精密測定行列−相関性がある最大値に印が付けられた状態のMM。
DnPMM:次元Nの精密測定行列。
信号:メッセージ、データ、または情報をそこから得る(例えば推量または抽出する)ことができる、検出可能な任意の物理量またはインパルス。上記に説明したように、本発明は「波形」および「合成波形」の時間−周波数−振幅の解析および測定に関する。用語「信号」は、より全般的な用語「波形」の、普及しており従来から認識されている同義語であり、本出願の中では両方を区別なく使用することができる。したがって、用語「合成波形」は、一緒に混合された複数の波形(または信号)からなると認識することができる。
この特許または出願ファイルは、カラーで作成された少なくとも1枚の図面を含む。請求に応じて、1枚または複数枚のカラー図面とともに、この特許または特許出願公報の写しを提供する。
本発明の例示的実施形態による概略図。 本発明の例示的実施形態による、単純最大値に印が付けられた状態の測定行列の一例の図。 (A),(B),(C),(D),(E)は、本発明の例示的実施形態による、最大値検出についてのあり得るカテゴリの幾つかを示す図。 変換ウィンドウに入り、出て行く信号ピークを示すことにより、侵入最大値の検出を示す図。 最大値の一致を見つけ、相関性がある最大値行列または精密測定行列(PMM)を作成するための、測定行列間の例示的比較結果を示す図である。 本発明の例示的実施形態による、同じデータに対する別個の高速フーリエ変換(FFT)によって得られた測定行列の例示的視覚化を示す図。 本発明の例示的実施形態による、同じデータに対する別個の高速フーリエ変換(FFT)によって得られた測定行列の例示的視覚化を示す図。 本発明の例示的実施形態による、図5(A)の測定行列に関して求められ、解析エンジンによって得られた最大値の例示的視覚化を示す図。 本発明の例示的実施形態による、図5(B)の測定行列に関して求められ、解析エンジンによって得られた最大値の例示的視覚化を示す図。 本発明の例示的実施形態による、図5(C)および図5(D)に示す最大値から求められた精密測定行列出力データの例示的視覚化を示す図。 本発明の例示的実施形態を示す図である。
本発明の例示的実施形態は、時間的に正確な振幅および周波数情報を作り出す新たな動的コンピュータマシンプロセスの一部として、「精密測定行列」(PMM)を作成する。このPMMは、従来技術よりもさらに厳密とすることができる、新たな種類の非常に有用なデータおよび出力である。
従来の技法に関連する問題と比較すると、本発明の一定の例示的実施形態は、時系列信号の瞬時周波数および瞬時振幅についての、高分解能のおよび高精度の測定値を好都合に有する。本発明の諸実施形態は、様々なサイズの複数の同時測定行列を組み合わせ(最大値セルを見つけ、それらのセルに印を付けることによりセルに印を付け)、次いで、最大値の相関性を調べる(correlate)ためにそれらのMMを探索することにより、そのような利点を達成することができる。上記に説明したように、より小さいサイズの変換はより優れた時間分解能を提供するのに対し、より大きいサイズの変換はより優れた周波数分解能を提供する。このため、全体のPMMを構築するために、通常は(時間分解能および周波数分解能の点で異なる)2つ以上の測定行列が使用される。一層優れた分解能および精度を提供するために、追加の測定行列(例えば同じ次元だが様々な変換または様々なウィンドウィング技法を使う測定行列)を使用することができる。PMMにとって相関性がある最大値を見つけるために、(単一のMM内でさえ)複数の種類の最大値を使用することもできる。隣接する相関性がある最大値は、部分チェーンと呼ばれるチェーンへと結合される。この結合は、周波数ビン内で隣接しもしくは同一であり、かつ隣接するタイムスライスもしくは同一のタイムスライス内の、任意の2つの最大値セルを接続することによって遂行される。
ある基本的実施形態では、異なる次元のFFTを使用して2つのMMが作成され、(時間および周波数の両方における)単純最大値および弟に、弟の2dBの閾値を使って印が付けられる。この実施形態では、4種類の最大値(時間および周波数、単純および弟)の全てを等しく扱い、セルには単に「最大値」として印を付ける。次いで、対応する時間および周波数を有する2つのMM内のセルを比較し、対応するセルの両方が最大値を有するPMM内の最大値に印を付けることによりPMMが作成される。このPMM内のセルは、元のMM内の対応するセルの振幅の平均でポピュレートされる。
例えば、1秒当たり8000サンプルの、デジタル化された音声信号を仮定する。この実施形態では、80サンプルごとに(10msごとに)次元が1000のFFTを実行することにより、1つのMMを作成することができる。それぞれのFFTは、10msの長さのタイムスライスを表す。その結果生じるそれぞれのFFTの振幅が、このMM内の1行として記録される。次いで、単純最大値および弟としての要件を満たすセルに最大値セルとして印が付けられる。
次元NのFFT(または他の等価の技法)は、N/2個の周波数ビンを有するMMを作成することに留意されたい。したがって、次元が1000のFFTによって作成されるMMは、D500MMである。あり得る最大周波数は、常にサンプリングレートの半分(この例ではサンプリングレート8000Hzの半分である4000Hz)に等しいことにも留意されたい。0Hzから4000Hzの周波数範囲を500個の等しい部分へと分割することは、8Hz幅の周波数ビン(−4Hz〜4Hz、4Hz〜12Hz...3988Hz〜3996Hz)をもたらす。次いで、単純最大値および弟としての要件を満たすセルに最大値セルとして印が付けられる。
次に、80サンプルごとに次元が4000のFFTを実行することにより、D2000MMが作成される。その結果生じるそれぞれのFFTの振幅が、このD2000MM内の1行として記録される。D2000MMの周波数ビンは2Hz幅(−1Hz〜1Hz、1Hz〜3Hz...3997Hz〜3999Hz)である。次いで、単純最大値および弟としての要件を満たすセルに最大値セルとして印が付けられる。
このD2000MMは、周波数の点でD500MMの4倍正確であることに留意されたい。逆にD500MMは、そのより短いウィンドウのおかげで、時間の点でD2000MMの4倍正確である。具体的に言うと、D2000MMは(2分の1秒−50行または50個のタイムスライスに及ぶ)4000サンプルの時間ウィンドウから計算されるのに対し、D500MMは(8分の1秒−12.5行または12.5個のタイムスライスにしか及ばない)1000サンプルの時間ウィンドウから計算される。
D500MMの時間分解能とD2000MMの周波数分解能とを同時に得るために、本発明者らはこれらの2つを相互に関連付け、D4000PMMを構築する。D500MM内のそれぞれの周波数ビンの幅は、D2000MM内の周波数ビンの4倍広いので、一方の中のどのビンが、他方の中のビンに対応するのかを識別することは紛らわしい可能性がある。この識別することを(実際の機械およびこの説明の両方において)単純化するために、本発明者らは、D500MMおよびD2000MMを拡張して対応するビンを作成する。これを行うために、本発明者らは、D500MM内のそれぞれのセルを8個の等しい部分へと分割する。D500MM内のそれぞれの行において、それぞれのセルが分割される。−4Hz〜4Hzのセルは、8個のセル(−4Hz〜−3Hz、−3Hz〜−2Hz、−2Hz〜−1Hz、−1Hz〜0Hz、0Hz〜1Hz、1Hz〜2Hz、2Hz〜3Hz、および3Hz〜4Hz)へと分割される。これらの新たなセルのそれぞれは、元の−4Hz〜4Hzのセルの振幅および最大値の印付けを保持する。残りのセルも同じ方法で分割される。したがって、これらの行(タイムスライス)は時間の点で既に正確に対応するので、拡張されたD500MM内のそれぞれのセルは、同様に拡張されたD2000MM内のセルに(時間および周波数の点で)正確に対応し、D4000PMMを構築することは今や簡単である。
このD4000PMM内のそれぞれのセル内の振幅は、D500MMおよびD2000MM内の対応するセルの振幅の平均でポピュレートされる。この2つの振幅のどんな関数も許容されるが、この実施形態では、PMM内のセルの振幅は、元になる2つのMM内のセルのエネルギの単純平均である。両方のMM内の対応するセルに最大値として印が付けられている場合、それぞれのセルに最大値として印が付けられる。
これらのMMの行が、時間的にどのように正確に対応するのかは周知の事実だが、それでもなお説明する価値があることに留意されたい。D2000MM内の一番初めの行は、デジタル化された入力のうちのサンプル1〜4000から作成される。D500MMの最初の行は、同じように中心を置くためにサンプル1501〜2500から生成される。(中心はちょうど2000.5である)。タイムスライスは80サンプル幅なので、これらの行によって表されるタイムスライスは、(同じく2000.5上に中心を置く)サンプル1961〜2040と考えることができる。2番目の行(タイムスライス)は80サンプル後になる。D2000MMの2行目は、(2080.5上に中心を置く)サンプル81〜4080に対するFFTによって生成され、D500MMの2行目は、(同じく2080.5上に中心を置く)サンプル1581〜2580に対するFFTによって生成される。タイムスライスは、(この場合も2080.5上に中心を置く)サンプル2041〜2120と考えることができる。定義上、タイムスライスは重複しないことに留意されたい。
この実施形態に対する改変形態により、本発明の他の実施形態を作成することができる。時間最大値を削除し、周波数最大値だけを使用することもできる。逆に、時間最大値だけを使用することもできる。弟の閾値は2dBから他の任意の値に変えることができ、または弟を完全になくすこともできる。3つ以上のMMを作成し、相互に関連付けることもできる。3つ以上のMMを使用する場合、それらのMMの全ての間の取り決めは普遍的である必要はない。例えば5つの異なる測定行列を使用する場合、同じ時間および周波数における5つの最大値のうちの3つが、相関性がある最大値を識別するように求められる場合がある。相関性がある最大値は、他の任意のMM内の最大値に一致する、最も高次元のMM内の最大値として定義することもできる。相関性がある最大値についての基準は応用例または信号特性によって異なり得るが、2つ以上の最大値の時間および周波数における取り決めを伴わなければならない。また、相関性がある最大値は、様々な周波数範囲について異なるように求めることができる。例えば、低周波数では、高められた周波数分解能を得るために、より大きな次元の測定行列が必要な場合がある。逆に高周波数では、より小さな次元の測定行列が申し分なく機能することがある。
例示的実施形態の中で、これらの改変形態の任意の組合せを使用することができる。また、任意のウィンドウィング技法を使用することができる。別の例示的実施形態では、同じ次元のFFTだが様々なウィンドウィング技法を使用して複数のMMが生成される。次いで、これらのMMの中で(ことによると様々な印付け基準を使い)最大値に印が付けられ、その後、相関性がある最大値を見つけてPMMを構築するために、これらのMMが比較される。別の例示的実施形態では、様々な次元および様々なウィンドウィング技法の両方を使用して複数のMMが作成される。例えば、D500MMおよびD2000MMをウィンドウィング技法なしで作成し、別のD2000MMをハミングウィンドウを使って作成することができる。次いで、PMMを作成するためにこれらの3つのMMが相互に関連付けられる。可能な組合せは無数にある。
別の例示的実施形態では、単一のMMしか作成されない。この実施形態では、D4000MMがウィンドウィング技法なしで作成される。周波数ピークの単純最大値が識別され、印を付けられる。また、侵入最大値が識別され、印を付けられる。周波数ピークおよび侵入最大値の両方として印を付けられた任意のセルは相関性がある最大値であり、印を付けられたそれらの相関性がある最大値を使ってPMMが作成される。
この実施形態に対する改変形態により、本発明の他の実施形態を作成することができる。MMは、4000とは異なる次元を有することができる。MMの周波数分解能を向上させるために、デコンボリューションおよび/またはウィンドウィング技法を使用することができる。弟を認めることができる。弟の閾値は、不変のdB数である代わりに、侵入最大値の特性の関数にすることができる。特に、「強い」侵入最大値(信号ピークがウィンドウに入り、出て行くときにより大きな勾配を示す最大値)は、弱い侵入最大値とは異なる弟の閾値をトリガすることができる。
別の例示的実施形態では、完全な(full)複素数FFTを使用し、MMのセルを複素数でポピュレートすることができ、最大値の識別は、セル内の振幅および位相の両方に基づくことができる。例えば、弟の閾値および角度最大値の閾値が位相成分を含むことができる。より大きいまたはより小さい位相変移は、最大値をより示すとみなすことができる。
別の例示的実施形態では、FFTの一部または全てが、複数の有限インパルス応答(IIR)または無限インパルス応答(FIR)によって置換される。それぞれの周波数ビンは、別個のFIRまたはIIRを使用する。周波数スペクトルを識別するために、ある領域から別の領域への実際の変換の代わりにフィルタを使用する一般的な方法は知られているが、この方法はより計算集約的である。MM内のタイムスライスを完全に同じように中心付けするために、フィルタの周波数応答内の群遅延変動を調節する時間遅延補償を使用することができる。FIRおよびIIRから作成されるMMは、FFTから作成されるMMと同じように使用される。
さらに、同じまたは同様の種類の計算的特性もしくは解析的特性を提供する他の種類の変換を使用することにより、FFTを置換できることを理解すべきである。離散ウェーブレット変換(DWT)はそのような変換の一例である。そのような変換は、異なる領域への関数空間の交換(rotation)とみなすことができると従来より理解されている。さらに、FFTおよびDWT等は、周波数の点で局所化された基底関数を有する。したがって、例示的実施形態は、本明細書に記載の機能性を提供する様々な種類の変換とともに利用することができる。
例示的実施形態は、様々な次元のFFTおよび/または他の変換および/または様々なウィンドウィング技法および/またはFIRもしくはIIRのバンクを使って作成される、上記の複数のMM内の複数の種類の最大値の全てを組み合わせることができる。次いで、それらの最大値は、対応する周波数ビンおよびタイムスライスに関して相関される。FIRまたはIIRを使用する場合、計算負荷を減らすために、より長いタイムスライスを使用することができる。この場合、FIRまたはIIRによって作成されるMM内の単一の行(タイムスライス)が、FFTによって作成されるMM内の2つ以上の行と時間の点で相関する可能性がある。単純相関を助けるために、行列を周波数の点で拡張した方法と同じように、行列を時間の点で拡張することができ、またはこの装置なしで相関を行うことができる。また、最大値セルを識別することを本明細書ではセルに「印を付ける」と記載するが、これは一部の例示的実施形態では文字通りではない。どのセルが最大値であり、どのセルがそうでないかを追跡する任意の方法を使用することができる。例示的実施形態では、別個の並列行列(またはアレイ)が最大値の指示を含む。したがって、MMまたはPMMは、機械の中の単一の行列またはアレイを文字通り指さない可能性があるが、本明細書に記載の振幅および最大値情報を集合的に含む、1組の並列行列またはアレイを文字通り指すことができる。
図1は、本発明の例示的実施形態による概略図を示す。アナログ信号受信装置101aは、(上記に説明したように、1つまたは複数の波形を含むことができる)物理アナログ信号をキャプチャし、その結果、物理的アナログ装置とみなすことができる。このアナログ信号受信装置101aは、例えばテープを再生するテーププレーヤ、マイクロフォン、ビデオカメラ、または他の変換器、等とすることができる。アナログ−デジタル(A/D)変換器101bが、その物理アナログ信号をデジタル形式に変換する。例示的実施形態では、このA/D変換器101bが、例えばデジタルオーディオワークステーション(DAW)に給電するデジタルオーディオマシン上に埋め込まれる。デジタル形式は、例えば16ビットの量子化および8KHzのサンプリング周波数を使用して作成される。量子化の各ビットは、約6dBのダイナミックレンジを与えることができる。したがって、この16ビットの量子化の例は、一部のオーディオ用途には十分である約125dBの合計ダイナミックレンジをもたらすことができる。32ビットおよび24ビットを含むがこれだけに限定されない、他の量子化のオプションも利用可能である。この量子化は、CD−ROMなどの装置で一般に使用されるオーバーサンプリングおよびシグマデルタ変調を使用する単一ビットとすることもできる。アナログ信号受信装置101aおよびA/D変換器101bは同じ装置とすることも、別個の装置とすることもできる。
例示的実施形態では、アナログ信号受信装置101aおよびA/D変換器101bを介してデジタル信号を提供する代わりに、デジタル信号を記憶する、データ記憶域102によってデジタル信号を提供することができる。データ記憶域102は、任意の種類のデータ記憶領域、例えばハードディスクドライブ、ネットワーク接続ストレージ(NAS)装置、フラッシュドライブ、等とすることができる。ただし、データ記憶域102はこれらの特定の例に限定されない。本発明の範囲から逸脱することなく、データ記憶域102は、他の既存のまたは将来開発されるデータ記憶装置を含むことができる。
例示的実施形態により、多くの種類の信号を処理することができる。例えば、提供されるデジタル信号は、音声スペクトル、ビデオスペクトル、または他のスペクトルからデジタル化されたアナログ信号とすることができ、またはデジタル形式で生じてもよい。
ブロック103から107では、デジタル信号が、アナログ信号受信装置101aおよびA/D変換器101bから、またはデータ記憶域102から受け取られ、測定行列を生成するために変換される。この変換は例えばFFTとすることができる。例えばブロック103から107のそれぞれで、様々な次元および対応するスペクトル分解能を使い、デジタル化された物理アナログ信号に対してFFTが実行される。この変換の機能性は、関心スペクトル(spectrum of interest)の全体にわたり適切に間隔を設けた中央周波数を有する、FIR帯域フィルタまたはIIR帯域フィルタのバンクによって遂行することもできる。通常は、2つ以上のそのような変換(またはフィルタバンクセット)が実行される。そのような変換は任意の数を使用することができるけれども、図1はそのような変換を5つ示している。
ブロック108から112では、それぞれの測定行列内のセルの振幅を比較する様々な方法により、それぞれの測定行列内の最大値セルが識別される。実時間波形の測定行列を処理する場合、1度に1行または数行処理することができる。現在処理されている行と比較するために、一部のデータは以前処理された行から保持される。
ブロック113では、相関性がある最大値を見つけるために、それぞれの測定行列内の識別された最大値が、時間および周波数の点で比較される。これらの比較は、同じ種類の最大値または異なる種類の最大値を伴うことができる。例示的実施形態では、これらの比較は、同じ変換/ブロック(例えばブロック108)からの異なる種類の最大値を伴うことができる。例えば、ブロック108からの侵入最大値セルを、ブロック108〜112からの単純最大値セルおよび関連する最大値セルと比較することができる。どんな比較の組合せも可能である。
ブロック114では、精密測定行列が構築される。ブロック113からの、一致するタイムスライスおよび周波数ビンについての識別された位置が、PMM内で印を付けられる相関性がある最大値を形成する。元になる測定行列内の対応するセルに含まれる振幅の任意の関数(例えば、平均、重み付き平均、中央値、等)を使いPMMのセル内の振幅をポピュレートすることができる。この関数は、単関数(例えば元になる行列のうちの1つの振幅しか使用しない)、または複素関数(例えば元になるそれぞれの行列内のセルが最大値かどうか、およびどの種類の最大値かに敏感である)とすることができる。
例示的実施形態では、出力装置115は、データ記憶領域もしくは伝送装置、または測定した信号を視覚化するためのユーザインターフェイスを有する視覚化装置とすることができる。視覚化装置とは、例えば表示装置や印刷装置である。表示装置の例には、液晶ディスプレイ、プロジェクションモニタ等が含まれ得る。印刷装置の例には、トナーベースのプリンタ、液体インクジェットプリンタ、インクレスプリンタ等が含まれ得る。例示的実施形態の他の中間結果を出力装置115に与えることもできる。例示的実施形態では、出力装置115は、PMMを記憶するためのデータ記憶領域とすることができる。例示的実施形態では、出力装置115は、別の装置にPMMを送信するための伝送装置とすることができる。次いで、元の波形を修正するために、信号プロセッサまたは他の装置がこれらの結果を使用することができる。例示的実施形態では、所望の結果を達成するために信号プロセッサを手動で調節できるように、この出力装置はデータ記憶領域および視覚化装置の両方を含むことができる。
図2は、図1のブロック108〜112によって単純最大値セルに印が付けられた状態の、図1のブロック103〜107によって作成された測定行列の一例のビューを示す。この例では、行はタイムスライスであり、列は周波数ビンである。それぞれのセルの中の数字は、対応する振幅測定値(単位はdBFS)である。周波数ピークの単純最大値セルには濃い縁で印を付け、時間ピークの単純最大値セルには灰色の背景で印を付けている。
例えば、周波数ピークの単純最大値は、その振幅が周波数的に隣接する2つのセルの振幅を超える、測定行列内のタイムスライス内のセルである。図2では、セル(160,671.9)に(濃い縁で)周波数ピークの単純最大値として印が付けられており、それはこのセルが、隣接するセル(160,656.3)および(160,687.5)よりも大きい振幅を有するからである。同様に、時間ピークの単純最大値セルは、周波数ビン内の局所的最大振幅を有するセルである。図2では、セル(159,671.9)に(陰影を付けた背景で)時間ピークの単純最大値として印が付けられており、それはこのセルが、隣接するセル(158,671.9)および(160,671.9)よりも大きい振幅を有するからである。図3Aおよび図3Cは、周波数ピークの単純最大値および時間ピークの単純最大値の信号強度をそれぞれ示す。
図2では弟に印を付けていないが、弟がどこにあり得るのかを知ることができる。弟に関して3dBの閾値を仮定する。セル(160,671.9)は、周波数ピークの単純最大値セルとして濃い縁で印が付けられている。隣接するセル(160,656.3)および(160,687.5)は関連する最大値セルの候補だが、セル(160,656.3)だけが関連する最大値としての要件を満たす振幅(3dBの範囲内)の点で十分近い。このセルの振幅はセル(160,640.6)の振幅よりも大きいので、このセルは弟になる。タイムスライス内の関連する最大値セルについても同じ決定を下すことができる。図3Bおよび図3Dは、弟を有する周波数ピークの単純最大値および弟を有する時間ピークの単純最大値の信号強度をそれぞれ示す。
図3は、本発明の一部の例示的実施形態による、時間および周波数に沿った最大値検出の例示的カテゴリを示す。図3Aは、周波数ピークの単純最大値を示す。図3Bは、周波数ピークの単純最大値およびほぼ同一の振幅を有する弟を示す。図3Cは、時間ピークの単純最大値を示す。図3Dは、時間ピークの単純最大値およびほぼ同一の振幅を有する弟を示す。
図3Eは、タイムスライス内の角度最大値を示す。第3の点が、潜在的には周波数角度最大値である。第3の点の振幅は、自らの左側の点の振幅をかなりの量超える。第3の点の振幅はさらに、自らの右側の点の振幅よりも僅かに低い。左側の点との差が右側の点との差よりも十分に大きい場合、その点は角度最大値である。例えば、角度最大値の閾値が3dBであると仮定する。第3の点が自らの左側の点よりも5dB大きいが、自らの右側の点よりも1dbだけ小さい場合、その差(4dB)は閾値を超え、第3の点は角度最大値である。次いで、角度最大値としてMM内のセルに印が付けられることになる。この差の閾値は、単純な不変のdB値である必要はなく、周波数および振幅の関数とすることができることに留意されたい。角度最大値セルは、その振幅が予期される凸状からそれるセルとすることもできる。周波数ビン内の時間変化に基づき、類似の時間角度最大値を定義することもできる。
図3Fは、変換ウィンドウに入り、出て行く信号ピークを図示することにより、侵入最大値の検出を示す。ここでは変換ウィンドウの幅がピークよりもはるかに広く、そのためピークが入るときに振幅が上昇し(傾斜を上り)、ピークが完全にウィンドウ内にある間は変わらず、その後ピークが出て行くときに下降する(傾斜を下る)。この傾斜の長さからピークの真の幅を導き出すことができる。この上昇/下降のタイミングおよび持続時間が侵入最大値を定義する。
図4は、図1のブロック113で実行される、2つの測定行列の例示的相関を示す。幅の広い周波数ビンは、より低次元の測定行列(例えばD500MM)内にある。横線を使いこのMM内の最大値を示す。幅の狭い周波数ビンは、次元が8倍の測定行列(例えばD4000MM)内にある。縦線を使いこのMM内の最大値を示す。相関性がある最大値(両方のMM内の最大値が時間および周波数の点で対応する箇所)に陰影を付けてある。これらの陰影が、図1のブロック114のPMM内の最大値となる。
図5Aおよび図5Bは、本発明の例示的実施形態により得られた、2つの測定行列の例示的視覚化を示す。図5Aの測定行列は、512サンプルポイントのFFTを使用して生成され(すなわちD256MM)、図5Bの測定行列は、4096サンプルポイントのFFTを使用して生成された(すなわちD2048MM)。この2つの測定行列は、例えば図1のブロック103および104から出力される。
図5Cおよび図5Dは、図5Aおよび図5Bの2つの測定行列に関してそれぞれ求められ、本発明の例示的実施形態により得られた最大値セルの例示的視覚化を示す。図5Cおよび図5Dの最大値セルは、例えば図1のブロック108および109によりそれぞれ出力される。
図5Eは、図5Cおよび図5Dに示す相関性がある最大値から求められ、本発明の例示的実施形態により得られた精密測定行列(PMM)の例示的視覚化を示す。このPMMは、図1のブロック114で得られた。
図6は、本発明の例示的実施形態を示す。入力信号1005は、アナログ装置によってキャプチャされ、デジタル化される(101aおよび101b)物理アナログ信号のデジタル化されたバージョンであるか、またはデータ記憶域102から得られる。信号処理エンジン1001は、この入力信号1005を処理し、測定エンジン1002、マーキングエンジン1003、および比較エンジン1004を含む。測定エンジン1002は、入力信号1005からMMを生成する(図1のブロック103から107を実施する)。マーキングエンジン1003は、そのMMを解析し、印を付ける。マーキングエンジン1003は、それぞれのMM内の最大値を識別し、印を付ける(図1のブロック108から115を実施する)。比較エンジン1004は、対応する時間および周波数を有する行列内の最大値セルを識別し、その識別した、印を付けられた相関性がある最大値を使ってPMMを構築する。
本発明の一部の例示的実施形態では、信号処理モジュール1001が、1つまたは複数のデジタルプロセッサを含むことができる。その1つまたは複数のデジタルプロセッサは、その1つもしくは複数のデジタルプロセッサが使用するためのソフトウェアおよび/またはデータを記憶することができるデータ記憶領域、例えば図1のデータ記憶域102等とやり取りすることができる。
測定エンジン1002、マーキングエンジン1003、および比較エンジン1004は、少なくとも1つの中央処理装置(CPU)および複数のメモリを有するコンピュータによって実装することができる。測定エンジン1002、マーキングエンジン1003、および比較エンジン1004は、例えば書替え可能ゲートアレイ(FPGA)、デジタル信号処理(DSP)チップ、グラフィック処理ユニット(GPU)、特定用途向け集積回路(ASIC)等として実装することができる。測定エンジン1002、マーキングエンジン1003、および比較エンジン1004は、1つまたは複数のエンジンとしておよびコンピュータが読み取り可能な記憶領域上に記憶される、ソフトウェアによって実装することができる。
出力データ1006は、精密測定行列である。出力装置1007は、その出力データを記憶、表示、および/または伝送する。
本発明は、デジタルコンピュータマシン上のソフトウェアによって実施することができる。そのソフトウェアは、シングルコアの単一のプロセッサ、マルチコアの単一のプロセッサ、またはシングルコアもしくはマルチコアの複数のプロセッサ上で実行することができる。そのソフトウェアは、ブロック103から112またはその任意の組合せを実装することができる。本発明は、汎用デジタル信号プロセッサチップまたは専門デジタル信号プロセッサチップを使用して実施することができる。本発明は専用ハードウェアによって実施することができる。本発明は、例えばコンピュータもしくは他の装置内に搭載される、例えばデジタル信号プロセッサチップを備える、1つまたは複数の回路基板上に実施することができる。
例示的実施形態では、行列データ構造を、論理的に同じ機能を果たすことができる他のデータ構造によって置換することができる。これらのデータ構造は、フィールドで構成されていてよい。これらのデータ構造には、これだけに限定されないが、例えば疎行列、連結されたキュー(linked queue)、等が含まれ得る。例えば、識別される最大値セルを疎行列によって表すことができ、識別されるセルのチェーンを連結されたキューによって表すことなどができる。
一部の例示的実施形態は、並列計算ハードウェアを使用して実施することができる。例示的実施形態では、図1のブロック103から107および/またはブロック108から112を、並列ハードウェアを使って実施することができる。並列コンピュータのメインメモリは、(単一のアドレス空間内で、全ての処理要素間で共用される)共用メモリ、または(それぞれの処理要素が独自のローカルアドレス空間を有する)分散メモリとすることができる。
本発明は、これだけに限定されないが、例えば、任意の周波数範囲内の、適用可能な業界における音声、音声スペクトル解析、信号解析を含む、信号の時間変化解析、データ圧縮、聴覚障害者用のデジタル蝸牛、「声紋」情報等を含む、広範な用途を有することができる。
他の信号プロセッサ、解析装置、アルゴリズム、システム、および組織に新たなまたは改善された入力を与えるために、本発明によって生み出した情報を使用することができる。時間周波数平面にわたって延びる関係する部分チェーンの記録は、それぞれのチェーンに沿った振幅または補間された振幅とともに、特定の信号発信源のコンポーネントの豊富かつ簡潔な記録を提供することができる。とりわけPMM画像表示内で各部分を部分チェーンへと結合するとき、以前はより強い信号によって隠されていた信号を測定し、視覚化することができる。
本明細書に記載した例および実施形態は非限定的な例である。本発明を例示的実施形態に関して詳細に説明し、より広範な態様において本発明から逸脱することなく変更および修正を加えてもよいことが前述の内容から当業者にとって今や明らかであり、したがって、特許請求の範囲に定義する本発明は、そのような全ての変更および修正を本発明の真の趣旨に含まれるものとして対象に含むことを意図する。
本発明の例示的実施形態は、音声成分が、音声の混合を含む合成波形の一部である場合であっても、音声成分を正確に測定するために使用することができる。また、本発明の例示的実施形態は、例えば音声が、短いもしくは長い持続時間のバーストで来る場合、ならびに/またはピッチおよび/もしくは振幅に関して変化する場合であっても、音声を含む合成波形に対して使用することができる。

Claims (25)

  1. 機械によって実施されるデジタル信号処理のための方法であり、
    データ記憶領域から、またはアナログ信号源から受信され、もしくは物理的アナログ装置によってキャプチャされる物理的アナログ信号の変換から、デジタル波形信号を得るステップと、
    前記デジタル波形から2つ以上の測定行列を求めるステップであって、それぞれの行列は複数のセルからなり、それぞれのセルは対応するタイムスライスおよび周波数ビンを表し、その周波数ビンおよびタイムスライスの信号エネルギに対応する振幅を有する、測定行列を求めるステップと、
    それぞれの測定行列内の最大値セルを識別するステップと、
    時間および周波数の点で一致する複数の測定行列から、相関性がある最大値セルを識別するステップと、
    前記相関性がある最大値セルを示す精密測定行列を構築するステップと、
    前記精密測定行列を記憶し、伝送し、かつ/または表示するステップと、を備え、
    前記得るステップ、求めるステップ、識別するステップ、選択するステップ、記憶するステップ、伝送するステップ、および表示するステップは、1台または複数台の機械を使って実施されるデジタル信号処理のための方法。
  2. 請求項1に記載の方法において、それぞれの測定行列内の前記最大値セルは、それらのセルが局所的最大振幅を有することに基づき、単純最大値セルとして識別されることを特徴とするデジタル信号処理のための方法。
  3. 請求項1に記載の方法において、セルが時間ピークの単純最大値セルである場合、そのセルは局所的最大値であると判定されることを特徴とするデジタル信号処理のための方法。
  4. 請求項1に記載の方法において、セルが周波数ピークの単純最大値セルである場合、そのセルは局所的最大値であると判定されることを特徴とするデジタル信号処理のための方法。
  5. 請求項1に記載の方法において、関連する最大値セルが最大値セルとみなされることを特徴とするデジタル信号処理のための方法。
  6. 請求項1に記載の方法において、角度最大値セルが最大値セルとみなされることを特徴とするデジタル信号処理のための方法。
  7. 請求項1に記載の方法において、侵入最大値セルが最大値セルとみなされることを特徴とするデジタル信号処理のための方法。
  8. 請求項1に記載の方法において、様々な種類の最大値が等しいものとみなされ、前記識別したセルが全て最大値として識別されることを特徴とするデジタル信号処理のための方法。
  9. 請求項1に記載の方法において、様々な種類の最大値が等しくないものとみなされ、それぞれの種類の最大値が別々に追跡されることを特徴とするデジタル信号処理のための方法。
  10. 請求項1に記載の方法において、最大値の種類のグループが定義され、各グループ内の前記最大値の種類は等しいものとみなされるが、異なる種類のグループは等しくないものとみなされ、最大値がグループに応じて別々に追跡されることを特徴とするデジタル信号処理のための方法。
  11. 請求項1に記載の方法において、前記測定行列の前記セルの大多数が、対応するタイムスライスおよび対応する周波数ビンについて最大値セルである場合、相関性がある最大値が言明され、前記相関性がある最大値行列内の前記対応するセルが、相関性がある最大値として識別されることを特徴とするデジタル信号処理のための方法。
  12. 請求項1に記載の方法において、前記測定行列の前記セルの全てが、対応するタイムスライスおよび対応する周波数ビンについて最大値セルである場合、かつその場合に限り、相関性がある最大値が言明され、前記相関性がある最大値行列内の前記対応するセルが、相関性がある最大値として識別されることを特徴とするデジタル信号処理のための方法。
  13. 請求項1に記載の方法において、前記測定行列の前記セルのうちの2つ以上の指定された組合せが、対応するタイムスライスおよび対応する周波数ビンについて最大値セルである場合、相関性がある最大値が言明され、前記精密測定行列内の前記対応するセルが、相関性がある最大値として識別されることを特徴とするデジタル信号処理のための方法。
  14. 請求項1に記載の方法において、前記測定行列のセルが、対応するタイムスライスおよび対応する周波数ビンについて最大値セルである関数に基づき、相関性がある最大値が言明され、前記精密測定行列内の前記対応するセルが、相関性がある最大値として識別されることを特徴とするデジタル信号処理のための方法。
  15. 請求項1に記載の方法において、前記精密測定行列内の前記セルの前記振幅が、前記測定行列の前記対応するセルの前記振幅の関数であって、さらに前記セルが最大値セルかどうかについての、関数を使ってポピュレートされることを特徴とするデジタル信号処理のための方法。
  16. 請求項1に記載の方法において、前記精密測定行列内の隣接する最大値が、部分チェーンへと結合されることを特徴とするデジタル信号処理のための方法。
  17. 機械によって実施されるデジタル信号処理のための方法であり、
    データ記憶領域から、またはアナログ発信源から受信されもしくは物理的アナログ装置によってキャプチャされる物理的アナログ信号の変換から、デジタル波形信号を得るステップと、
    前記デジタル波形から1つまたは複数の測定行列を求めるステップであって、それぞれの行列は複数のセルからなり、それぞれのセルは対応するタイムスライスおよび周波数ビンを表し、その周波数ビンおよびタイムスライスの信号エネルギに対応する振幅を有する、測定行列を求めるステップと、
    それぞれの測定行列内の、2つ以上の最大値セルの種類を識別するステップと、
    時間および周波数の点で一致する前記測定行列内の、相関性がある最大値セルの種類を識別するステップと、
    前記相関性がある最大値セルを示す精密測定行列を構築するステップと、
    前記精密測定行列を記憶し、伝送し、かつ/または表示するステップと、を備え、
    前記得るステップ、求めるステップ、識別するステップ、選択するステップ、記憶するステップ、伝送するステップ、および表示するステップは、1台または複数台の機械を使って実施されることを特徴とするデジタル信号処理のための方法。
  18. 請求項17に記載の方法において、前記相関性がある最大値を識別するために使用される複数の最大値には、侵入最大値および少なくとも単純最大値、角度最大値、または関連する最大値が含まれることを特徴とするデジタル信号処理のための方法。
  19. 請求項17に記載の方法において、前記識別される相関性がある最大値セルは、侵入最大値において、および少なくとも1つの他の種類の最大値を有することを特徴とするデジタル信号処理のための方法。
  20. 請求項17に記載の方法において、セルが周波数ピークの単純最大値である場合、そのセルは局所的最大値であると判定されることを特徴とするデジタル信号処理のための方法。
  21. 請求項17に記載の方法において、セルが時間ピークの単純最大値である場合、そのセルは局所的最大値であると判定されることを特徴とするデジタル信号処理のための方法。
  22. 請求項17に記載の方法において、セルが周波数ピークの単純最大値または時間ピークの単純最大値である場合、そのセルは局所的最大値であると判定されることを特徴とするデジタル信号処理のための方法。
  23. 請求項17に記載の方法において、関連する最大値セルも最大値セルとみなされることを特徴とするデジタル信号処理のための方法。
  24. 請求項17に記載の方法において、角度最大値セルが最大値セルとみなされることを特徴とするデジタル信号処理のための方法。
  25. 請求項17に記載の方法において、前記精密測定行列内の隣接する最大値が、部分チェーンへと結合されることを特徴とするデジタル信号処理のための方法。
JP2012532058A 2009-11-12 2009-11-12 デジタル信号処理方法、デジタル信号処理装置、およびプログラム Active JP6105286B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2009/064120 WO2011059432A1 (en) 2009-11-12 2009-11-12 Precision measurement of waveforms

Publications (2)

Publication Number Publication Date
JP2013506145A true JP2013506145A (ja) 2013-02-21
JP6105286B2 JP6105286B2 (ja) 2017-04-05

Family

ID=43991874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012532058A Active JP6105286B2 (ja) 2009-11-12 2009-11-12 デジタル信号処理方法、デジタル信号処理装置、およびプログラム

Country Status (9)

Country Link
EP (1) EP2391895B1 (ja)
JP (1) JP6105286B2 (ja)
KR (1) KR101648597B1 (ja)
CN (1) CN102695958B (ja)
BR (1) BRPI0921829A2 (ja)
CA (1) CA2743613C (ja)
IL (1) IL212820A0 (ja)
RU (1) RU2526889C2 (ja)
WO (1) WO2011059432A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013511071A (ja) * 2009-11-12 2013-03-28 ポール リード スミス ギターズ、リミテッド パートナーシップ デジタル信号処理のための方法、コンピュータ可読ストレージ媒体および信号処理システム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9702907B2 (en) * 2011-12-16 2017-07-11 Tektronix, Inc. Frequency mask trigger with non-uniform bandwidth segments
KR101816506B1 (ko) 2012-02-23 2018-01-09 돌비 인터네셔널 에이비 고 주파수 오디오 콘텐트의 효율적인 복구를 위한 방법들 및 시스템들
US8873821B2 (en) 2012-03-20 2014-10-28 Paul Reed Smith Guitars Limited Partnership Scoring and adjusting pixels based on neighborhood relationships for revealing data in images
CN103675383B (zh) * 2013-11-29 2016-04-13 上海华力微电子有限公司 一种量测波形的电路
US11300482B2 (en) * 2019-08-06 2022-04-12 Computational Systems, Inc. Graphical differentiation of spectral frequency families

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030061035A1 (en) * 2000-11-09 2003-03-27 Shubha Kadambe Method and apparatus for blind separation of an overcomplete set mixed signals
US20050265431A1 (en) * 2004-05-27 2005-12-01 Nokia Corporation Performing an acquisition in a receiver

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1257351A (en) * 1984-07-04 1989-07-11 Mount Isa Mines Limited Cross correlator
US5313531A (en) * 1990-11-05 1994-05-17 International Business Machines Corporation Method and apparatus for speech analysis and speech recognition
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
JP3746580B2 (ja) * 1996-12-09 2006-02-15 株式会社アドバンテスト Cdma信号の波形品質測定方法
US7003120B1 (en) 1998-10-29 2006-02-21 Paul Reed Smith Guitars, Inc. Method of modifying harmonic content of a complex waveform
US6766288B1 (en) 1998-10-29 2004-07-20 Paul Reed Smith Guitars Fast find fundamental method
JP4659190B2 (ja) * 2000-08-31 2011-03-30 アンリツ株式会社 波形測定装置
US7260054B2 (en) 2002-05-30 2007-08-21 Denso Corporation SINR measurement method for OFDM communications systems
JP2006251712A (ja) * 2005-03-14 2006-09-21 Univ Of Tokyo 観測データ、特に、複数の音源からの音が混在している音響信号の解析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030061035A1 (en) * 2000-11-09 2003-03-27 Shubha Kadambe Method and apparatus for blind separation of an overcomplete set mixed signals
US20050265431A1 (en) * 2004-05-27 2005-12-01 Nokia Corporation Performing an acquisition in a receiver

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013511071A (ja) * 2009-11-12 2013-03-28 ポール リード スミス ギターズ、リミテッド パートナーシップ デジタル信号処理のための方法、コンピュータ可読ストレージ媒体および信号処理システム

Also Published As

Publication number Publication date
CN102695958A (zh) 2012-09-26
CA2743613A1 (en) 2011-05-19
JP6105286B2 (ja) 2017-04-05
WO2011059432A1 (en) 2011-05-19
RU2526889C2 (ru) 2014-08-27
CN102695958B (zh) 2016-10-19
EP2391895B1 (en) 2021-07-21
RU2011119089A (ru) 2012-11-20
EP2391895A1 (en) 2011-12-07
CA2743613C (en) 2018-08-14
BRPI0921829A2 (pt) 2016-01-12
KR101648597B1 (ko) 2016-08-16
EP2391895A4 (en) 2014-11-05
IL212820A0 (en) 2011-07-31
KR20120094415A (ko) 2012-08-24

Similar Documents

Publication Publication Date Title
EP2499504B1 (en) A precision measurement of waveforms using deconvolution and windowing
JP6105286B2 (ja) デジタル信号処理方法、デジタル信号処理装置、およびプログラム
US9600445B2 (en) Precision measurement of waveforms
US20130191062A1 (en) Domain Identification and Separation for Precision Measurement of Waveforms
CN106643982B (zh) 一种基于声波共振频率的液位测量方法
Kershenbaum et al. An image processing based paradigm for the extraction of tonal sounds in cetacean communications
EP3165164A1 (en) Respiratory sound analysis device, respiratory sound analysis method, computer program, and recording medium
Madhusudhana et al. Automatic detection of echolocation clicks based on a Gabor model of their waveform
FR2955187A1 (fr) Procede de decomposition d'un signal periodique anharmonique et programme d'ordinateur correspondant
JP6205685B2 (ja) アクティブソーナー装置、アクティブソーナー信号処理方法、及び、その信号処理プログラム
CN109799284B (zh) 一种超声回波信号的多次谐波自适应分离方法
Heuer et al. New aspects in birdsong recognition utilizing the gabor transform
LeBien et al. Species-level classification of beaked whale echolocation signals detected in the northern Gulf of Mexico
Xu et al. Analysis of moving source characteristics using polynomial chirplet transform
Starkhammar et al. Scaled reassigned spectrograms applied to linear transducer signals
US9984450B2 (en) Method and apparatus for enhancement of ultrasound images by selective differencing
US10441243B2 (en) Biological sound analyzing apparatus, biological sound analyzing method, computer program, and recording medium
CN117218455B (zh) 一种脆肉鱼的无损快速识别方法
CN117214819A (zh) 声音信号采集系统、方法、装置及计算机可读存储介质
EP3155609B1 (fr) Analyse frequentielle par démodulation de phase d'un signal acoustique
CN117687008A (zh) 一种主动声纳发射脉冲盲检测方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140228

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140317

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140328

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140501

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20140501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141222

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150320

AA91 Notification that invitation to amend document was cancelled

Free format text: JAPANESE INTERMEDIATE CODE: A971091

Effective date: 20150512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150619

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151225

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160107

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20160325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170302

R150 Certificate of patent or registration of utility model

Ref document number: 6105286

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250