JP4815436B2 - 可変分解能により情報信号をスペクトル表現に変換する装置および方法 - Google Patents

可変分解能により情報信号をスペクトル表現に変換する装置および方法 Download PDF

Info

Publication number
JP4815436B2
JP4815436B2 JP2007515797A JP2007515797A JP4815436B2 JP 4815436 B2 JP4815436 B2 JP 4815436B2 JP 2007515797 A JP2007515797 A JP 2007515797A JP 2007515797 A JP2007515797 A JP 2007515797A JP 4815436 B2 JP4815436 B2 JP 4815436B2
Authority
JP
Japan
Prior art keywords
basic function
window
coefficients
windowing
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007515797A
Other languages
English (en)
Other versions
JP2008502927A (ja
Inventor
マルクス クレーマー
クラース ダーボフェン
セバスチャン シュトライヒ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008502927A publication Critical patent/JP2008502927A/ja
Application granted granted Critical
Publication of JP4815436B2 publication Critical patent/JP4815436B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/081Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for automatic key or tonality recognition, e.g. using musical rules or a knowledge base
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、情報信号処理に関し、特に、多声音楽分析または多声音楽トランスクリプションのための音声信号処理に関する。
音楽表現の多様性と、聴取者の音楽に関する好みの数とは、ここ数年等しく増加している。特に、楽曲を保存してさらに配信することが急速に進歩していることにより、音楽を趣味とする人口が増加している。従って、デジタル記憶装置により、品質を損なうことなく好きなだけ楽曲をコピーすることが可能になった。この最も顕著な例はCDであり、ほぼ完全にレコードに取って代わっている。ステレオ音楽表現ばかりでなく、マルチチャネル音楽、すなわち、例えば周知の5.1サラウンドフォーマットも可能なので、近年、DVDもやはり普及してきている。
以前は、サウンドの品質の向上と、配信方法の向上とに、主に注意が向けられていた。しかし、インターネットとデジタル放送のますますの発展に付随して、人々が利用できる大量の音楽データを事前に選別する新たな需要が起こっている。これに関連して、メタデータの概念、すなわち、音楽データを介してデータを生成することが、新しい局面に達している。記述的データを前もってマニュアルで供給して、対応する楽曲に付加していたが、楽曲の内容を客観的に自動的に分析する手段が開発されている。この分野の標準化方法は、“MPEG7”のキーワードで周知である。
従って、この音楽分析の成果は、効率的な音楽の概要、またはメタデータと楽曲との形成独立的な関連に見ることができる。また、メタデータを自動的に生成する目的は、ユーザの音楽の好みに関連する元々の内容から特徴を抽出する機能にある。例えば、楽曲から抽出した特徴を用いて、入力する音楽を異なる音楽ジャンルに分類する音楽供給システムに学習させることが知られている。
管理しやすく、さらに検索可能なやり方で音楽内容を特定するためには、すなわち、人間とともに機械が読み取って解釈できるデータを供給するためには、音声信号の意味論的に重要な特性に対して基準を設ける必要がある。このような特性は、例えば、楽器の音、楽曲に含まれるメロディ、テンポ、リズム、または楽曲のハーモニーである。これに関連して、特に、音楽の楽節のムードの指標として、その重要性に意味があるので、ハーモニーの特徴はことさら意味がある。聴取者の気分や、不協和音または協和音であるか、長調または短調で作曲されているかにより、楽曲は異なって感じられる。同時に、ハーモニーは、利用できる音楽素材の構造上の多様性のヒントとなる。例えば、速く、変わった和音変化があるとか、音構造に反復特性があるといったことである。
多声音符を全和音に自動的に拡張することは、楽音合成から知られている。最新のシンセサイザやキーボードは、例えば、実時間で演奏を分析したり、ベースの低音の伴奏を生成したりすることにより、演奏者の伴奏を自動的に行うことができる。技術的な不具合により、すべての音符を復元することができないとしても、考察した楽曲に最終的に属和音を求めるために、このようなシンセサイザまたはキーボードに用いられる規則を、多声音楽から復元した音符に適用することもできる。
従って、1つの目的は、時間領域に存在する波形により、考察した楽曲から個々の音符を抽出するために、楽譜にまたはMIDIファイルとしては存在しないが、形式またはその生演奏の音響的/電気的な波形で存在する楽曲を分析することである。この目的は、多声音楽のメロディトランスクリプションにある。すなわち、音楽の時間領域表現から完全な楽譜を最終的に生成することである。例えばCDに保存されたもの、または、例えば圧縮/符号化してMP3ファイルに存在するものといった、一連のサンプルを最終的に生成する。
楽曲は、時間領域の波形として与えられていないが、一連の音符または和音として、すなわち、ここでは周波数範囲基準である音符のラインを用いて、周波数スケールに記述されているいくつかの同時に起こる音符として与えられているので、楽曲の楽譜は、ある意味では、周波数領域表現として考えることもできる。
しかしながら、そのシンボルにより、音符は長くまたは短く演奏されるという点で、同時に、楽譜はまた、時間情報を含んでいる。従って、振幅情報が与えられているとしても、楽譜では、純粋な周波数領域表現、すなわち、特定の周波数での振幅表現にあまり重きを置いていない。しかしながら、この情報は固有のものではなく、楽曲の一部分を、すなわち、楽譜のいくつかの小節または音符を、例えば、大きく(フォルテで)または静かに(ピアノで)演奏するかどうかという一般的な情報である。
クラシック音楽では特にそうであるが、現代音楽においても、パーカッション部分は別として、すべての音符/音は、所定の音符ラスタに存在すると考えることができる。従って、正確に演奏された楽曲には、すべての周波数ではなく、楽譜の範囲内の周波数だけが存在することができる。西洋音楽の音階では、1つのオクターブを12の階調に分割する。しかしながら、これらの12の階調を、周波数に対して一定の間隔で配列しない。その代わり、平均律ムードでは、ヨハン・セバスチャン・バッハ(Johann Sebastian Bach)の“平均律クラヴィーア(Well−Tempered Clavier)”で周知のように、“品質”または“Q係数”が各音に対して一定になるように、例えば、音のシーケンスを用いる。このことは、この周波数値に対応付けられた帯域幅で分割した周波数値が、各音に対して一定であることを意味している。低周波数の音の帯域幅は小さく、高周波数の音の帯域幅は大きい。
この“幾何学的”音符分類の一例を、図2の左の列に示す。図2に示す例では46Hzと任意に仮定している、ある最小周波数から開始する計算規則を、図2の左上に示す。46.0Hzの音と48.74Hzの音との間の間隔は2.74Hzで、これは、92.0Hzの音と86.84Hzの音との間の間隔である5.16Hzよりも小さいことがわかる。
従って、図2の左半分に分類されている可変スペクトル係数とも呼ぶこれらのスペクトル係数は、図2の右半分に示されているいわゆる一定のスペクトル係数とは異なる。
定スペクトル係数では、下端のスペクトルでの2つのスペクトル係数の間隔は、上端のスペクトルまで常に同じである。説明のためであるが、図2の12の音を、図2の左側に平均律構成で示し、右側の列に周波数2.74Hzの間隔の一定の構成を示す。左側の列では、各可変スペクトル係数の品質が等しくなるように、周波数間隔が大きくなっているが、右側の列では、周波数の間隔が全く同じであるため、周波数値が増加していることによって、周波数の増加とともに定スペクトル係数それぞれの品質が大きくなっている。
上述の説明から、たとえばフーリエ変換により生成される定スペクトル係数は、少なくとも西洋音楽では一定であることが明らかである。
しかし、楽曲からトランスクリプションを生成することになるので、ハーモニー分析の第1の工程として、フーリエ変換ではなく、いわゆる定Q変換が用いられることがよくある。すなわち、各可変スペクトル係数の品質が全く同じであることを考慮に入れた変換である。このことにより、図2の右側に示すような一定の周波数ラスタではない周波数ラスタを生成すると考えられる変換であって、この変換により、図2の左側に示すような可変周波数ラスタを生成するという事実が導かれる。換言すれば、可変変換は、図2の左側に示すような周波数ラスタを、例えば、圧倒的多数のクラシック楽曲およびポピュラー楽曲の基礎を形成する平均律音階に対して適応させると考えられる。
技術刊行物である“定Qスペクトル変換の計算(Calculation of a Constant Q Spectral Transform)”、(ジュディス.C.ブラウン(Judith.C.Brown)米国音響学会ジャーナル、1991年1月、89(1)巻、425〜432頁)には、時間周波数変換が記載されている。これは、西洋音楽の音階が幾何学的スペクトル係数間隔に基づいていることを考慮に入れている。このような定Q変換を、対数を周波数軸として、フーリエ変換から導出することもできる。周波数領域内のこの“パターン”は、調和した周波数成分を有するすべての音楽信号に対して同じである。しかし、比較的固定した位置にもかかわらず、成分の振幅において異なる形で現われる。これらの振幅差が、たとえば音にその音色等を与えている。
周波数軸を対数的に示す場合は、定スペクトル係数を可変スペクトル係数に対してマッピングすると、低周波数の情報が少なすぎ、高周波数の情報が多すぎてしまうことになる。離散短時間フーリエ変換により、周波数ビン毎に一定の分解能を与える。これは、時間ウインドウサイズに逆比例する。このことは、毎秒32,000サンプルのサンプリングレートで1,024サンプルのウインドウが、31.3Hzの分解能を有することを意味している。例えば、バイオリンの下端では、すなわち、196Hzの周波数G3では、この分解能は周波数の16%である。これは、2つの隣接する音符の6%の周波数分離よりもずっと大きく、同じムードに同調する。ピアノの上端では、周波数C8は4186Hzであり、31.3HzのFFT分解能により、センター周波数の0.7%の分解能の値になる。従って、周波数範囲のこの点で、FFTではあまりにも多すぎる数の周波数係数を計算することになる。数学的に、定Q変換は以下のように表される。
Figure 0004815436
この式では、x[n]は、分析するデジタル時間関数の第n番目のサンプルである。デジタル周波数は、2πk/Nである。サンプル期間はN/k、分析サイクル数はkに等しい。ここで、W[n]は、ウインドウ形状を表している。ウインドウ関数は、各成分に対して同じ形状である。しかしながら、その長さはN[k]から求められるので、kおよびnの関数である。
技術刊行物である“定Q変換を計算するための効率的なアルゴリズム(An Efficient Algorithm for the Calculation of a Constant Q Transform)”(ジュディス.C.ブラウンら、1992年11月、米国音響学会ジャーナル、92(5)巻、2698〜2701頁)には、前述の変換を計算する効率的なアルゴリズムが記載されている。まずはじめに、離散フーリエ変換を計算して、次に、これを定Q変換に変換する。Qは、帯域幅に対する中心周波数の比である。このために、いわゆるカーネルを計算して、次に、これを各連続DFTに適用する。従って、乗算を数回行って、定Q変換の各成分を計算することができる。スペクトルカーネルは、時間カーネルの離散フーリエ変換である。時間カーネルは、次の式から得られる。
Figure 0004815436
Figure 0004815436
ウインドウw[n、k]として、次の定義に基づくハミングウインドウを用いる。
Figure 0004815436
この式では、αは25/46に等しい。
F.J.ハリス(Harris)、“任意スペクトルセンターおよび任意スペクトル分解能での高分解能スペクトル分析(High−Resolution Spectral Analysis with Arbitrary Spectral Centers and Arbitrary Spectral Resolutions)”、”コンピュータ電子工学(Comput.Electr.Eng.)3巻”、1976年、171〜191頁)では、有界Q値を使った変換が用いられており、やはり、音楽分析を行うことができる。ここで、まずはじめに、一番上のオクターブを除いて、周波数値をもう一度破棄するために、高速変換を計算する。次に、最終的に、前と同じ量の点でさらにFFTを計算するために、これを濾波して、係数2でダウンサンプルを行うことにより、前の分解能の2倍になる。この結果、やはり2番目に高いオクターブだけを保持する。次に、最も低いオクターブになるまで、この手順を繰り返す。この方法の利点は、FFTの効率を維持していることと、可変周波数および可変時間分解能が同時に得られることなので、周波数とともに時間に対して、取得した情報を最適化することができる。
この概念の欠点は、大きな音のスペースを計算する場合は、大量のフーリエ変換を計算しなければならないことであって、フーリエ変換毎にウインドウ化(フィルタリング)を改めて行う必要があり、同時に、ダウンサンプリングを行う必要がある。このことは、最も低いオクターブには非常に多くの数の時間サンプルが必要で、一番上のオクターブにはほとんど時間サンプルを必要としないことを意味することになる。従って、完全な分析を計算したい場合は、いわゆる全ピラミッドの一番上のオクターブに対する全ての(小さい)数のサンプルを計算する必要がある。この方法では、各FFTの結果のほとんどをさらに“無駄に”して、時間“ピラミッド”において、低いオクターブに対してかなり多くの数の重複を必要とするので、実際には効率的なFFTを用いるにもかかわらず、この方法は非常に集約的なものである。換言すれば、各オクターブに対してそれ自体のFFTを計算して、完全なスペクトルを得る必要がある。すなわち、例えば、8ミリ秒毎または16ミリ秒毎に時間信号を完全に分析したい場合は、例えば、6オクターブを計算する場合は、128ミリ秒の楽曲の抜粋に対してFFTを96(!)回も行う必要がある。
本発明の目的は、可変スペクトル係数を用いて、音声信号をスペクトル表現に変換するより効率的な概念を提供することである。
この目的は、請求項1に記載の変換装置、請求項24に記載の変換方法、請求項21に記載の供給装置、請求項25に記載の生成方法、または請求項26に記載のコンピュータプログラムにより達成される。
本発明は、可変スペクトル係数によりスペクトル表現に変換することについて、音楽信号と、可変スペクトル係数が存在する求められた周波数ラスタとの相関として理解可能であるという知見に基づいている。信号と周波数ラスタとの相関については、音声信号にどのくらいの割合で含まれているか求めることとして理解可能であり、可変スペクトル係数に対応付けられた周波数帯域に含まれるものである。基本関数の例として、音声信号と正弦音との相関により、基本音の周波数での音声信号の内容を生成する。従って、音声信号と基本関数との相関により、可変スペクトル表現への変換を得ることができる。各基本関数は、可変スペクトル表現内の可変スペクトル係数の時間表現である。この相関を畳み込みとして理解する場合は、この相関を基本関数毎の音声信号畳み込みとして理解できる。
しかしながら、本発明によれば、この計算を時間領域で行わないで、周波数領域で行う。このために、まずはじめに、音声信号自体をウインドウ化して、音声信号のウインドウ化ブロックを得る。音声信号のウインドウ化ブロックは、所定の時間長を有している。これに続いて、サンプルのウインドウ化ブロックを、スペクトル係数のセットを含むスペクトル表現に変換する。これは好ましくは、例えば、計算効率の良いFFTを用いて得たような、定スペクトル係数である。音声信号のこのような1つの計算したFFTスペクトルは、異なる周波数値を有する基本関数との相関による。例えば、46.0Hzおよび48.74Hzのスペクトル係数で可変スペクトル係数を求める場合は、一方の基本関数は46.0Hzの正弦関数で、もう一方の基本関数は48.74Hzの正弦関数である。2つの基本関数は、互いに定義済みの位相で、そして、好ましくは同じ位相で開始する。次に、帯域幅を最終的な可変スペクトル表現に含まれる可変スペクトル係数に設定することにより、基本関数を変換するウインドウ長で、2つの基本関数をウインドウ化して変換する。基本関数から得た基本関数スペクトル係数は、基本関数係数のセットとも呼ばれる。相関のための時間領域での畳み込みを、周波数領域で、FFTスペクトルに基本関数係数を単に乗算することにより行う。基本関数係数による乗算の最後には、基本関数の周波数値から与えられる、得られる可変スペクトル係数の周波数値により、基本関数の周波数での音声信号にどの程度信号エネルギーが含まれているかを示す振幅値となる。
すでに述べたように、基本関数係数を得るために、基本関数をウインドウ化するウインドウが、可変スペクトル係数の帯域幅を設定する。大きい可変周波数値に対して、すなわち、高い音楽音に対して、もはや帯域幅を低い音と同じにする必要はない。この理由から、短いウインドウでウインドウ化し、次に高い音に対する基本関数係数を得るために変換した基本関数から、高い音に対する基本関数係数のセットを得る。次に、基本関数係数のセットを用いて、元々のFFTスペクトルの重み付けを行うことにより、この高い音に対する可変スペクトル係数を再び得る。
本発明によれば、高い音に対しては、周波数が高い基本関数のウインドウが、周波数が低い基本関数のウインドウ化を行うウインドウよりも短いという事実を有利に利用することができる。(第1の基本関数よりも高い音を表す)第2の基本関数をウインドウ化したウインドウの後でウインドウ化を行うことは、音声信号の時間的に後の部分に対する分析である。このために、はじめに第2の基本関数をウインドウ化したウインドウよりも時間的に後にあるウインドウで、(高い音に対する)同じ第2の基本関数のウインドウ化を行う。次に、求めた周波数での音声信号の内容を含む、すなわち、音声信号で以前に計算した領域に時間的に続き、計算した可変スペクトル係数と同じ周波数を有する可変スペクトル係数を得るために、次に、同じフーリエスペクトルを用いて、このように得られた基本関数係数の重み付けを行う。本発明によれば、このことは、基本関数をウインドウ化して変換することにより発展させる複素基本関数係数を基本関数係数として用いることにより達成される。従って、元々計算した音声信号スペクトルが好ましくは複素スペクトルである、ウインドウ内の音声信号領域を考慮に入れることができるようになる。
本発明の好適な実施の形態では、高い音の基本関数のウインドウ化を行うウインドウ長に対する整数の倍数に基づいて、低い周波数値に対する基本関数係数を求めるウインドウのウインドウ長を選択する。好ましくは、整数の倍数は、2の倍数である。これにより、すべての基本関数係数のセットを効率的に行列に分類することができるので、定スペクトル表現を可変スペクトル表現に変換することを、非常に効率的に行うことができる単純な行列ベクトル乗算としておこなうことができる。ここで、ベクトルが音声信号の定スペクトル変換の結果となり、行列は各行に基本関数係数のセットを含んでいる。
特に、この点について、理想的な場合は、すなわち求める音の周波数で、基本関数係数のセットは1つの基本関数係数しかないので、行列は非常にまばらな行列であることを指摘しておく。しかし、典型的には、基本関数のウインドウ化を行うウインドウは、可変スペクトル係数の周波数値を正確に分解するような分解能ではない。また、基本関数のウインドウ化を位相が正確になるようには行わないので、基本関数が特定の位相でウインドウに入力し、特定の位相で基本関数のウインドウ化を行うウインドウから出力するという事実に起因するスペクトルラインをさらに生成する。さらに、好ましくは、他のウインドウによる重み付けを全く行わないので、数値的に非常に効率的な矩形ウインドウ化を行うことにより、アーティファクトを生成するが、基本関数の周波数での実際のスペクトルラインの隣にさらにスペクトルラインを生成することになる。
実施により、基本関数係数を直接計算することができる。しかしながら、好ましくは、基本関数係数をオフラインで計算する。すなわち、基本関数ウインドウのある時間長またはあるサンプリングレートで、これを行列に保存する。次に、可変スペクトル表現を計算する際に、または定スペクトル表現を可変スペクトル表現に“変換”する際に、この重み付け行列を、プロセッサのワーキングメモリにファイル化することもできる。
好適な実施の形態では、基本関数係数のセットの中の基本関数係数の数は限定されている。ここで、用いる基本関数係数が基本関数のウインドウ化を行うウインドウに含まれる全エネルギーのある百分率である定スペクトルの重み付けを行う際に、多くの数の基本関数係数を用いることは好ましい。この百分率が100%に近い高さに設定されている場合は、スペクトル分析はより正確になる。しかし、この百分率が100%とかけ離れて設定されている場合は、重み付けを行うのに必要な基本関数係数の数が低減するので、これ自体、より効率的で高速の重み付けを示す。従って、基本関数係数の行列は本質的にまばらな行列であり、百分率をさらに100%とかけ離れるように設定することにより、このまばらな行列をさらに“間引く”こともできるので、好ましくは、非常にまばらな行列を処理する特定のアルゴリズムを用いて、非常に効率的な計算を行うことができる。好適な値の1つは、重み付けにともに用いる基本関数係数が、基本関数のウインドウ化を行う全ウインドウに含まれるエネルギーの90%を含む値である。
添付の図面を参照して、本発明の好適な実施の形態について、以下により詳細に説明する。
図1は、可変スペクトル係数を用いて、一連のサンプルとして与えられる音声信号をスペクトル表現に変換する装置の好適な実施の形態を示す。ここで、周波数値および帯域幅は、それぞれ可変スペクトル係数に対応付けられていて、可変スペクトル係数の帯域幅は可変であって、可変スペクトル係数の周波数値の間隔は可変である。図1の本発明の装置は、時間的に所定の長さの音声信号のウインドウ化ブロックを得るために、音声ウインドウ関数を用いて音声信号のウインドウ化を行う手段10を含んでいる。好ましくは、ウインドウによって決まる周波数分解能が大きいので、十分な分解能でスペクトル内の最も低い音が得られるように、時間に関するウインドウが十分長いという事実により、時間的に所定の長さが求められる。前述のように、音楽分析に必要な分解能は、中心周波数の6%である。従って、2つの音を分解可能にするためには、可変スペクトル表現で求めた最も低い周波数の約3%に等しい周波数分解能が得られる程度に長いウインドウ長が必要である。求めた最も低い音が46.0Hzである場合は、1.38Hzの分解能が得られる程度の長いウインドウが必要である。しかし、このように低い音は滅多に発生しないので、これらの非常に低い音に対して、ここでは、小さな分解能誤差は重大なものではなく、256ミリ秒の時間ウインドウ長で十分で、これは、1.95Hzの周波数分解能に対応する。
複素スペクトル係数のセットを有するスペクトル表現にウインドウ化ブロックを変換する手段12に、サンプルのウインドウ化ブロックを供給する。ここで、効率性の理由から、複素定スペクトル係数のセットを供給する変換規則が好ましく、これらの定スペクトル係数の周波数値は、一定の帯域幅および/または一定の周波数間隔を有している。
本発明の装置はさらに、基本関数係数のセットを供給する手段14を含む。好ましくは、行列をファイル化したルックアップテーブルとして手段14を構成する。ここで、ルックアップテーブルの行/列位置により、行列係数を参照することができる。特に、供給手段14を、少なくとも基本関数係数の第1のセットと、基本関数係数の第2のセットと、基本関数係数の第3のセットとを供給するように構成する。ここで、本発明による基本関数係数は、複素基本関数係数である。特に、基本関数係数の第1のセットは、第1のウインドウ化の結果および第1の基本関数の第1の変換を表す。第1の基本関数は、第1の可変スペクトル係数の第1の周波数値に対応する周波数を有している。図4を参照して後述するように、第1の基本関数を、例えば、周波数131Hzの正弦関数とすることもできる。
基本関数係数の第2のセットの基本関数係数は、第2のウインドウ化の結果および第2の基本関数の第2の変換である。やはり図4を参照すると、第2の基本関数は、例えば、周波数277Hzの正弦関数である。
次に、基本関数係数の第3のセットは、第3のウインドウ化の結果および第2の基本関数の変換を表す。すなわち、例えば、基本関数は周波数277Hzの正弦信号である。
第2のウインドウ化と第3のウインドウ化のウインドウ長と比較して、第1のウインドウ化のウインドウ長が異なるという点で、第1のウインドウ化、第2のウインドウ化、および第3のウインドウ化は相違する。ここで、図4に示す例では、好ましくは、第1の基本関数をウインドウ化するウインドウ長は、第2の基本関数をウインドウ化するウインドウ長の2倍である。一般的に言って、第1のウインドウ化を行うウインドウは、第2のウインドウ化または第3のウインドウ化を行うウインドウよりも長い。
本発明によれば、第2および第3のウインドウ化を行う際のウインドウのウインドウ位置も、やはり互いに異なるので、第3のウインドウは、第2の基本関数のウインドウ化を行う第2のウインドウに比べて、第2の基本関数の時間的に後の部分を供給する。従って、図4に示す実施の形態では、時間軸43の方向が図4で左から右の方向である場合は、右側の長方形41が第3のウインドウとなり、左側の長方形40が第2のウインドウとなり、第1のウインドウ42が第2のウインドウ40および第3のウインドウ41と同じウインドウ長を有する。
図1に示すように、本発明の装置はさらに、手段12から出力した複素スペクトル係数のセットの重み付けを行う手段16を含んでいる。ここで、第1の可変スペクトル係数を計算するために、基本関数係数の第1のセットを用い、音声ウインドウの第1の部分に対して第2の可変スペクトル係数を得るために、基本関数係数の第2のセットを用いて複素スペクトルの重み付けを行い、元々の音声ウインドウの第2の部分に対して第2の可変スペクトル係数を計算するために、基本関数係数の第3のセットを用いて音声スペクトルの重み付けを行う。
音声スペクトルが好ましくは複素スペクトルであるという事実、すなわち、スペクトル値の位相情報を含むという事実と、基本関数係数が、基本関数係数を計算するウインドウ内の基本関数の位相情報を含む複素係数であるという事実とにより、本発明により、第1の可変スペクトル係数より高い時間分解能で第2の可変スペクトル係数を計算し、あるいは、まったく同じ複素音声スペクトルを用いて、最も低い可変スペクトル係数に対して第1の(低い)時間分解能を得て、同一の音声スペクトルに基づいて、第2の可変スペクトル係数に対して、時間に連続する2つの可変スペクトル係数を得る。従って、第2の時間(高い)分解能で第2の可変スペクトル係数が得られる。
また、第2の基本関数のウインドウ化を行う第3のウインドウと、第2の基本関数のウインドウ化を行う第2のウインドウとが短いという事実により、すなわち第1の基本関数のウインドウ化を行う第1のウインドウよりもウインドウ長が短いという事実により、第2の可変スペクトル係数の帯域幅が、時間的に早い時点と遅い時点の両方で、第1の可変スペクトル係数に対応付けられた帯域幅よりも低いので、第2および第1の可変スペクトル係数が可変ウインドウ分解能を有することになる。
続いて、図3を参照して、基本関数係数のセットを計算する手順について説明する。図3の一番上の図において、例えば、周波数131Hzの正弦関数である第1の描かれていない基本関数があり、従って、図4に示す実施の形態の複数の群の音(周波数値)の第2の群の最も低い音を表す。例えば、基準点30で位相0などのような所定の位相から開始し、図3の一番上の図のt軸に沿って延びている。この第1の基本関数を第1の基本関数ウインドウを用いてウインドウ化するので、ウインドウ始点30からウインドウ終点31まで、(位相的に正確に)第1の基本関数を抽出する。この抽出の変換に続いて、好ましくはFFT、または一般的には複素スペクトル値を供給する変換により、基本関数係数の第1のセットが得られる。
また、図の中程で、図3は第2の基本関数(図示せず)を示す。これは、例えば、図4に示す実施例を考える場合では、周波数277Hzの正弦関数である。第2の基本関数はまた、好ましくは位相0、または一般的に第1の基本関数に対する所定の位相の関係にある開始点30から開始して、任意の長さの時間軸tに沿って延びている。第2のウインドウ位置から開始して第3のウインドウ位置、すなわち、点33で終わる第2の基本関数ウインドウを用いて、第2の基本関数のウインドウ化を行うことにより、2つの基本関数が第3のウインドウ位置33を通過する位相位置を考慮に入れた、複素基本関数係数の第2のセットを供給する。第3の基本関数ウインドウは、時刻33から開始するか、ウインドウの開始をウインドウ位置とする場合は、第3のウインドウ位置で示される。しかしながら、ウインドウ位置としては、任意の所定の点、例えば、ウインドウの中間またはウインドウの終わりに設定することもできる。好ましくは、第2の基本関数ウインドウの直後に第3の基本関数ウインドウを配置し、入力側において、ほとんど確実に0にならない位相位置で第2の基本関数を得る。ここで、第2の基本関数はさらに、ある位相で第3の基本関数ウインドウの終わり34を通過する。複素スペクトルに変換することにより、基本関数係数の第3のセットを得る。ここで、第3の基本関数ウインドウに入/出力する第2の基本関数の位相情報は、基本関数係数の第3のセットの位相に含まれている。
図3に、第n番目の基本関数の別の場合について下部に示す。再び図4を参照すると、例えば、第n番目の基本関数を、554Hzの基本関数とすることができる。これは、好ましくは開始点30から開始して、第1の基本関数および第2の基本関数の開始点と協調して、位相0または所定の位相で開始して、図3の時間軸に沿って延びている。第k番目の基本関数係数セットを生成するために、第1のウインドウ35aにより、第n番目の基本関数の第1の抽出を行う。それに対応して、ウインドウ35bにより基本関数の次の部分を供給し、ウインドウ35cにより基本関数の次の部分を供給し、ウインドウ35dにより、第n番目の基本関数の次の抽出を行う。特に、図3の中程および下部に示す基本関数は、ウインドウ開始毎、またはウインドウ位置毎に改めて開始しないが、すべての基本関数でそろえられている開始位置30で開始して、時間軸に沿って延びており、正弦関数等の関数規則により、ウインドウが終わっているか、そうでないのかという事実とは無関係であることを指摘しておく。
第2の基本関数ウインドウの長さと、第3の基本関数ウインドウの長さとはそれぞれ同じなので、第2の基本関数ウインドウおよび第3の基本関数ウインドウにより、第2および第3のセットの基本関数係数が供給される。これらは、同じスペクトル分解能を有しているが、基本関数係数の第1のセットの分解能よりも小さく、例えば、図3のウインドウ35aにより第n番目の基本関数のウインドウ化を行うことにより得られる、第k番目の基本関数係数のセットの分解能よりも大きい。この理由から、これらの各種の基本関数係数のセットのスペクトルの重み付けを行うことにより得られる可変スペクトル係数が、基本関数のウインドウ化を行うウインドウに対応する分解能を有している。従って、本発明によれば、分解能を、元々のFFTの分解能から求めないで、基本関数ウインドウの分解能から求める。音声信号のウインドウ化ブロックを変換するFFTが、最大スペクトル分解能を設定するだけである。基本関数ウインドウが音声ウインドウよりも短い場合は、基本関数ウインドウにより、周波数分解能が設定される。従って、この点について、音声ウインドウと同じあるいはそれ以下の長さのすべての基本関数ウインドウを選択することは好ましい。
続いて、図4を参照して、音楽分析を行う本発明の好適な実施の形態について説明する。左側の列43に、図4に示す実施の形態により分析することができる、全体で88の階調を示している。図4の第2の列44に示すように、階調は可変スペクトル係数の周波数値を表し、7.3オクターブの周波数範囲をカバーし、Hzで示すと、46Hzから7040Hzの周波数範囲で表される。図4の真ん中の列45に、基本関数ウインドウの位置/長さを示す。図3の基本関数ウインドウとは異なり、図4では第0番目の基本関数ウインドウ46についても示している。ここで、0ミリ秒で開始するそのウインドウが、第1の基本関数ウインドウ42のウインドウのはじめと協調しないように配置されており、第1の基本関数ウインドウは、ウインドウのはじめまたは64ミリ秒のウインドウ位置を有している。さらに、第0番目の基本関数のウインドウの終わりが第1の基本関数ウインドウ42のウインドウの終わりと全く同じではなく、これより64ミリ秒長くなっている。
好ましくは、すべての基本関数、すなわち、46Hzから7040Hzの周波数の正弦関数が、図4に示す実施の形態では0ミリ秒に設定されている、基本関数に対してまったく同じ基準点における位相0から開始する。しかしながら、図4に示すように、第0番目の基本関数ウインドウおよび第1の基本関数ウインドウ42のウインドウのはじめは、全く同じではない。その代わり、第1の基本関数ウインドウ42、第2の基本関数ウインドウ40、第3の基本関数ウインドウ46、第8番目の基本関数ウインドウとともに第16番目の基本関数ウインドウ48は、実際に同じウインドウ位置から開始しているが、第0番目の基本関数ウインドウよりも64ミリ秒遅くなっている。このことは、すべて0ミリ秒の点の基準位相から開始する、求めるすべての可変スペクトル係数の基本関数が、任意の位相でウインドウ42、40、46、47、48に入力するが、複素基本関数係数がこの位相をカバーし、ウインドウ化および変換により、基本関数係数となることを示している。
従って、好ましくは、第0番目の基本関数ウインドウが音声ウインドウと一致するので、第1の18階調を表す46Hz〜124Hzの周波数に対する可変スペクトル係数が、0ミリ秒〜256ミリ秒の音声信号の時間領域の代理となる。131Hz〜262Hzの周波数値に対する可変スペクトル係数は、64ミリ秒〜192ミリ秒の音声信号の範囲を参照する。
第2の基本関数ウインドウ40および第3の基本関数ウインドウ41が、第1の基本関数ウインドウ40の半分しかないという事実により、64ミリ秒〜128ミリ秒の時間部分に対する1つの可変スペクトル係数とともに128ミリ秒〜192ミリ秒の抽出に対する第2のスペクトル係数が、周波数277〜523の各周波数となる。
周波数値554Hz〜1046Hzの可変スペクトル係数それぞれに対して、やはりそれぞれ4つの可変スペクトル係数が生じ、例えば、周波数554Hzに対する第1の可変スペクトル係数は、64ミリ秒〜96ミリ秒の間の音声信号部分を参照する。次のウインドウ49に戻る第2の可変スペクトル係数は、元々の音声信号の96ミリ秒〜128ミリ秒の間の抽出を参照する。さらに、例えば、周波数値1108Hzに対する可変スペクトル係数は、同様に、対応する後の抽出となる。
例えば、2216Hz〜7040Hzの周波数をカバーする一番上の21の階調の一群では、それぞれウインドウ長8ミリ秒のウインドウを採用することが好ましいので、16個の短いウインドウ48が、長い第1の基本関数ウインドウ42に対応する。
図4に概略で示すように、ウインドウ配列により得られる基本関数係数を、図5を参照して説明するように、好ましくは行列で保存することを指摘しておく。次に、図1の手段16が行う重み付けは、好ましくは第0番目の基本関数ウインドウにより音声信号のウインドウ化を行うことにより得られる、複素スペクトルの単純な行列乗算となる。係数行列、すなわち、基本関数係数のセットを保存する行列における単純な行列乗算は、非常にまばらになっている。本発明によれば、音声信号を1回変換して、行列ベクトル乗算を1回行うことにより、音声信号の可変スペクトル表現が得られる。これにより、8ミリ秒の時間部分毎に、すなわち、最も短いウインドウ48の長さ毎に、完全なスペクトル情報が供給される。従って、46Hz〜262Hzの最も低い2つの階調群に対する可変スペクトル係数は実際に、長さ8ミリ秒の16個のスペクトルすべてについて全く同じになる。しかし、2216〜7040Hzの周波数については、8ミリ秒毎に新規のスペクトルとなる。
換言すれば、別のウインドウよりも長い基本関数ウインドウに戻る可変スペクトル係数を、短い基本関数ウインドウにより得られるスペクトルに対して“再使用”する。図4を参照すると、このことは、図4の下部の行の基本関数ウインドウにより得られるスペクトルを、図4の上の行の基本関数ウインドウにより得られる(相互に異なる)すべてのスペクトルに“再使用”することを意味する。
しかしながら、長い基本関数ウインドウによる可変スペクトル係数のこのような“リサイクル”が、時間/周波数分解能の自然な法則に対応するのは、簡単に述べると、低周波数の信号の周期が高周波数の信号の周期よりも長いからである。
従って、前もって記憶した非常にまばらな行列により乗算を1回行うことだけでなく、FFTを1回行うことによっても、本発明の概念により、それぞれ長さ8ミリ秒の16個の可変スペクトルを供給するので、これにより、長さ128ミリ秒の音声信号の、完全な(ギャップのない)領域を、高時間分解能および高周波数分解能で分析する。同じ例として、はじめに説明した有界Q分析では、96(!)回完全なフーリエ変換を行う必要がある。
基本関数ウインドウを、必ずしもすべての他の基本関数ウインドウに対して相殺する必要はないことについて指摘しておく。その代わり、第0番目の基本関数ウインドウのウインドウの始点を、第1の基本関数ウインドウのウインドウの始点等と協調させることもできる。この場合、さらに、131Hzの音で開始する縦の列の全ウインドウ配列を反映させるのが好ましいので、第1の基本関数ウインドウ42が、同じ長さのさらに下流の基本関数ウインドウを有することになり、同じ長さの新規の4つの基本関数ウインドウが、基本関数ウインドウ40および41と一致する。
しかしながら、元々の音声信号を連続音声ウインドウで分析しないものの、重複する音声ウインドウで分析するという点で、図4に示す下部の基本関数ウインドウの上の、中心となる上部の基本関数ウインドウの配列は好ましい。好適な重複として、50%の重複を選択する。
続いて、図6を参照して、時間表現に存在する元々の基本関数から基本関数係数を生成するように供給手段が構成されている場合に、基本関数係数のセットを供給する手段の好適な実施の形態について説明する。まずはじめに、基本関数を、ウインドウにより基本関数のウインドウ化を行う手段60に供給する。ここで、ウインドウ長/ウインドウ位置制御61の制御により、ウインドウは定義済みのウインドウ長およびウインドウ位置を有している。これに続いて、基本関数のウインドウ化ブロックを変換手段63に供給する。ここで、変換アルゴリズムとして、FFTアルゴリズムが好適である。前もってオフラインで計算を行って係数のセットを求めるので、図6に示す計算は必ずしも効率的である必要はないことを指摘しておく。
典型的には、ブロック62の変換結果は、少ない大きな線と複数の小さな線とを有するスペクトルとなる。これらの少ない大きな線は、可変スペクトル係数の周波数値が、変換62により得た分解能と必ずしも一致している必要がないという事実に起因するものである。また、基本関数が、必ずしも位相0でウインドウに入力したり、位相0でウインドウから出力したりする必要がないという事実により、係数もまた生成される。さらに、重要ではないが、ウインドウ化自体がアーティファクトの原因となる。また、同じウインドウ形状を音声ウインドウおよび基本関数ウインドウとして用いる場合は、アーティファクトはある程度補償される。本発明によれば、数値的に処理できる最も単純なウインドウ、すなわち、矩形ウインドウにより、最も良い結果となることがわかった。
所定の条件となるように、次に、基本関数係数のセットから選択を行う。このために、全エネルギーの測定値を得るために、二乗基本関数係数を加算するように、各スペクトル値、すなわち、各基本関数係数を二乗する手段63にスペクトルを供給する。これに続いて、スペクトルを、大きさによりスペクトル係数を配置し、最大値から最小値まで加算する手段64に供給する。ここで、百分率の所定のエネルギー閾値になるまで、この加算を続ける。従って、次に、加算したスペクトル値だけを基本関数係数として続けて用いるが、後述する係数行列をさらに間引きするために、もう加算されないスペクトル値を所定の方法で0に設定する。これに続いて、加算したスペクトル係数、すなわち、最終的に、各セットにおける基本関数係数の基本関数係数がともに同じエネルギーとなるように、加算されかつエネルギー測定値の90%となるスペクトル係数を、加算したスペクトル係数をスケーリングする手段65に供給する。これにより、当然、基本関数は実質的に、短いウインドウよりも長いウインドウに対してよりエネルギーを供給するという事実が相殺される。従って、アーティファクトを受けないように、基本関数係数の各セットのエネルギーを、例えば、50%、好ましくは5%の所定の偏差閾値以内にする。
これに続いて、ブロック64で行った選択工程で“残った”スケーリングした基本関数係数を、係数行列に入力させる手段66に供給して、最後に、好ましくは手段67により、ルックアップテーブル(LUT)に保存する。図6では、各階調に対して(図4の実施の形態の)すべての基本関数係数の32セットを計算するまで、ウインドウ長指標61およびウインドウ位置指標により制御し、基本関数入力59を介して供給した基本関数の各時間表現に対して、この手順を続ける。図5は、基本関数係数の典型的な行列を示し、基本関数係数のセットを行列の各行に入力する。音声ウインドウ化および音声変換により得た周波数と同じ数の列を有するベクトルで、行列を乗算する。出力側では、図4に示す88階調に対する可変スペクトル係数となるが、周波数277Hzの階調に対する2つの可変スペクトル係数がすでに存在していて、周波数554Hzの可変スペクトル係数に対する、連続時間領域に関する4つの可変スペクトル係数がすでに存在している。
対応するウインドウ分割を有する図4に示す実施の形態では、535個の基本関数係数セットを用いる。ここで、さらに2048個の複素周波数値を計算し、この値を、第0番目の基本関数ウインドウの長さに設定する。そして、これに、4096個の実際のサンプルを供給する。図4の右側では、図6を参照して、“帯域”毎にいくつの複素係数が選択処理で“残る”かを示している。最も低い領域では、18階調毎に約2〜3個の複素係数が残っている。第2の帯域では、131Hz〜262Hzの階調それぞれに対して、約4つの複素係数がそれぞれ残っている。次の帯域では、階調毎に14個の複素係数となっている。一番上の帯域では、21階調に対して、1134個の複素係数が選択処理で残っており、階調毎に54個の複素スペクトル係数が残っていることを意味している。このことは、図4に示すように、21666〜21691個の複素係数が存在することを意味している。しかし、図5に示すように、係数行列はやはり1.98%しかない。
この点で、図5の×印は、係数セットについて任意の値が存在できる位置を表していることについて指摘する。従って、第0番目の基本関数ウインドウによる周波数分解能は、第1の基本関数ウインドウ42による周波数分解能の2倍高い。この理由から、131Hzの階調に対する列では、原則として、例えば、124Hzの階調に対する列に対して、せいぜい行列の全ての2番目の位置が占めている。277Hzで始まる次の帯域では、やはり、せいぜい行列の行の4番目の点が占めている。554で始まる次の帯域では、周波数分解能が低減しているので、せいぜい第8番目の値が占めており、以下同様である。
図5の×印は、とにかく任意の値が存在できるところを示していることをもう一度指摘しておく。しかしながら、選択処理により、いずれにしろ0ではない実際の値で、行列の最も数少ない可能なスポットがあるという事実につながる。従って、行列の実際の形状は、図5に示すように、上の帯域でスペクトル係数が多くなっているという事実により、行列の“可能性”群の図をだいたい逆にしたように見える。
本発明の概念は、88階調の範囲に関し、具体的には、256ミリ秒〜8ミリ秒のウインドウサイズで46.3Hz(F1シャープ)〜7040Hz(A8)の範囲に関する。すでに説明したように、最も低い周波数には、システム結果に対して128ミリ秒の最大フレーム増加となる、時間的に50%重複する分析ウインドウを用いる。もちろん、入力信号サンプルをギャップなしで分析する場合は、この特性により、より高い周波数にはより大きい出力値を生成する。この不整合の実際的な解決法は、低い周波数出力値に用いるサンプル&ホールドオートマティズムで、これにより、完全な変換信号である行列表現(図5)を得ることができる。換言すれば、これは、高時間分解能の高い分解能複素スペクトルを得るための、低い周波数に対する可変スペクトル係数のリサイクルを表す。
特に、本発明の概念は、より集約的なハミングウインドウの代わりに、計算上より効率的な矩形ウインドウを用いるという事実に特徴がある。また、本発明の好適な実施の形態では、50%の重複で完全な分析を行う。特に、図4および図5に基づく本発明の行列構造は好ましい。
本発明の概念は、ブロック化した一定のウインドウ長に特徴がある。従って、(図4の)帯域内で異なるが、基本関数係数を計算する異なるウインドウにより、帯域から帯域へ再び“再調整”する品質係数に特徴がある。特に、係数を低減する基準を適用するという事実により、行列ベクトル乗算演算を効率的にする。すなわちエネルギーが最も大きい係数だけを残し、その合計は、例えば、全係数セットのエネルギーの90%となる。エネルギースケーリングにより、基本関数係数の各セットがほぼ同じエネルギーを有するので、基本関数係数から得られる相関が、すべての可変スペクトル係数に対して等しく効果を発揮する。
この点について、検査時間ウインドウ、すなわち、音声信号ウインドウが、分析する時間信号の信号部分を参照することを指摘しておく。この時間信号を、時間領域で256ミリ秒の幅の矩形ウインドウと乗算して、FFTにより周波数領域に変換する。次に、CQT係数または基本関数係数を用いて、正確な分析を行う。次のFFTを計算する前に、その幅毎に50%、すなわち、128ミリ秒で、矩形ウインドウを移動する。従って、時間領域の各サンプルは、FFTに2回入力する。これらの周波数で求めようとする高分解能で、矩形ウインドウの幅を計算する。周波数分解能に対する要求が低くなるものの、周波数がより高くなるので、より小さなウインドウ幅でも十分である。
音声ウインドウ内のスペクトル部分の位置がより正確になるように、この点で、変更CQTは係数の位相情報を利用する。換言すれば、矩形ウインドウに対して、周波数範囲に関わらず、異なる数の周波数値となる。すなわち、最も低い周波数範囲に対して正確に値が1つとなる。ここで、50%の重複で各サンプルを2回用いて、次に高い範囲に対して、やはり正確に値が1つとなる。ウインドウセンターを軸として展開するサンプルの半分しか使用しない。次に高い範囲に対して、値は正確に2つとなり、サンプルの第2または第3の四半分しか用いない等ということになる。全体的な変換結果を行列の形式で表すことは好ましい。高時間分解能に対する本発明の特徴であるが、周波数範囲によっては同じ分析部分に対して異なる数の値が存在するので、低い周波数範囲から値の繰り返しまたは“リサイクル”を行って、最も小さいウインドウ毎に完全なスペクトルを表すことができる。
基本関数係数の選択に関して、1行毎に、すなわち、1つの分析ビン毎に、最も大きい値から開始して、全行列または行列の行で得られる最も大きい二乗合計の90%の閾値になるまで、商を二乗して加算することについて指摘しておく。各行の残りの商を、0に設定する。次に、残りの係数は、行の均一な重み付けを行うために、一行ごとに正規化される。
本発明により生成した可変スペクトル表現は、音楽分析に好ましく応用することである。特に、トランスクリプション、すなわち、音符を求めることである。または、音の認識または和音検出のため、または一般に、スペクトル係数に対する可変帯域幅を用いて周波数分析を行う場合は必ず必要になる。従って、一般的に言うと、応用分野は、情報信号の変換である。これは、ビデオ信号ばかりでなく、電気または電子パラメータの時間測定値または時間シミュレーション過程、対象とする高い時間・高周波数分解能の周波数表現である。
最後に、本発明の概念を、ハードウェア、ソフトウェア、またはハードウェアおよびソフトウェアの混合物として実施することもできることを指摘しておく。従って、コンピュータプログラムをコンピュータ上で実行する場合は、本発明はまた、本発明による方法の1つを機械読み取り可能コードを有するコンピュータプログラムに関する。
図1は、音声信号を変換する好適な装置のブロック回路図である。 図2は、可変スペクトル表現を定スペクトル表現と比較する表形式の表現である。 図3は、基本関数から基本関数係数の計算を行うことを説明する概略説明図である。 図4は、約46Hz〜7040Hzの可変スペクトル係数での可変スペクトル表現を求める好適な実施の形態の概略説明図である。 図5は、図4に示す実施の形態の好適な行列表現の一部の概略説明図である。 図6は、本発明による、各種の周波数値および各種の(連続)ウインドウに対して基本関数係数セットを計算する装置のブロック回路図である。

Claims (21)

  1. 一連のサンプルとして与えられる情報信号を対象のスペクトル係数を有する対象のスペクトル表現に変換し、対象のスペクトル係数は対応する周波数値と対応する帯域幅とを含み、隣接する対象のスペクトル係数の間の周波数間隔は可変である装置であって、
    前記情報信号のウインドウ化を行って、時間的長さを有する情報信号のウインドウ化ブロックを得る手段(10)と、
    サンプルのウインドウ化ブロックを、情報信号スペクトル係数のセットを有するスペクトル表現に変換する手段であって、前記情報信号スペクトル係数は隣接する情報信号スペクトル係数の間に一定の周波数間隔を有するものである手段(12)と、
    複素基本関数係数の第1のセット、複素基本関数係数の第2のセットおよび複素基本関数係数の第3のセットを供給する手段(14)とを備え、
    前記第1のセットの基本関数係数が、第1の対象のスペクトル係数の第1の周波数値に対応する周波数を有する第1の基本関数の第1のウインドウ化およびそれに続く時間/周波数変換の結果を表し、
    前記第2のセットの基本関数係数が、第2の対象のスペクトル係数の第2の周波数値に対応する周波数を有する第2の基本関数の第2のウインドウ化およびそれに続く時間/周波数変換の結果を表し、
    前記第3のセットの基本関数係数が、前記第2の周波数値を有する前記第2の基本関数の第3のウインドウ化およびそれに続く時間/周波数変換の結果を表し、
    前記第1のウインドウ化でのウインドウ(42)のウインドウ長が、前記第2および前記第3のウインドウ化でのウインドウ(40、41)のウインドウ長と異なり、前記第2のウインドウ(40)および前記第3のウインドウ(41)のウインドウ位置が、前記第2の基本関数に対して異なる点で、前記第1のウインドウ化、前記第2のウインドウ化および前記第3のウインドウ化が異なり、
    前記第1の対象のスペクトル係数を計算するために、前記情報信号スペクトル係数のセットを前記基本関数係数の第1のセットで重み付けし、前記情報信号の前記ウインドウ化ブロックの第1の部分に対する第2の対象のスペクトル係数を得るために、前記情報信号スペクトル係数のセットを前記基本関数係数の第2のセットで重み付けし、情報信号の前記ウインドウ化ブロックの第1の部分と異なる、前記情報信号の前記ウインドウ化ブロックの第2の部分に対する前記第2の対象のスペクトル係数を得るために、前記情報信号スペクトル係数のセットを前記基本関数係数の第3のセットで重み付けする手段(16)とを備える、装置。
  2. 前記情報信号が音楽情報を有する音声信号で、前記対象のスペクトル係数が音階の階調である周波数値を有する、請求項1に記載の装置。
  3. 前記重み付け手段(16)が、前記情報信号スペクトル係数を含むベクトルによって、基本関数係数の第1、第2および第3のセットを含む行列の乗算を行うように形成された、請求項1または請求項2に記載の装置。
  4. 前記情報信号は音声信号であり、前記ウインドウ化手段(10)が、音声ウインドウとして矩形ウインドウを用いるように形成された、請求項1ないし請求項3のいずれかに記載の装置。
  5. 前記第1のウインドウ化、前記第2のウインドウ化および前記第3のウインドウ化を行って基本関数係数を求めるウインドウが、矩形ウインドウである、請求項1ないし請求項4のいずれかに記載の装置。
  6. 複素基本関数係数の第1のセット、複素基本関数係数の第2のセットおよび複素基本関数係数の第3のセットを供給する手段(14)は複素基本関数係数の第1のセット、複素基本関数係数の第2のセットおよび複素基本関数係数の第3のセットを求めるステップを有し、前記基本関数係数の第2のセットを求めるステップにおいて用いられるウインドウのウインドウ長と、前記基本関数係数の第3のセットを求めるウインドウ(41)のウインドウ長とが等しく、前記基本関数係数の第1のセットを求めるステップにおいて用いられるウインドウ(42)の半分である、請求項1ないし請求項5のいずれかに記載の装置。
  7. 前記供給手段(14)が、別の基本関数をさらにウインドウ化演算した結果を表す基本関数係数のさらなるセットを供給するように形成され、前記さらなるセットの基本関数係数の数が、前記さらなるセットの基本関数係数が得られる基本関数の周波数値より低い周波数値を有する基本関数に対する基本関数係数のセットにおける複数の基本関数係数の2倍である、請求項1ないし請求項6のいずれかに記載の装置。
  8. 前記供給手段(14)が、前記第1の基本関数の周波数値よりも低い周波数値を有する別の基本関数に対する基本関数係数のセットをさらに供給するように形成され、別の基本関数のウインドウ化を行うウインドウ(46)が、前記基本関数係数の第1のセットを求めるウインドウ(42)よりも長く、基本関数係数の第1のセットを求める前記ウインドウ(42)のウインドウ位置と異なるウインドウ位置を有する、請求項1ないし請求項7のいずれかに記載の装置。
  9. 前記供給手段(14)は、基本関数係数セット内で、基準を満たす基本関数係数だけを供給し、前記基準の満たさない前記基本関数係数をゼロに設定するように形成された、請求項1ないし請求項8のいずれかに記載の装置。
  10. 前記供給手段(14)は、選択の結果として基本関数係数のセットを供給するように形成され、前記選択が、ウインドウ化(60)および変換(62)を行うことで得られたすべての基本関数係数の二乗および加算(63)を含み、前記加算は、さらに、加算した値がすべての基本関数係数の加算した値の所定の割合となるまで、最も大きい基本関数係数から開始する二乗基本関数係数の大きさを参照する加算を含み、加算に加わらない二乗基本関数係数が前記選択によって選択されない、請求項1ないし請求項9のいずれかに記載の装置。
  11. 前記供給手段(14)が、スケーリング(65)の結果として基本関数係数のセットを供給するように形成され、ウインドウ化(60)および変換(62)を行うことにより得られたすべての基本関数係数に対して加算を行った結果で、所定の基準を満たすすべての基本関数係数に重み付けし、スケーリング(65)の後に各セットに対して、セットにおける基本関数係数が他のセットにおける基本関数係数と同じエネルギーを有する、請求項10に記載の装置。
  12. 前記基本関数係数の第3のセットを求めるウインドウ(41)が、前記基本関数係数の第2のセットを求めるウインドウ(40)の直後にある、請求項1ないし請求項11のいずれかに記載の装置。
  13. 前記変換手段(12)が、情報信号スペクトル係数のセットとして複素スペクトル係数を供給するように形成された、請求項1ないし請求項12のいずれかに記載の装置。
  14. 前記変換手段(12)が、離散フーリエ変換および特に高速フーリエ変換を行うように形成された、請求項1ないし請求項13のいずれかに記載の装置。
  15. 前記供給手段(14)は、前記基本関数係数セットを供給するウインドウがすべて、前記基本関数係数の第1のセットを求めるウインドウ(42)のウインドウ長の整数比の長さであるように、基本関数係数のセットを供給するように形成された、請求項1ないし請求項14のいずれかに記載の装置。
  16. 前記供給手段(14)は、128ミリ秒の時間長を有する、前記第1のウインドウ(42)によるウインドウ化の結果として前記基本関数係数の第1のセットを供給するように形成され、前記供給手段(14)は、さらに、64ミリ秒の長さのウインドウ(40、41)によるウインドウ化の結果として、前記基本関数係数の第2のセットおよび前記基本関数係数の第3のセットを供給するように形成された、請求項1ないし請求項15のいずれかに記載の装置。
  17. 基本関数係数のセットを供給する装置(14)であって、
    第1の基本関数が第1の周波数値を有し、第2の基本関数が前記第1の周波数値より高い第2の周波数値を有する、第1基本関数および第2の基本関数の時間表現を供給する手段(59)と、
    第3のウインドウ(41)が第2のウインドウ(40)よりも時間的に後の第2の基本関数の一部に関係し、第1のウインドウ(42)により前記第1の基本関数のウインドウ化を行うとともに、前記第2のウインドウ(40)および前記第3のウインドウ(41)により前記第2の基本関数のウインドウ化を行う手段(60)と、
    基本関数係数の第1のセットを得るために、前記第1のウインドウ(42)による前記第1の基本関数のウインドウ化の結果を時間/周波数変換し、基本関数係数の第2のセットを得るために、前記第2のウインドウ(40)による前記第2の基本関数のウインドウ化の結果を時間/周波数変換し(62)、基本関数係数の第3のセットを得るために、前記第3のウインドウ(41)による前記第2の基本関数の第3のウインドウ化の結果を時間/周波数変換する手段(63)とを備え、
    前記第1のセット、前記第2のセット、および前記第3のセットは、請求項1にしたがって情報信号を変換する装置に利用可能である、装置。
  18. 所定の基準を満たす基本関数係数のセットから基本関数係数を選択し、前記所定の基準を満たさない選択されなかった基本関数係数をゼロに設定する手段(63、64)をさらに備える、請求項17に記載の装置。
  19. 一連のサンプルとして与えられる情報信号を対象のスペクトル係数を有するスペクトル表現に変換し、対象のスペクトル係数は対応する周波数値と対応する帯域幅とを含み、2つの隣接する対象のスペクトル係数の間の周波数間隔は可変である方法であって、
    前記情報信号のウインドウ化(10)を行って、時間的長さを有する情報信号のウインドウ化ブロックを得るステップと、
    サンプルのウインドウ化ブロックを、情報信号スペクトル係数のセットを有するスペクトル表現に変換する(12)ステップであって、前記情報信号スペクトル係数は隣接する情報信号スペクトル係数の間に一定の周波数間隔を有するものであるステップと、
    複素基本関数係数の第1のセット、複素基本関数係数の第2のセットおよび複素基本関数係数の第3のセットを供給する(14)ステップとを含み、
    前記第1のセットの基本関数係数が、第1の対象のスペクトル係数の第1の周波数値に対応する周波数を有する第1の基本関数の第1のウインドウ化およびそれに続く時間/周波数変換の結果を表し、
    前記第2のセットの基本関数係数が、第2の対象のスペクトル係数の第2の周波数値に対応する周波数を有する第2の基本関数の第2のウインドウ化およびそれに続く時間/周波数変換の結果を表し、
    前記第3のセットの基本関数係数が、前記第2の周波数値を有する前記第2の基本関数の第3のウインドウ化およびそれに続く時間/周波数変換の結果を表し、
    前記第1のウインドウ化でのウインドウ(42)のウインドウ長が、前記第2および前記第3のウインドウ化でのウインドウ(40、41)のウインドウ長と異なり、前記第2のウインドウ(40)および前記第3のウインドウ(41)のウインドウ位置が、前記第2の基本関数に対して異なる点で、前記第1のウインドウ化、前記第2のウインドウ化および前記第3のウインドウ化が異なり、
    前記第1の対象のスペクトル係数を計算するために、前記情報信号スペクトル係数のセットを前記基本関数係数の第1のセットで重み付けし、前記情報信号の前記ウインドウ化ブロックの第1の部分に対する第2の対象のスペクトル係数を得るために、前記情報信号スペクトル係数のセットを前記基本関数係数の第2のセットで重み付けし、情報信号の前記ウインドウ化ブロックの第1の部分と異なる、前記情報信号の前記ウインドウ化ブロックの第2の部分に対する前記第2の対象のスペクトル係数を得るために、前記情報信号スペクトル係数のセットを前記基本関数係数の第3のセットで重み付けする(16)ステップとを含む、方法。
  20. 基本関数係数のセットを供給する方法(14)であって、
    第1の基本関数が第1の周波数値を有し、第2の基本関数が前記第1の周波数値より高い第2の周波数値を有する、第1基本関数および第2の基本関数の時間表現を供給する(59)ステップと、
    第3のウインドウ(41)が第2のウインドウ(40)よりも時間的に後の第2の基本関数の一部に関係し、第1のウインドウ(42)により前記第1の基本関数のウインドウ化を行うとともに、前記第2のウインドウ(40)および前記第3のウインドウ(41)により前記第2の基本関数のウインドウ化を行う(60)ステップと、
    基本関数係数の第1のセットを得るために、前記第1のウインドウ(42)による前記第1の基本関数のウインドウ化の結果を時間/周波数変換する(63)ステップと、
    基本関数係数の第2のセットを得るために、前記第2のウインドウ(40)による前記第2の基本関数のウインドウ化の結果を時間/周波数変換する(62)ステップと、
    基本関数係数の第3のセットを得るために、前記第3のウインドウ(41)による前記第2の基本関数の第3のウインドウ化の結果の時間/周波数ウインドウ化を行うステップとを含み、
    前記第1のセット、前記第2のセット、および前記第3のセットが、請求項19の情報信号を変換する方法に使用可能である、方法。
  21. コンピュータに、請求項19に記載の情報信号を変換する方法または請求項20に記載の基本関数係数を供給する方法を実行させるためのコンピュータプログラム。
JP2007515797A 2004-06-14 2005-04-27 可変分解能により情報信号をスペクトル表現に変換する装置および方法 Expired - Fee Related JP4815436B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004028694A DE102004028694B3 (de) 2004-06-14 2004-06-14 Vorrichtung und Verfahren zum Umsetzen eines Informationssignals in eine Spektraldarstellung mit variabler Auflösung
DE102004028694.9 2004-06-14
PCT/EP2005/004518 WO2005122135A1 (de) 2004-06-14 2005-04-27 Vorrichtung und verfahren zum umsetzen eines informationssignals in eine spektraldarstellung mit variabler auflösung

Publications (2)

Publication Number Publication Date
JP2008502927A JP2008502927A (ja) 2008-01-31
JP4815436B2 true JP4815436B2 (ja) 2011-11-16

Family

ID=34968191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007515797A Expired - Fee Related JP4815436B2 (ja) 2004-06-14 2005-04-27 可変分解能により情報信号をスペクトル表現に変換する装置および方法

Country Status (4)

Country Link
US (1) US8017855B2 (ja)
JP (1) JP4815436B2 (ja)
DE (1) DE102004028694B3 (ja)
WO (1) WO2005122135A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004028693B4 (de) * 2004-06-14 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt
JP4432877B2 (ja) * 2005-11-08 2010-03-17 ソニー株式会社 情報処理システム、および、情報処理方法、情報処理装置、プログラム、並びに、記録媒体
US9123350B2 (en) 2005-12-14 2015-09-01 Panasonic Intellectual Property Management Co., Ltd. Method and system for extracting audio features from an encoded bitstream for audio classification
US9299364B1 (en) 2008-06-18 2016-03-29 Gracenote, Inc. Audio content fingerprinting based on two-dimensional constant Q-factor transform representation and robust audio identification for time-aligned applications
JP5359786B2 (ja) * 2009-10-29 2013-12-04 株式会社Jvcケンウッド 音響信号分析装置、音響信号分析方法、及び音響信号分析プログラム
US10095516B2 (en) 2012-06-29 2018-10-09 Intel Corporation Vector multiplication with accumulation in large register space
US9355068B2 (en) * 2012-06-29 2016-05-31 Intel Corporation Vector multiplication with operand base system conversion and re-conversion
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9337815B1 (en) * 2015-03-10 2016-05-10 Mitsubishi Electric Research Laboratories, Inc. Method for comparing signals using operator invariant embeddings
JP6677069B2 (ja) * 2016-04-28 2020-04-08 株式会社明電舎 定q変換の成分演算装置および定q変換の成分演算方法
JP6627639B2 (ja) * 2016-04-28 2020-01-08 株式会社明電舎 異常診断装置および異常診断方法
KR20180088184A (ko) * 2017-01-26 2018-08-03 삼성전자주식회사 전자 장치 및 그 제어 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02188794A (ja) * 1989-01-18 1990-07-24 Matsushita Electric Ind Co Ltd ピッチ抽出装置
JPH04104617A (ja) * 1990-08-24 1992-04-07 Sony Corp ディジタル信号符号化装置
JPH05216482A (ja) * 1992-01-21 1993-08-27 Victor Co Of Japan Ltd 音響信号の位相予測方法
JPH05346783A (ja) * 1992-06-12 1993-12-27 Casio Comput Co Ltd 音階検出装置
JP2000097759A (ja) * 1998-09-22 2000-04-07 Sony Corp 音場測定装置とその方法および音場解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
JP2003156480A (ja) * 2001-11-20 2003-05-30 Toyo Seikan Kaisha Ltd 周波数解析装置、周波数解析方法、周波数解析プログラム、打検装置及び打検方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2539950C3 (de) 1975-09-09 1981-12-17 Philips Patentverwaltung Gmbh, 2000 Hamburg Bassakkordautomatik
GB1589984A (en) 1976-08-23 1981-05-20 Nippon Musical Instruments Mfg Electronic musical instrument
DE3023578C2 (de) 1980-06-24 1983-08-04 Matth. Hohner Ag, 7218 Trossingen Schaltungsanordnung zum Identifizieren des Akkordtyps und seines Grundtons bei einem chromatisch gestimmten elektronischen Musikinstrument
US4354418A (en) 1980-08-25 1982-10-19 Nuvatec, Inc. Automatic note analyzer
US4633749A (en) * 1984-01-12 1987-01-06 Nippon Gakki Seizo Kabushiki Kaisha Tone signal generation device for an electronic musical instrument
DE3689305T2 (de) * 1985-11-29 1994-04-28 Yamaha Corp Tonsignalsbehandlungsvorrichtung.
DE3725820C1 (ja) 1987-08-04 1988-05-26 Mohrlok, Werner, 7218 Trossingen, De
JP2604410B2 (ja) 1988-02-29 1997-04-30 日本電気ホームエレクトロニクス株式会社 自動採譜方法及び装置
JP2615880B2 (ja) 1988-07-20 1997-06-04 ヤマハ株式会社 和音検出装置
JPH02173799A (ja) 1988-12-27 1990-07-05 Kawai Musical Instr Mfg Co Ltd 音高変更装置
JP2531308B2 (ja) 1991-02-28 1996-09-04 ヤマハ株式会社 電子楽器
JP3307156B2 (ja) 1995-04-24 2002-07-24 ヤマハ株式会社 音楽情報分析装置
US5760325A (en) 1995-06-15 1998-06-02 Yamaha Corporation Chord detection method and apparatus for detecting a chord progression of an input melody
US6111181A (en) * 1997-05-05 2000-08-29 Texas Instruments Incorporated Synthesis of percussion musical instrument sounds
US6057502A (en) 1999-03-30 2000-05-02 Yamaha Corporation Apparatus and method for recognizing musical chords
GR1003625B (el) * 1999-07-08 2001-08-31 Μεθοδος χημικης αποθεσης συνθετων επικαλυψεων αγωγιμων πολυμερων σε επιφανειες κραματων αλουμινιου
US6111183A (en) * 1999-09-07 2000-08-29 Lindemann; Eric Audio signal synthesis system based on probabilistic estimation of time-varying spectra
US6453252B1 (en) * 2000-05-15 2002-09-17 Creative Technology Ltd. Process for identifying audio content
JP4771323B2 (ja) 2001-05-17 2011-09-14 新世代株式会社 音階認識方法、音階認識装置、及び、記録媒体
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
JP2003263155A (ja) 2002-03-08 2003-09-19 Dainippon Printing Co Ltd 周波数解析装置および音響信号の符号化装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02188794A (ja) * 1989-01-18 1990-07-24 Matsushita Electric Ind Co Ltd ピッチ抽出装置
JPH04104617A (ja) * 1990-08-24 1992-04-07 Sony Corp ディジタル信号符号化装置
JPH05216482A (ja) * 1992-01-21 1993-08-27 Victor Co Of Japan Ltd 音響信号の位相予測方法
JPH05346783A (ja) * 1992-06-12 1993-12-27 Casio Comput Co Ltd 音階検出装置
JP2000097759A (ja) * 1998-09-22 2000-04-07 Sony Corp 音場測定装置とその方法および音場解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
JP2003156480A (ja) * 2001-11-20 2003-05-30 Toyo Seikan Kaisha Ltd 周波数解析装置、周波数解析方法、周波数解析プログラム、打検装置及び打検方法

Also Published As

Publication number Publication date
US8017855B2 (en) 2011-09-13
WO2005122135A1 (de) 2005-12-22
US20090100990A1 (en) 2009-04-23
JP2008502927A (ja) 2008-01-31
DE102004028694B3 (de) 2005-12-22

Similar Documents

Publication Publication Date Title
JP4815436B2 (ja) 可変分解能により情報信号をスペクトル表現に変換する装置および方法
Eronen Comparison of features for musical instrument recognition
US7003120B1 (en) Method of modifying harmonic content of a complex waveform
EP1125272B1 (en) Method of modifying harmonic content of a complex waveform
US6297439B1 (en) System and method for automatic music generation using a neural network architecture
JP4207902B2 (ja) 音声合成装置およびプログラム
Klapuri et al. Robust multipitch estimation for the analysis and manipulation of polyphonic musical signals
Kim et al. Neural music synthesis for flexible timbre control
US5808225A (en) Compressing music into a digital format
EP1701336B1 (en) Sound processing apparatus and method, and program therefor
CN112382257B (zh) 一种音频处理方法、装置、设备及介质
Jehan et al. An audio-driven perceptually meaningful timbre synthesizer
Miron et al. Monaural score-informed source separation for classical music using convolutional neural networks
US20210375248A1 (en) Sound signal synthesis method, generative model training method, sound signal synthesis system, and recording medium
WO2017154928A1 (ja) 音信号処理方法および音信号処理装置
JP2012506061A (ja) デジタル音楽音響信号の分析方法
Jensen The timbre model
Lerch Software-based extraction of objective parameters from music performances
WO2005062291A1 (ja) 信号解析方法
CN108369800B (zh) 声处理装置
JP2017161572A (ja) 音信号処理方法および音信号処理装置
Niedermayer et al. On the Importance of" Real" Audio Data for MIR Algorithm Evaluation at the Note-Level-A Comparative Study.
Driedger Processing music signals using audio decomposition techniques
JP7107427B2 (ja) 音信号合成方法、生成モデルの訓練方法、音信号合成システムおよびプログラム
Mina et al. Musical note onset detection based on a spectral sparsity measure

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100602

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110829

R150 Certificate of patent or registration of utility model

Ref document number: 4815436

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees