JP4662407B2 - Frequency analysis method - Google Patents

Frequency analysis method Download PDF

Info

Publication number
JP4662407B2
JP4662407B2 JP2001243179A JP2001243179A JP4662407B2 JP 4662407 B2 JP4662407 B2 JP 4662407B2 JP 2001243179 A JP2001243179 A JP 2001243179A JP 2001243179 A JP2001243179 A JP 2001243179A JP 4662407 B2 JP4662407 B2 JP 4662407B2
Authority
JP
Japan
Prior art keywords
signal
correlation
frequency
fine
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001243179A
Other languages
Japanese (ja)
Other versions
JP2003058149A (en
Inventor
敏雄 茂出木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2001243179A priority Critical patent/JP4662407B2/en
Publication of JP2003058149A publication Critical patent/JP2003058149A/en
Application granted granted Critical
Publication of JP4662407B2 publication Critical patent/JP4662407B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a frequency analyzing method and an encoding method for a sound signal which can accurately extract a signal component even when the signal component is present nearby the border between standard frequencies and further perform high-precision encoding. SOLUTION: A section signal is extracted (S1) by setting a unit section for the sound signal and short-time Fourier transformation is used for the section signal to compute correlation with harmonic signals corresponding to respective frequencies set at fine intervals (S2). After the correlation computation, a fine frequency as a peak is selected (S3), the correlation of only the harmonic signal corresponding to the selected peak frequency with the section signal is found by a generalized harmony analyzing method, and a pair of the found correlation value and the standard frequency which is closest to the corresponding peak frequency are extracted as a frequency component (S4).

Description

【0001】
【産業上の利用分野】
本発明は、放送メディア(ラジオ、テレビ)、通信メディア(CS映像・音声配信、インターネット音楽配信、通信カラオケ)、パッケージメディア(CD、MD、カセット、ビデオ、LD、CD−ROM、ゲームカセット、携帯音楽プレーヤ向け固体メモリ媒体)などで提供する各種オーディオコンテンツの制作、並びに、音楽演奏録音信号から楽譜出版、通信カラオケ配信用MIDIデータ、演奏ガイド機能付き電子楽器向け自動演奏データ、携帯電話・PHS・ポケベルなどの着信メロディデータを自動的に作成する自動採譜技術に関する。
【0002】
【従来の技術】
音響信号に代表される時系列信号には、その構成要素として複数の周期信号が含まれている。このため、与えられた時系列信号にどのような周期信号が含まれているかを解析する手法は、古くから知られている。例えば、フーリエ解析は、与えられた時系列信号に含まれる周波数成分を解析するための方法として広く利用されている。
【0003】
このような時系列信号の解析方法を利用すれば、音響信号を符号化することも可能である。コンピュータの普及により、原音となるアナログ音響信号を所定のサンプリング周波数でサンプリングし、各サンプリング時の信号強度を量子化してデジタルデータとして取り込むことが容易にできるようになってきており、こうして取り込んだデジタルデータに対してフーリエ解析などの手法を適用し、原音信号に含まれていた周波数成分を抽出すれば、各周波数成分を示す符号によって原音信号の符号化が可能になる。
【0004】
また、電子楽器による楽器音を符号化しようという発想から生まれたMIDI(Musical Instrument Digital Interface)規格も、パーソナルコンピュータの普及とともに盛んに利用されるようになってきている。このMIDI規格による符号データ(以下、MIDIデータという)は、基本的には、楽器のどの鍵盤キーを、どの程度の強さで弾いたか、という楽器演奏の操作を記述したデータであり、このMIDIデータ自身には、実際の音の波形は含まれていない。そのため、実際の音を再生する場合には、楽器音の波形を記憶したMIDI音源が別途必要になるが、その符号化効率の高さが注目を集めており、MIDI規格による符号化および復号化の技術は、現在、パーソナルコンピュータを用いて楽器演奏、楽器練習、作曲などを行うソフトウェアに広く採り入れられている。
【0005】
そこで、音響信号に代表される時系列信号に対して、所定の手法で解析を行うことにより、その構成要素となる周期信号を抽出し、抽出した周期信号をMIDIデータを用いて符号化しようとする提案がなされている。例えば、特開平10−247099号公報、特開平11−73199号公報、特開平11−73200号公報、特開平11−95753号公報、特開2000−99009号公報、特開2000−99092号公報、特開2000−99093号公報、特開2000−261322号公報、特開2001−5450号公報、特開2001−148633号公報には、任意の時系列信号について、構成要素となる周波数を解析し、その解析結果からMIDIデータを作成することができる種々の方法が提案されている。
【0006】
上記公報に記載された発明では、音響信号との相関を求める際に、音階で特定される標準周波数より細かい間隔で微細周波数を設定し、この微細周波数に対応した周期関数を用いて行っている。音響信号として再生可能とするためには、標準周波数に対応して符号化する必要があるので、具体的には、相関値が高い微細周波数を求め、その相関値をその微細周波数に最も近い標準周波数の値として符号化している。この際、相関値が高い微細周波数が隣接する標準周波数間の境界付近に存在する場合には、他の信号成分による影響を受けるものと判断し、符号化対象として抽出しない処理を行っている。
【0007】
【発明が解決しようとする課題】
しかしながら、上記のように隣接する標準周波数間の境界付近に相関値の大きい微細周波数が存在した場合に、その微細周波数を抽出しないようにすると、実際に境界部分に信号成分が存在していたとしても削除してしまうことになり、逆にこの微細周波数を抽出するようにすると、他の信号成分による影響であって実際には存在していなくても抽出してしまうことになるという問題が生じている。
【0008】
上記のような点に鑑み、本発明は、標準周波数間の境界付近に信号成分が存在する場合であっても、正確にその信号成分を抽出することができ、さらには、精度の高い符号化を行うことが可能な周波数解析方法および音響信号の符号化方法を提供することを課題とする。
【0009】
【課題を解決するための手段】
上記課題を解決するため、本発明では、時系列信号から所定の標準周波数に対応した信号成分を分離するための周波数解析方法として、前記標準周波数の間隔よりも微細な間隔で複数の微細周波数を設定し、各微細周波数に対応する複数の調和信号集合を準備する調和信号準備段階と、前記各標準周波数に対応する相関値を格納するための主相関配列と、各微細周波数に対応する相関値を格納するための微細相関配列を準備する配列準備段階と、前記時系列信号に所定の長さの単位区間を設定し、区間信号を抽出するための区間信号抽出段階と、前記全ての調和信号と前記区間信号との相関を演算して、各微細周波数に対応する相関値を算出し、前記微細相関配列に算出された相関値を設定する相関演算段階と、前記微細相関配列中の相関配列より周囲の微細周波数における相関値に比べ局所的にピークとなる微細周波数を複数抽出するピーク周波数選出段階と、前記各ピークとなる微細周波数に対応する調和信号と前記区間信号との相関を再度演算し、前記微細周波数の最近傍の標準周波数に対応する主相関配列に設定し、前記再度算出された相関値と調和信号との積で生成される含有信号を前記区間信号から減じ、差分信号を新たに区間信号とすることにより区間信号を更新する処理を抽出された全てのピークに対して順次行って主相関配列の値を決定するスペクトル算出段階を有することを特徴とする。
【0010】
本発明によれば、標準周波数より微細な間隔で微細周波数を設定し、各微細周波数の区間信号に対する相関を求め、相関値が局所的にピークとなっている微細周波数(以下、ピーク周波数という)を複数選出し、選出された複数のピーク周波数と区間信号との相関を一般化調和解析の手法により求め、算出した相関値を対応するピーク周波数に最も近い標準周波数の相関値として、抽出すべき周波数成分を決定するようにしたので、隣接する標準周波数間の境界付近に位置する微細周波数がピークとなる場合であっても、正確に周波数成分を抽出することが可能となる。
【0011】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して詳細に説明する。
【0012】
(1.基本原理)
はじめに、本発明に係る周波数解析方法および音響信号符号化方法の基本原理を述べておく。この基本原理は、前掲の各公報に開示されているので、ここではその概要のみを簡単に述べることにする。
【0013】
図1(a)に示すように、時系列信号としてアナログ音響信号が与えられたものとする。図1の例では、横軸に時間t、縦軸に振幅(強度)をとって、この音響信号を示している。ここでは、まずこのアナログ音響信号を、デジタルの音響データとして取り込む処理を行う。これは、従来の一般的なPCMの手法を用い、所定のサンプリング周波数でこのアナログ音響信号をサンプリングし、振幅を所定の量子化ビット数を用いてデジタルデータに変換する処理を行えば良い。ここでは、説明の便宜上、PCMの手法でデジタル化した音響データの波形も図1(a)のアナログ音響信号と同一の波形で示すことにする。
【0014】
続いて、この解析対象となる音響信号の時間軸上に、複数の単位区間を設定する。図1(a)に示す例では、時間軸t上に等間隔に6つの時刻t1〜t6が定義され、これら各時刻を始点および終点とする5つの単位区間d1〜d5が設定されている。図1の例では、全て同一の区間長をもった単位区間が時間軸上で重複せずに設定されているが、隣接する単位区間が時間軸上で部分的に重なり合うような区間設定を行ってもかまわない。
【0015】
こうして単位区間が設定されたら、各単位区間ごとの音響信号(以下、区間信号と呼ぶことにする)について、それぞれ代表周波数を選出する。各区間信号には、通常、様々な周波数成分が含まれているが、例えば、その中で成分の強度割合の大きな周波数成分を代表周波数として選出すれば良い。ここで、代表周波数とはいわゆる基本周波数が一般的であるが、音声のフォルマント周波数などの倍音周波数や、ノイズ音源のピーク周波数も代表周波数として扱うことがある。代表周波数は1つだけ選出しても良いが、音響信号によっては複数の代表周波数を選出した方が、より精度の高い符号化が可能になる。図1(b)には、個々の単位区間ごとにそれぞれ3つの代表周波数を選出し、1つの代表周波数を1つの代表符号(図では便宜上、音符として示してある)として符号化した例が示されている。ここでは、代表符号(音符)を収容するために3つのトラックT1,T2,T3が設けられているが、これは個々の単位区間ごとに選出された3つずつの代表符号を、それぞれ異なるトラックに収容するためである。
【0016】
例えば、単位区間d1について選出された代表符号n(d1,1),n(d1,2),n(d1,3)は、それぞれトラックT1,T2,T3に収容されている。ここで、各符号n(d1,1),n(d1,2),n(d1,3)は、MIDI符号におけるノートナンバーを示す符号である。MIDI符号におけるノートナンバーは、0〜127までの128通りの値をとり、それぞれピアノの鍵盤の1つのキーを示すことになる。具体的には、例えば、代表周波数として440Hzが選出された場合、この周波数はノートナンバーn=69(ピアノの鍵盤中央の「ラ音(A3音)」に対応)に相当するので、代表符号としては、n=69が選出されることになる。もっとも、図1(b)は、上述の方法によって得られる代表符号を音符の形式で示した概念図であり、実際には、各音符にはそれぞれ強度に関するデータも付加されている。例えば、トラックT1には、ノートナンバーn(d1,1),n(d2,1)・・・なる音高を示すデータとともに、e(d1,1),e(d2,1)・・・なる強度を示すデータが収容されることになる。この強度を示すデータは、各代表周波数の成分が、元の区間信号にどの程度の度合いで含まれていたかによって決定される。具体的には、各代表周波数をもった周期関数の区間信号に対する相関値に基づいて強度を示すデータが決定されることになる。また、図1(b)に示す概念図では、音符の横方向の位置によって、個々の単位区間の時間軸上での位置が示されているが、実際には、この時間軸上での位置を正確に数値として示すデータが各音符に付加されていることになる。
【0017】
音響信号を符号化する形式としては、必ずしもMIDI形式を採用する必要はないが、この種の符号化形式としてはMIDI形式が最も普及しているため、実用上はMIDI形式の符号データを用いるのが好ましい。MIDI形式では、「ノートオン」データもしくは「ノートオフ」データが、「デルタタイム」データを介在させながら存在する。「ノートオン」データは、特定のノートナンバーNとベロシティーVを指定して特定の音の演奏開始を指示するデータであり、「ノートオフ」データは、特定のノートナンバーNとベロシティーVを指定して特定の音の演奏終了を指示するデータである。また、「デルタタイム」データは、所定の時間間隔を示すデータである。ベロシティーVは、例えば、ピアノの鍵盤などを押し下げる速度(ノートオン時のベロシティー)および鍵盤から指を離す速度(ノートオフ時のベロシティー)を示すパラメータであり、特定の音の演奏開始操作もしくは演奏終了操作の強さを示すことになる。
【0018】
前述の方法では、第i番目の単位区間diについて、代表符号としてJ個のノートナンバーn(di,1),n(di,2),・・・,n(di,J)が得られ、このそれぞれについて強度e(di,1),e(di,2),・・・,e(di,J)が得られる。そこで、次のような手法により、MIDI形式の符号データを作成することができる。まず、「ノートオン」データもしくは「ノートオフ」データの中で記述するノートナンバーNとしては、得られたノートナンバーn(di,1),n(di,2),・・・,n(di,J)をそのまま用いれば良い。一方、「ノートオン」データもしくは「ノートオフ」データの中で記述するベロシティーVとしては、得られた強度e(di,1),e(di,2),・・・,e(di,J)を所定の方法で規格化した値を用いれば良い。また、「デルタタイム」データは、各単位区間の長さに応じて設定すれば良い。
【0019】
(2.1.周期関数との相関を求める具体的な方法)
上述した基本原理の基づく方法では、区間信号に対して、1つまたは複数の代表周波数が選出され、この代表周波数をもった周期信号によって、当該区間信号が表現されることになる。ここで、選出される代表周波数は、文字どおり、当該単位区間内の信号成分を代表する周波数である。この代表周波数を選出する具体的な方法には、後述するように、短時間フーリエ変換を利用する方法と、一般化調和解析の手法を利用する方法とがある。いずれの方法も、基本的な考え方は同じであり、あらかじめ周波数の異なる複数の周期関数を用意しておき、これら複数の周期関数の中から、当該単位区間内の区間信号に対する相関が高い周期関数を見つけ出し、この相関の高い周期関数の周波数を代表周波数として選出する、という手法を採ることになる。すなわち、代表周波数を選出する際には、あらかじめ用意された複数の周期関数と、単位区間内の区間信号との相関を求める演算を行うことになる。そこで、ここでは、周期関数との相関を求める具体的な方法を述べておく。
【0020】
複数の周期関数として、図2に示すような三角関数が用意されているものとする。これらの三角関数は、同一周波数をもった正弦関数と余弦関数との対から構成されており、128通りの標準周波数f(0)〜f(127)のそれぞれについて、正弦関数および余弦関数の対が定義されていることになる。ここでは、同一の周波数をもった正弦関数および余弦関数からなる一対の関数を、当該周波数についての周期関数として定義することにする。すなわち、ある特定の周波数についての周期関数は、一対の正弦関数および余弦関数によって構成されることになる。このように、一対の正弦関数と余弦関数とにより周期関数を定義するのは、信号に対する周期関数の相関値を求める際に、相関値が位相の影響を受ける事を考慮するためである。なお、図2に示す各三角関数内の変数Fおよびkは、区間信号Xについてのサンプリング周波数Fおよびサンプル番号kに相当する変数である。例えば、周波数f(0)についての正弦波は、sin(2πf(0)k/F)で示され、任意のサンプル番号kを与えると、区間信号を構成する第k番目のサンプルと同一時間位置における周期関数の振幅値が得られる。
【0021】
ここでは、128通りの標準周波数f(0)〜f(127)を図3に示すような式で定義した例を示すことにする。すなわち、第n番目(0≦n≦127)の標準周波数f(n)は、以下に示す〔数式1〕で定義されることになる。
【0022】
〔数式1〕
f(n)=440×2γ (n)
γ(n)=(n−69)/12
【0023】
このような式によって標準周波数を定義しておくと、最終的にMIDIデータを用いた符号化を行う際に便利である。なぜなら、このような定義によって設定される128通りの標準周波数f(0)〜f(127)は、等比級数をなす周波数値をとることになり、MIDIデータで利用されるノートナンバーに対応した周波数になるからである。したがって、図2に示す128通りの標準周波数f(0)〜f(127)は、対数尺度で示した周波数軸上に等間隔(MIDIにおける半音単位)に設定した周波数ということになる。
【0024】
続いて、任意の区間の区間信号に対する各周期関数の相関の求め方について、具体的な説明を行う。例えば、図4に示すように、ある単位区間dについて区間信号Xが与えられていたとする。ここでは、区間長Lをもった単位区間dについて、サンプリング周波数Fでサンプリングが行なわれており、全部でw個のサンプル値が得られているものとし、サンプル番号を図示のように、0,1,2,3,・・・,k,・・・,w−2,w−1とする(白丸で示す第w番目のサンプルは、右に隣接する次の単位区間の先頭に含まれるサンプルとする)。この場合、任意のサンプル番号kについては、X(k)なる振幅値がデジタルデータとして与えられていることになる。短時間フーリエ変換においては、X(k)に対して各サンプルごとに中央の重みが1に近く、両端の重みが0に近くなるような窓関数W(k)を乗ずることが通常である。すなわち、X(k)×W(k)をX(k)と扱って以下のような相関計算を行うもので、窓関数の形状としては余弦波形状のハミング窓が一般に用いられている。ここで、wは以下の記述においても定数のような記載をしているが、一般にはnの値に応じて変化させ、区間長Lを超えない範囲で最大となるF/f(n)の整数倍の値に設定することが望ましい。
【0025】
このような区間信号Xに対して、第n番目の標準周波数f(n)をもった正弦関数Rnとの相関値を求める原理を示す。両者の相関値A(n)は、図5の第1の演算式によって定義することができる。ここで、X(k)は、図4に示すように、区間信号Xにおけるサンプル番号kの振幅値であり、sin(2πf(n)k/F)は、時間軸上での同位置における正弦関数Rnの振幅値である。この第1の演算式は、単位区間d内の全サンプル番号k=0〜w−1の次元について、それぞれ区間信号Xの振幅値と正弦関数Rnの振幅ベクトルの内積を求める式ということができる。
【0026】
同様に、図5の第2の演算式は、区間信号Xと、第n番目の標準周波数f(n)をもった余弦関数との相関値を求める式であり、両者の相関値はB(n)で与えられる。なお、相関値A(n)を求めるための第1の演算式も、相関値B(n)を求めるための第2の演算式も、最終的に2/wが乗ぜられているが、これは相関値を規格化するためのものでり、前述のとおりwはnに依存して変化させるのが一般的であるため、この係数もnに依存する変数である。
【0027】
区間信号Xと標準周波数f(n)をもった標準周期関数との相関実効値は、図5の第3の演算式に示すように、正弦関数との相関値A(n)と余弦関数との相関値B(n)との二乗和平方根値E(n)によって示すことができる。この相関実効値の大きな標準周期関数の周波数を代表周波数として選出すれば、この代表周波数を用いて区間信号Xを符号化することができる。
【0028】
すなわち、この相関値E(n)が所定の基準以上の大きさとなる1つまたは複数の標準周波数を代表周波数として選出すれば良い。なお、ここで「相関値E(n)が所定の基準以上の大きさとなる」という選出条件は、例えば、何らかの閾値を設定しておき、相関値E(n)がこの閾値を超えるような標準周波数f(n)をすべて代表周波数として選出する、という絶対的な選出条件を設定しても良いが、例えば、相関値E(n)の大きさの順にQ番目までを選出する、というような相対的な選出条件を設定しても良い。
【0029】
(2.2.一般化調和解析の手法)
ここでは、本発明に係る音響信号の符号化を行う際に有用な一般化調和解析の手法について説明する。既に説明したように、音響信号を符号化する場合、個々の単位区間内の区間信号について、相関値の高いいくつかの代表周波数を選出することになる。一般化調和解析は、より高い精度で代表周波数の選出を可能にする手法であり、その基本原理は次の通りである。
【0030】
図6(a)に示すような単位区間dについて、信号S(j)なるものが存在するとする。ここで、jは後述するように、繰り返し処理のためのパラメータである(j=1〜J)。まず、この信号S(j)に対して、図2に示すような128通りの周期関数すべてについての相関値を求める。そして、最大の相関値が得られた1つの周期関数の周波数を代表周波数として選出し、当該代表周波数をもった周期関数を要素関数として抽出する。続いて、図6(b)に示すような含有信号G(j)を定義する。この含有信号G(j)は、抽出された要素関数に、その振幅として、当該要素関数の信号S(j)に対する相関値を乗じることにより得られる信号である。例えば、周期関数として図2に示すように、一対の正弦関数と余弦関数とを用い、周波数f(n)が代表周波数として選出された場合、振幅A(n)をもった正弦関数A(n)sin(2πf(n)k/F)と、振幅B(n)をもった余弦関数B(n)cos(2πf(n)k/F)との和からなる信号が含有信号G(j)ということになる(図6(b)では、図示の便宜上、一方の関数しか示していない)。ここで、A(n),B(n)は、図5の式で得られる規格化された相関値であるから、結局、含有信号G(j)は、信号S(j)内に含まれている周波数f(n)をもった信号成分ということができる。
【0031】
こうして、含有信号G(j)が求まったら、信号S(j)から含有信号G(j)を減じることにより、差分信号S(j+1)を求める。図6(c)は、このようにして求まった差分信号S(j+1)を示している。この差分信号S(j+1)は、もとの信号S(j)の中から、周波数f(n)をもった信号成分を取り去った残りの信号成分からなる信号ということができる。そこで、パラメータjを1だけ増加させることにより、この差分信号S(j+1)を新たな信号S(j)として取り扱い、同様の処理を、パラメータjをj=1〜Jまで1ずつ増やしながらJ回繰り返し実行すれば、J個の代表周波数を選出することができる。
【0032】
このような相関計算の結果として出力されるJ個の含有信号G(1)〜G(J)は、もとの区間信号Xの構成要素となる信号であり、もとの区間信号Xを符号化する場合には、これらJ個の含有信号の周波数を示す情報および振幅(強度)を示す情報を符号データとして用いるようにすれば良い。尚、Jは代表周波数の個数であると説明してきたが、標準周波数f(n)の個数と同一すなわちJ=128であってもよく、周波数スペクトルを求める目的においてはそのように行うのが通例である。
【0033】
以上のような処理により、各単位区間について、各周波数に対する強度値の集合である周波数群が得られることになる。このようにして所定数の周波数群が選出されたら、この周波数群の各周波数に対応する「音の高さを示す情報」、選出された各周波数の信号強度に対応する「音の強さを示す情報」、当該単位区間の始点に対応する「音の発音開始時刻を示す情報」、当該単位区間に後続する単位区間の始点に対応する「音の発音終了時刻を示す情報」、の4つの情報を含む所定数の符号データを作成すれば、当該単位区間内の区間信号Xを所定数の符号データにより符号化することができる。符号データとして、MIDIデータを作成するのであれば、「音の高さを示す情報」としてノートナンバーを用い、「音の強さを示す情報」としてベロシティーを用い、「音の発音開始時刻を示す情報」としてノートオン時刻を用い、「音の発音終了時刻を示す情報」としてノートオフ時刻を用いるようにすれば良い。
【0034】
(3.1.本発明に係る周波数解析方法および音響信号の符号化方法)
以下、本発明に係る周波数解析方法および音響信号の符号化方法について説明していく。上述のように、従来の手法では、微細周波数に対する相関値を求め、各標準周波数の範囲において、最大の相関値を当該標準周波数の相関値としている。例えば、原音響信号のスペクトルが図7(a)に示すような状態となるものを考えてみる。なお、図7において、横軸は周波数、縦軸は強度値もしくは相関値である。図7(a)においては、ノートナンバーnの範囲(標準周波数f(n)の範囲)に含まれる音と、ノートナンバーn+1の範囲に含まれる音が発せられていることになる。これを短時間フーリエ変換の手法により、各微細周波数についての相関を求めると、図7(b)に示すようになる。図7(b)においては、各標準周波数間を13に分割した間隔で微細周波数が設定されている。従来の符号化では、ここで各ノートナンバーの範囲内において、最大の相関値となるものを抽出する。この際、各ノートナンバーの範囲において、境界部分に存在するものは、他の信号成分の影響であるとみなして抽出しないようにしている。そのため、図7(c)に示すようにノートナンバーnからは最大の相関値が抽出されるが、ノートナンバーn+1からは抽出されないことになる。
【0035】
これに対して本発明では、各ノートナンバーの範囲において最大の相関値を抽出するのではなく、ピークとなる相関値を抽出するようにする。ピークとなる相関値とは、自身の両側の微細周波数の相関値が自身よりも小さくなっているものをいう。ピークとなる相関値を抽出した場合には、それ自身がピークであるために他の信号成分の影響を受けているということは考えにくい。そのため、ノートナンバーの範囲の境界部分に存在していても抽出するものとする。したがって、図7(b)に示したような相関値の集合から図7(d)に示すような信号成分が抽出されることになる。
【0036】
また、2つ目の例として図8に示すようなものを考えてみる。図8(a)に示すような2つの音が発せられたとすると、短時間フーリエ変換の手法により、図8(b)に示すような各微細周波数に対応する相関値が得られる。従来の手法では、図8(c)に示すように、ノートナンバーnからは抽出されるが、ノートナンバーn+1からは抽出されないということになるが、本発明によれば、図8(d)に示すようにそれぞれのノートナンバーに対応した周波数成分が抽出されることになる。
【0037】
続いて、本発明の周波数解析方法について、音響信号を符号化する場合を例にとって、図9に示すフローチャートを用いて説明する。まず、時系列の音響信号に対して単位区間を設定して区間信号の抽出を行う(ステップS1)。これは、上記(基本原理)の項において、図1を用いて説明したように、所定の長さの単位区間が設定され、抽出が行われる。
【0038】
次に、抽出された区間信号とあらかじめ準備された調和信号との相関を算出する(ステップS2)。この調和信号とは、上記(周期関数との相関を求める具体的な方法)の項で説明した周期関数と同じものである。ただし、図2の例では、ノートナンバーに対応した128個の標準周波数を設定したが、本発明では、各標準周波数間に等比級数の間隔で12個の微細周波数を設定し、全部で128×13個の調和信号を用意する。例えば、隣接する標準周波数f(n)とf(n+1)間では、f(n+1/13)〜f(n+12/13)の12個の微細周波数が設定されることになる。このステップS2においては、区間信号と128×13個の調和信号との相関を短時間フーリエ変換の手法により求める。この結果、128×13個の各微細周波数に対応する相関値が得られる。この相関値は、あらかじめ準備された微細相関配列に格納される。
【0039】
続いて、算出された相関値に基づいてピークとなる微細周波数(以下、ピーク周波数という)を選出する(ステップS3)。具体的には、算出された128×13個の相関値を基に、隣接する両側の微細周波数の相関値よりも、自身の相関値が大きくなっている微細周波数を選出する。
【0040】
次に、選出された各ピーク周波数に対応する調和信号と、区間信号との相関を一般化調和解析の手法により求める(ステップS4)。具体的には、上記(一般化調和解析の手法)の項で説明したのと同様に、まず、選出されたピーク周波数のうち、相関値が最大のものに対応する調和信号と区間信号S(1)(=X)との相関を求める。続いて、このときの調和信号に、その振幅として算出された相関値を乗じることにより得られる信号を含有信号G(1)とし、この含有信号G(1)を区間信号S(1)から減じることにより差分信号S(2)を得る。次に、ステップS3において選出されたピーク周波数のうち、区間信号Xとの相関値が2番目に大きいピーク周波数の調和信号と、差分信号S(2)との相関を求め、含有信号G(2)を区間信号から減じることにより差分信号S(3)を得る。このようにして、一般化調和解析の手法により、選出された全てのピーク周波数の相関値を求めていく。このピーク周波数は、微細周波数に対応しているため、符号化の際には、ノートナンバーに対応した標準周波数に戻す必要がある。そのため、算出された相関値を、ピーク周波数に最も近い標準周波数に対応する相関値として、主相関配列に設定する。これにより、標準周波数とその相関値の組が複数得られることになり、この標準周波数をノートナンバーとし、相関値をベロシティとすることにより、MIDI規格の符号化データが得られる。
【0041】
以上の処理を全単位区間により行うことにより、音響信号全体の符号化が可能となる。なお、単位区間については、図1に示したように、前の単位区間の終了時刻と後の単位区間の開始時刻が同一となるように設定されるのは、まれであり、前の単位区間と後の単位区間が重なるように設定されることの方が多い。
【0042】
(3.2.抽出周波数成分決定の2段階処理)
上記ステップS3・S4においては、1回だけピーク周波数を選出し、選出された各ピーク周波数について一般化調和解析の手法により相関値を算出したが、同様の処理を再度行うことにより解析精度および符号化精度を高めることができる。このような場合について、以下説明する。上記ステップS4のように区間信号Xから含有信号を減じる処理を繰り返し行っていくことにより、異なった区間信号X’が得られることになる。この区間信号X’に対してステップS2〜ステップS4の処理を繰り返す。
【0043】
区間信号X’と相関をとる微細周波数としては、既に主相関配列に相関値が格納された標準周波数に該当するものは除かれる。例えば、標準周波数f(n)に対応する相関値が主相関配列に設定されている場合には、微細周波数f(n−6/13)〜f(n+6/13)は、区間信号X’との相関算出の対象から外される。残った微細周波数に対応する調和信号と区間信号X’との相関を短時間フーリエ変換の手法により求められ、算出された相関値は微細相関配列に格納される。
【0044】
続いて、ステップS3において、算出された相関値に基づいて再びピーク周波数を選出した後、ステップS4において、選出された各ピーク周波数と区間信号X’との相関を求めた後、算出された相関値を主相関配列に設定する。
【0045】
ステップS2〜ステップS4の処理は、何回でも繰り返すことが可能であるが、音響信号の符号化処理を行う場合には、2回程度で十分である。2回行うと、MIDI規格で同時発音可能な64音程度は抽出できるためである。
【0046】
(3.3.同一標準周波数内における抽出周波数成分の決定)
上記ステップS4における標準周波数の決定および相関値の算出は、ピーク周波数の近傍にある標準周波数を、算出された相関値に対応するものとして決定した。これは、1つの標準周波数の範囲に含まれるピーク周波数が1つだけである場合には問題ないが、1つの標準周波数の範囲に含まれるピーク周波数が複数ある場合には、そのどちらを選ぶかが問題となる。そのため、後者の場合には、1つの標準周波数に含まれるピーク周波数のうち、短時間フーリエ変換による相関値が最大のものだけをピーク周波数として選出し、一般化調和解析の手法により区間信号Xとの相関を求めるようにする。
【0047】
(3.4.区間更新幅の決定処理)
以上のような周波数成分の抽出処理および抽出した周波数成分の符号化は各単位区間ごとに行われるが、上述のように単位区間の設定は固定ではなく、状況に応じて変更することが可能である。このとき、1つの単位区間の長さをどのように設定するかは、解析結果に大きな影響を与える重要な問題である。すなわち、区間長を短く設定すればするほど、時間分解能が向上するため、音声信号(ボーカル信号)などの周波数変化を解析するには好都合であるが、逆に、周波数分解能は低下するため、解析精度は低下するという問題が生じることになる。そこで従来は、1つの単位区間の中に、解析に最も都合が良いと思われるサンプル数(例えば、1024サンプル)が含まれるように、標準的な区間長をあらかじめ定めておき、この固定の区間長に基づいて時間軸を機械的に区切ってゆくという方法を採るのが一般的であった。
【0048】
しかしながら、固定長の単位区間を機械的に設定するという方法では、解析対象となる時系列信号がどのような信号であるかに関わらず、常に一義的な区間設定が行われることになるため、単位区間の境界部分において不連続性が生じるおそれがある。すなわち、隣接する単位区間についての周波数解析の結果に大きな差が生じてしまうことがある。一般に、得られた周波数解析の結果を、スペクトルのグラフとして観察するために利用するような場合には、単位区間の境界において解析結果に差が生じていても、大きな問題にはならない。ところが、音響信号に対する解析結果を利用して、原音響信号に対応する符号データを作成するような場合、境界部分における不連続性は大きな問題となる。このような方法で符号化されたデータに基づいて、原音響信号を再生しようとすると、単位区間の境界において、音程の急激な変動が生じたり、音とびが生じたりすることになる。
【0049】
このような境界における不連続性を避けるために、時間軸上において単位区間を部分的に重複させて設定する方法も提案されているが、この場合も重複させる量が固定であるため、本来重複させる必要のない箇所まで重複して処理することになり、無駄な演算処理が増加するという問題が生じることになる。本発明では、時系列信号を解析する際に、単位区間の境界において、音の連続性を保つと共に、単位区間の重複を最小限に抑えるようにした単位区間の設定についても工夫を行っているので、以下に説明する。
【0050】
特に本発明においては、上記ステップS2における短時間フーリエ変換により得られた相関値を利用することにより単位区間の設定を行うようにしたことを特徴としている。具体的には、ある単位区間において周波数成分の抽出を行う際に、ステップS2において最初に得られる微細相関配列の値を、区間決定のために用いる直前相関配列にコピーしておく。そして、ステップS2〜ステップS4の処理を所定の回数だけ行って、1つの単位区間において抽出すべき周波数成分を決定した後、次の単位区間の位置を設定する。本発明においては、単位区間は固定長であるため、単位区間の開始位置が定まれば、単位区間が決定する。従って本発明においては、前の単位区間の開始位置から後の単位区間の開始位置までの送り幅を定めることにより、後の単位区間が決定されることになる。
【0051】
まず、既に確定している前の単位区間と、これから位置を決定する単位区間の類似度を求める(ステップS6)。具体的には、ピーク周波数選出のために、ステップS2で行った短時間フーリエ変換の結果得られた微細相関配列の値を利用して以下の〔数式2〕により算出する。
【0052】
〔数式2〕
SM=100−100×[Σk{Sdn-1(k)−Sdn(k)}21/2 /{ΣkSdn-1(k) 21/2
【0053】
上記〔数式2〕において、Sdn(k)は、決定しようとしている単位区間dnの区間信号に対する微細周波数kの相関値であり、Sdn-1(k)は、直前の単位区間dn-1の区間信号に対する微細周波数kの相関値である。ただし、kは周波数そのものを示すものではなく、ノートナンバーnに対応する標準周波数を13分割した値で表現され、k=−6 〜 127×13+6の値をとる。類似度SMの値が大きい程両区間信号は類似していることになる。
【0054】
次に、この類似度SMの値と閾値を比較する。類似度SMが閾値2より小さい場合は(ステップS7)、設定されている送り幅を半分にする(ステップS8)。送り幅を半分にした位置に仮単位区間の設定をし直し(ステップS1)、新たな仮単位区間の区間信号と調和信号との相関を求める(ステップS2)。ステップS1、S2およびステップS6〜S8の処理は、類似度SMが閾値2以上となるまで繰り返される。すなわち、閾値2以上となるまで、後の単位区間を前の単位区間と重複させる範囲を大きくしていくことになる。
【0055】
類似度SMが閾値2以上となったら、類似度SMと閾値1との比較を行う。類似度が閾値1未満である場合は、仮単位区間を単位区間として確定し、ピーク位置の選出処理へ進む(ステップS3)。類似度が閾値1以上である場合は、送り幅を2倍に設定する(ステップS10)と共に、仮単位区間を単位区間として確定し、ピーク位置の選出処理へ進む(ステップS3)。ここで、2倍に変更された送り幅は、次の単位区間の送り幅として利用されることになる。単位区間の確定後は、ステップS3、S4の処理は同様に行われ、抽出周波数成分が決定される。なお、当然のことながら、上記2つの閾値は、閾値1>閾値2の関係を満たすものとなっている。
【0056】
単位区間についての抽出周波数が決定したら、この時点で設定されている送り幅だけ移動した位置を開始位置として(ステップS5)、仮単位区間を設定する(ステップS1)。このとき、通常はあらかじめ設定されている標準送り幅が利用され、ステップS10により送り幅が2倍に設定されている場合には、標準送り幅の2倍を送り幅とする。
【0057】
ここで、設定される単位区間を、図10に示す具体的な例を用いて説明する。
図10(a)は、時系列の音響信号を示す図である。図10(b)に示すように音響信号の先頭位置から固定長の単位区間d1が設定され、ステップS2からステップS4の処理が行われることにより、抽出周波数が決定される。次の単位区間d2の設定にあたっては、ステップS5において、あらかじめ設定されている標準送り幅だけ後に送られて仮設定される。本実施形態では、標準送り幅を固定長dの1/2としている。よって、単位区間d1の先頭からd/2だけずれた位置が単位区間d2の先頭となるように単位区間d2が仮設定される。このとき仮設定された単位区間d2の状態を図10(c)に示す。
【0058】
そして、ステップS1において、仮設定された単位区間d2の位置の音響信号を区間信号として抽出し、この区間信号との相関をステップS2の手法により求める。続いてステップS6において上記〔数式2〕に示した類似度を算出する。算出した類似度が閾値2未満である場合、すなわち、両区間信号があまり似ていない場合は、ステップS8に進んで送り幅が1/2にされる。ここでは、d/2に設定されているので、d/4に設定されるということになる。この場合、ステップS1に戻って、単位区間d1の先頭からd/4だけずれた位置が単位区間d2の先頭となるように単位区間d2が仮設定し直される。このとき仮設定された単位区間d2の状態を図10(d)に示す。単位区間d2が仮設定し直されると、再びステップS2、ステップS6の処理が繰り返される。さらに、ステップS7において、類似度が閾値2未満である場合は、ステップS8において送り幅がd/8に設定され、ステップS1に戻って単位区間d1の先頭からd/8だけずれた位置が単位区間d2の先頭となるように単位区間d2が仮設定し直される。
このとき仮設定された単位区間d2の状態を図10(e)に示す。
【0059】
すなわち、図10(c)〜図10(e)に示すように、先行する単位区間d1と後続の単位区間d2における区間信号の類似度が閾値2以上となるまで、単位区間d2は単位区間d1との重複区間を増やしていくことになる。ただし、このままだと、単位区間d1と単位区間d2が果てしなく近付いてしまう可能性があるので、送り幅の最小距離をあらかじめ設定しておき、送り幅が最小距離以下となった場合は、その時点で仮設定されている単位区間を正式な単位区間として確定し、ステップS3の処理に進むようにする。
【0060】
一方、単位区間d1の区間信号と、仮設定された単位区間d2の区間信号の類似度が閾値2以上で閾値1未満となった場合には、仮設定されている単位区間d2を確定して、ステップS3以降の処理を行う。また、類似度が閾値1以上となった場合も、仮設定されている単位区間d2が確定されて、ステップS3以降の処理が行われることになるが、この場合、送り幅を2倍に設定する処理も平行して行う。そして、単位区間d2についての抽出周波数成分が決定された後、ステップS5において、単位区間の先頭から2倍に設定された送り幅だけ移動した位置を単位区間d3の先頭位置とする。例えば、単位区間d2が図10(c)に示すような位置で確定された場合、単位区間d3は、図10(f)に示す位置に仮設定されることになる。
【0061】
以上、本発明の好適な実施形態について説明したが、上記周波数解析方法および符号化方法は、コンピュータ等で実行されることは当然である。具体的には、図9のフローチャートに示したようなステップを上記手順で実行するためのプログラムをコンピュータに搭載しておく。そして、音響信号等の時系列信号をPCM方式等でデジタル化した後、コンピュータに取り込み、ステップS1〜ステップS10の処理を行った後、抽出した周波数成分もしくはMIDI形式等の符号データをデジタルデータとしてコンピュータより出力する。出力された符号データは、例えば、MIDIデータの場合、MIDIシーケンサ、MIDI音源を用いて音声として再生される。
【0062】
【発明の効果】
以上、説明したように本発明によれば、時系列信号から所定の標準周波数に対応した信号成分を分離するための周波数解析方法として、前記時系列信号に所定の長さの単位区間を設定して区間信号を抽出し、前記全ての調和信号と前記区間信号との相関を演算して各微細周波数に対応する相関値を算出し、前記算出された相関値に対応する微細周波数のうち、周囲の微細周波数における相関値に比べ局所的にピークとなる微細周波数を複数抽出するピーク周波数選出段階と、前記各ピークとなる微細周波数に対応する調和信号と前記区間信号との相関を再度演算し、前記微細周波数の最近傍の標準周波数に対応する相関値として設定し、前記再度算出された相関値と調和信号との積で生成される含有信号を前記区間信号から減じ、差分信号を新たに区間信号とすることにより区間信号を更新する処理を抽出された全てのピークに対して順次行って標準周波数に対応する相関値を決定するようにしたので、隣接する標準周波数間の境界付近に位置する微細周波数がピークとなる場合であっても、正確に周波数成分を抽出することが可能となるという効果を奏する。さらに、抽出された周波数成分をMIDI等の形式に符号化することにより、原音響信号を忠実に再現することが可能な符号データの作成が可能となる。
【図面の簡単な説明】
【図1】本発明に係る周波数解析方法および音響信号符号化方法の基本原理を示す図である。
【図2】本発明で利用される周期関数の一例を示す図である。
【図3】図2に示す各周期関数の周波数とMIDIノートナンバーnとの関係式を示す図である。
【図4】解析対象となる信号と周期信号との相関計算の手法を示す図である。
【図5】図4に示す相関計算を行うための計算式を示す図である。
【図6】一般化調和解析の基本的な手法を示す図である。
【図7】周波数成分の選出に関して従来との比較を示す第1の例を示す図である。
【図8】周波数成分の選出に関して従来との比較を示す第2の例を示す図である。
【図9】本発明に係る周波数解析方法および音響信号符号化方法のフローチャートである。
【図10】単位区間の設定手順を示す図である。
【符号の説明】
d1〜d5・・・単位区間
d・・・単位区間長
X・・・初期区間信号
[0001]
[Industrial application fields]
The present invention includes broadcast media (radio, television), communication media (CS video / audio distribution, Internet music distribution, communication karaoke), package media (CD, MD, cassette, video, LD, CD-ROM, game cassette, mobile phone). Production of various audio contents provided by a solid-state memory medium for music players, etc., music publishing from musical performance recording signals, MIDI data for online karaoke distribution, automatic performance data for electronic musical instruments with performance guide functions, mobile phones, PHS, The present invention relates to an automatic music recording technique for automatically generating incoming melody data such as a pager.
[0002]
[Prior art]
A time-series signal represented by an acoustic signal includes a plurality of periodic signals as its constituent elements. For this reason, a method for analyzing what kind of periodic signal is included in a given time-series signal has been known for a long time. For example, Fourier analysis is widely used as a method for analyzing frequency components included in a given time series signal.
[0003]
By using such a time-series signal analysis method, an acoustic signal can be encoded. With the spread of computers, it has become easy to sample an analog audio signal as the original sound at a predetermined sampling frequency, quantize the signal intensity at each sampling, and capture it as digital data. If a method such as Fourier analysis is applied to the data and the frequency components included in the original sound signal are extracted, the original sound signal can be encoded by a code indicating each frequency component.
[0004]
In addition, the MIDI (Musical Instrument Digital Interface) standard born from the idea of encoding musical instrument sounds by electronic musical instruments has come to be actively used with the spread of personal computers. The code data according to the MIDI standard (hereinafter referred to as MIDI data) is basically data that describes the operation of the musical instrument performance such as which keyboard key of the instrument is played with what strength. The data itself does not include the actual sound waveform. Therefore, when reproducing the actual sound, a MIDI sound source storing the waveform of the instrument sound is separately required. However, its high encoding efficiency is attracting attention, and encoding and decoding according to the MIDI standard are being attracted attention. This technology is now widely used in software that uses a personal computer to perform musical instrument performance, practice and compose music.
[0005]
Therefore, by analyzing a time-series signal represented by an acoustic signal by a predetermined method, a periodic signal as a constituent element is extracted, and the extracted periodic signal is encoded using MIDI data. Proposals have been made. For example, JP-A-10-247099, JP-A-11-73199, JP-A-11-73200, JP-A-11-95753, JP-A-2000-99009, JP-A-2000-99092, JP-A-2000-99093, JP-A-2000-261322, JP-A-2001-5450, and JP-A-2001-148633 analyze the frequency as a component of an arbitrary time-series signal, Various methods for creating MIDI data from the analysis results have been proposed.
[0006]
In the invention described in the above publication, when a correlation with an acoustic signal is obtained, a fine frequency is set at an interval finer than a standard frequency specified by a musical scale, and a periodic function corresponding to the fine frequency is used. . In order to be reproducible as an acoustic signal, it is necessary to encode in accordance with a standard frequency. Specifically, a fine frequency having a high correlation value is obtained, and the correlation value is a standard closest to the fine frequency. It is encoded as a frequency value. At this time, if a fine frequency having a high correlation value is present near the boundary between adjacent standard frequencies, it is determined that the signal is affected by other signal components, and processing that is not extracted as an encoding target is performed.
[0007]
[Problems to be solved by the invention]
However, if there is a fine frequency with a large correlation value near the boundary between adjacent standard frequencies as described above, if the fine frequency is not extracted, the signal component actually exists at the boundary portion. Conversely, if this fine frequency is extracted, there is a problem that it will be extracted even if it does not actually exist because of the influence of other signal components. ing.
[0008]
In view of the above points, the present invention can accurately extract a signal component even when the signal component exists in the vicinity of the boundary between standard frequencies. It is an object of the present invention to provide a frequency analysis method and an audio signal encoding method capable of performing the above.
[0009]
[Means for Solving the Problems]
In order to solve the above problems, in the present invention, as a frequency analysis method for separating a signal component corresponding to a predetermined standard frequency from a time-series signal, a plurality of fine frequencies are obtained at intervals smaller than the standard frequency interval. A harmonic signal preparation stage for setting and preparing a plurality of harmonic signal sets corresponding to each fine frequency, a main correlation array for storing a correlation value corresponding to each standard frequency, and a correlation value corresponding to each fine frequency An array preparation stage for preparing a fine correlation array for storing a signal, a section signal extraction stage for extracting a section signal by setting a unit section of a predetermined length in the time series signal, and all the harmonic signals And calculating the correlation value corresponding to each fine frequency, calculating a correlation value corresponding to each fine frequency, and setting the correlation value calculated in the fine correlation array; and the correlation distribution in the fine correlation array. A peak frequency selection stage that extracts a plurality of fine frequencies that locally peak compared to a correlation value at a surrounding fine frequency, and the correlation between the harmonic signal corresponding to the fine frequency that becomes each peak and the section signal is recalculated. Set to the main correlation array corresponding to the nearest standard frequency of the fine frequency, subtract the inclusion signal generated by the product of the recalculated correlation value and the harmonic signal from the interval signal, the difference signal It is characterized by having a spectrum calculation step of determining the value of the main correlation array by sequentially performing the process of updating the section signal by newly setting the section signal to all the extracted peaks.
[0010]
According to the present invention, a fine frequency is set at intervals finer than the standard frequency, a correlation with respect to a section signal of each fine frequency is obtained, and a fine frequency at which the correlation value locally peaks (hereinafter referred to as a peak frequency). Multiple correlations between the selected peak frequencies and the interval signal should be obtained using a generalized harmonic analysis method, and the calculated correlation value should be extracted as the correlation value of the standard frequency closest to the corresponding peak frequency. Since the frequency component is determined, it is possible to accurately extract the frequency component even when the fine frequency located near the boundary between adjacent standard frequencies has a peak.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0012]
(1. Basic principle)
First, the basic principle of the frequency analysis method and the acoustic signal encoding method according to the present invention will be described. Since this basic principle is disclosed in the above-mentioned publications, only the outline will be briefly described here.
[0013]
As shown in FIG. 1A, it is assumed that an analog acoustic signal is given as a time-series signal. In the example of FIG. 1, the acoustic signal is shown with time t on the horizontal axis and amplitude (intensity) on the vertical axis. Here, first, the analog sound signal is processed as digital sound data. This may be performed by using a conventional general PCM method, sampling the analog acoustic signal at a predetermined sampling frequency, and converting the amplitude into digital data using a predetermined number of quantization bits. Here, for convenience of explanation, the waveform of the acoustic data digitized by the PCM method is also shown by the same waveform as the analog acoustic signal of FIG.
[0014]
Subsequently, a plurality of unit sections are set on the time axis of the acoustic signal to be analyzed. In the example shown in FIG. 1A, six times t1 to t6 are defined at equal intervals on the time axis t, and five unit intervals d1 to d5 having these times as the start point and the end point are set. In the example of FIG. 1, all unit sections having the same section length are set without overlapping on the time axis, but the section setting is performed so that adjacent unit sections partially overlap on the time axis. It doesn't matter.
[0015]
When the unit section is set in this way, representative frequencies are selected for the acoustic signals (hereinafter referred to as section signals) for each unit section. Each section signal usually includes various frequency components. For example, a frequency component having a high component intensity ratio may be selected as the representative frequency. Here, the so-called fundamental frequency is generally used as the representative frequency, but a harmonic frequency such as a formant frequency of speech or a peak frequency of a noise source may be treated as a representative frequency. Although only one representative frequency may be selected, more accurate encoding is possible by selecting a plurality of representative frequencies depending on the acoustic signal. FIG. 1B shows an example in which three representative frequencies are selected for each unit section, and one representative frequency is encoded as one representative code (shown as a note for convenience in the drawing). Has been. Here, three tracks T1, T2 and T3 are provided to accommodate representative codes (notes), but this means that three representative codes selected for each unit section are assigned to different tracks. It is for accommodating.
[0016]
For example, representative codes n (d1,1), n (d1,2), n (d1,3) selected for the unit section d1 are accommodated in tracks T1, T2, T3, respectively. Here, each code n (d1,1), n (d1,2), n (d1,3) is a code indicating a note number in the MIDI code. The note number in the MIDI code takes 128 values from 0 to 127, each indicating one key of the piano keyboard. Specifically, for example, when 440 Hz is selected as the representative frequency, this frequency corresponds to the note number n = 69 (corresponding to “ra sound (A3 sound)” in the center of the piano keyboard). N = 69 is selected. However, FIG. 1B is a conceptual diagram showing the representative code obtained by the above-described method in the form of a note. In reality, data on intensity is also added to each note. For example, the track T1 includes e (d1,1), e (d2,1)... Along with data indicating the pitches of note numbers n (d1,1), n (d2,1). Data indicating the strength is accommodated. The data indicating the intensity is determined by the degree to which the component of each representative frequency is included in the original section signal. Specifically, the data indicating the intensity is determined based on the correlation value with respect to the section signal of the periodic function having each representative frequency. Further, in the conceptual diagram shown in FIG. 1B, the position of each unit section on the time axis is indicated by the position of the note in the horizontal direction, but in reality, the position on the time axis is shown. Is accurately added as a numerical value to each note.
[0017]
As a format for encoding an acoustic signal, it is not always necessary to adopt the MIDI format. However, since the MIDI format is the most popular as this type of encoding, code data in the MIDI format is practically used. Is preferred. In the MIDI format, “note-on” data or “note-off” data exists while interposing “delta time” data. The “note-on” data is data for designating a specific note number N and velocity V to instruct the start of a specific sound, and the “note-off” data is a specific note number N and velocity V. This is data that designates the end of the performance of a specific sound. The “delta time” data is data indicating a predetermined time interval. Velocity V is a parameter that indicates, for example, the speed at which a piano keyboard is pressed down (velocity at the time of note-on) and the speed at which the finger is released from the keyboard (velocity at the time of note-off). Or it shows the strength of the performance end operation.
[0018]
In the above-described method, J note numbers n (di, 1), n (di, 2),..., N (di, J) are obtained as representative codes for the i-th unit interval di. Intensities e (di, 1), e (di, 2),..., E (di, J) are obtained for each of these. Therefore, MIDI format code data can be created by the following method. First, as the note number N described in the “note on” data or “note off” data, the obtained note numbers n (di, 1), n (di, 2),..., N (di , J) can be used as they are. On the other hand, as the velocity V described in the “note on” data or “note off” data, the obtained intensities e (di, 1), e (di, 2),..., E (di, A value obtained by normalizing J) by a predetermined method may be used. The “delta time” data may be set according to the length of each unit section.
[0019]
(2.1. Specific method for obtaining correlation with periodic function)
In the method based on the basic principle described above, one or a plurality of representative frequencies are selected for the section signal, and the section signal is represented by a periodic signal having this representative frequency. Here, the representative frequency to be selected is literally a frequency representing the signal component in the unit section. Specific methods for selecting the representative frequency include a method using a short-time Fourier transform and a method using a generalized harmonic analysis method, as will be described later. Both methods have the same basic concept. Prepare a plurality of periodic functions with different frequencies in advance, and from these periodic functions, a periodic function that has a high correlation with the section signal in the unit section. And a method of selecting the frequency of the highly correlated periodic function as a representative frequency is adopted. That is, when selecting a representative frequency, an operation for obtaining a correlation between a plurality of periodic functions prepared in advance and a section signal in a unit section is performed. Therefore, here, a specific method for obtaining the correlation with the periodic function will be described.
[0020]
Assume that trigonometric functions as shown in FIG. 2 are prepared as a plurality of periodic functions. These trigonometric functions are composed of a pair of a sine function and a cosine function having the same frequency. For each of 128 standard frequencies f (0) to f (127), a pair of a sine function and a cosine function. Is defined. Here, a pair of functions consisting of a sine function and a cosine function having the same frequency is defined as a periodic function for the frequency. That is, the periodic function for a specific frequency is constituted by a pair of sine function and cosine function. Thus, the periodic function is defined by a pair of sine function and cosine function in order to consider that the correlation value is influenced by the phase when obtaining the correlation value of the periodic function with respect to the signal. The variables F and k in each trigonometric function shown in FIG. 2 are variables corresponding to the sampling frequency F and the sample number k for the section signal X. For example, a sine wave with respect to the frequency f (0) is represented by sin (2πf (0) k / F), and given an arbitrary sample number k, the same time position as the k-th sample constituting the section signal The amplitude value of the periodic function at is obtained.
[0021]
Here, an example in which 128 standard frequencies f (0) to f (127) are defined by the equations as shown in FIG. That is, the nth (0 ≦ n ≦ 127) standard frequency f (n) is defined by the following [Formula 1].
[0022]
[Formula 1]
f (n) = 440 × 2γ (n)
γ (n) = (n−69) / 12
[0023]
If the standard frequency is defined by such an expression, it is convenient when finally encoding using MIDI data is performed. This is because the 128 standard frequencies f (0) to f (127) set by such a definition take frequency values forming a geometric series, and correspond to the note numbers used in the MIDI data. This is because it becomes a frequency. Therefore, the 128 standard frequencies f (0) to f (127) shown in FIG. 2 are frequencies set at equal intervals (in semitone units in MIDI) on the frequency axis shown on the logarithmic scale.
[0024]
Next, a specific description will be given of how to obtain the correlation of each periodic function with respect to a section signal in an arbitrary section. For example, as shown in FIG. 4, it is assumed that a section signal X is given for a certain unit section d. Here, it is assumed that sampling is performed at the sampling frequency F for the unit interval d having the interval length L, and w sample values are obtained in total, and the sample numbers are 0, 1, 2, 3,..., K,..., W-2, w-1 (the w-th sample indicated by a white circle is a sample included at the head of the next unit section adjacent to the right. And). In this case, for an arbitrary sample number k, an amplitude value of X (k) is given as digital data. In the short-time Fourier transform, it is usual to multiply the window function W (k) such that the center weight is close to 1 and the weights at both ends are close to 0 for each sample with respect to X (k). That is, X (k) × W (k) is treated as X (k) and the following correlation calculation is performed. As the shape of the window function, a cosine wave-shaped Hamming window is generally used. Here, w is described as a constant in the following description, but in general, it is changed according to the value of n, and F / f (n) that is maximum within a range not exceeding the section length L. It is desirable to set the value to an integer multiple.
[0025]
The principle of obtaining a correlation value with such a section signal X and the sine function Rn having the nth standard frequency f (n) is shown. Both correlation values A (n) can be defined by the first arithmetic expression of FIG. Here, X (k) is the amplitude value of the sample number k in the section signal X, as shown in FIG. 4, and sin (2πf (n) k / F) is the sine at the same position on the time axis. This is the amplitude value of the function Rn. This first arithmetic expression can be said to be an expression for obtaining the inner product of the amplitude value of the section signal X and the amplitude vector of the sine function Rn for the dimensions of all sample numbers k = 0 to w−1 in the unit section d. .
[0026]
Similarly, the second arithmetic expression in FIG. 5 is an expression for obtaining a correlation value between the interval signal X and the cosine function having the nth standard frequency f (n), and the correlation value between the two is B ( n). The first arithmetic expression for obtaining the correlation value A (n) and the second arithmetic expression for obtaining the correlation value B (n) are finally multiplied by 2 / w. Is for normalizing the correlation value. As described above, since w is generally changed depending on n, this coefficient is also a variable depending on n.
[0027]
The effective correlation value between the interval signal X and the standard periodic function having the standard frequency f (n) is the correlation value A (n) with the sine function, the cosine function, as shown in the third arithmetic expression of FIG. Of the square sum of squares E (n) with the correlation value B (n). If the frequency of the standard periodic function having a large correlation effective value is selected as the representative frequency, the section signal X can be encoded using this representative frequency.
[0028]
That is, one or a plurality of standard frequencies whose correlation value E (n) is greater than or equal to a predetermined reference may be selected as the representative frequency. Here, the selection condition that “correlation value E (n) is greater than or equal to a predetermined reference” is, for example, a standard in which some threshold value is set and correlation value E (n) exceeds this threshold value. An absolute selection condition that all frequencies f (n) are selected as representative frequencies may be set. For example, up to the Qth in the order of the correlation value E (n) is selected. A relative selection condition may be set.
[0029]
(2.2. Method of generalized harmonic analysis)
Here, a generalized harmonic analysis technique useful when encoding an acoustic signal according to the present invention will be described. As already described, when encoding an acoustic signal, several representative frequencies having high correlation values are selected for the section signal in each unit section. Generalized harmonic analysis is a technique that enables the selection of representative frequencies with higher accuracy, and the basic principle thereof is as follows.
[0030]
Assume that there is a signal S (j) for the unit interval d as shown in FIG. Here, j is a parameter for repetitive processing (j = 1 to J), as will be described later. First, correlation values for all 128 periodic functions as shown in FIG. 2 are obtained for this signal S (j). Then, the frequency of one periodic function having the maximum correlation value is selected as a representative frequency, and the periodic function having the representative frequency is extracted as an element function. Subsequently, the inclusion signal G (j) as shown in FIG. 6B is defined. The inclusion signal G (j) is a signal obtained by multiplying the extracted element function by the correlation value of the element function with respect to the signal S (j) of the element function. For example, as shown in FIG. 2, when a frequency f (n) is selected as a representative frequency using a pair of sine function and cosine function as shown in FIG. 2, a sine function A (n) having an amplitude A (n). ) Sin (2πf (n) k / F) and a signal composed of the sum of cosine function B (n) cos (2πf (n) k / F) having amplitude B (n) is included signal G (j) (In FIG. 6B, only one function is shown for convenience of illustration). Here, since A (n) and B (n) are normalized correlation values obtained by the equation of FIG. 5, the inclusion signal G (j) is eventually included in the signal S (j). It can be said that the signal component has a certain frequency f (n).
[0031]
Thus, when the content signal G (j) is obtained, the difference signal S (j + 1) is obtained by subtracting the content signal G (j) from the signal S (j). FIG. 6C shows the difference signal S (j + 1) obtained in this way. The difference signal S (j + 1) can be said to be a signal composed of the remaining signal components obtained by removing the signal component having the frequency f (n) from the original signal S (j). Therefore, by increasing the parameter j by 1, this difference signal S (j + 1) is handled as a new signal S (j), and the same processing is performed J times while increasing the parameter j by 1 from j = 1 to J. If it is repeatedly executed, J representative frequencies can be selected.
[0032]
The J inclusion signals G (1) to G (J) output as a result of such correlation calculation are signals that are constituent elements of the original section signal X, and the original section signal X is encoded. In this case, information indicating the frequency of these J inclusion signals and information indicating the amplitude (intensity) may be used as the code data. Although J has been described as the number of representative frequencies, it may be the same as the number of standard frequencies f (n), that is, J = 128. For the purpose of obtaining a frequency spectrum, this is usually done. It is.
[0033]
Through the processing as described above, a frequency group that is a set of intensity values for each frequency is obtained for each unit section. When a predetermined number of frequency groups are selected in this way, “information indicating the pitch” corresponding to each frequency of this frequency group, and “sound strength corresponding to the signal intensity of each selected frequency”. Information indicating, “information indicating sound start time of sound” corresponding to the start point of the unit section, and “information indicating sound end time of sound” corresponding to the start point of the unit section subsequent to the unit section If a predetermined number of code data including information is created, the section signal X in the unit section can be encoded with the predetermined number of code data. If MIDI data is created as code data, a note number is used as “information indicating the pitch of the sound”, velocity is used as the “information indicating the intensity of the sound”, and “sound generation start time is set. The note-on time may be used as the “information indicating” and the note-off time may be used as the “information indicating the end time of sound generation”.
[0034]
(3.1. Frequency analysis method and acoustic signal encoding method according to the present invention)
Hereinafter, a frequency analysis method and an audio signal encoding method according to the present invention will be described. As described above, in the conventional method, a correlation value with respect to a fine frequency is obtained, and the maximum correlation value is used as the correlation value of the standard frequency in each standard frequency range. For example, consider a case where the spectrum of the original acoustic signal is in a state as shown in FIG. In FIG. 7, the horizontal axis represents frequency and the vertical axis represents intensity value or correlation value. In FIG. 7A, the sound included in the range of note number n (the range of standard frequency f (n)) and the sound included in the range of note number n + 1 are emitted. If the correlation about each fine frequency is calculated | required by the method of a short-time Fourier transform, it will come to show in FIG. In FIG. 7B, the fine frequencies are set at intervals obtained by dividing each standard frequency into 13. In the conventional encoding, the maximum correlation value is extracted within the range of each note number. At this time, in the range of each note number, what is present at the boundary is regarded as an influence of other signal components and is not extracted. Therefore, as shown in FIG. 7C, the maximum correlation value is extracted from the note number n, but not extracted from the note number n + 1.
[0035]
On the other hand, in the present invention, the maximum correlation value is not extracted in the range of each note number, but the correlation value that is a peak is extracted. The correlation value that is a peak means that the correlation value of the fine frequency on both sides of itself is smaller than itself. When a correlation value that is a peak is extracted, it is unlikely that the correlation value is affected by other signal components because the peak itself is a peak. Therefore, even if it exists in the boundary part of the range of a note number, it shall extract. Therefore, a signal component as shown in FIG. 7D is extracted from a set of correlation values as shown in FIG.
[0036]
Consider the second example as shown in FIG. If two sounds as shown in FIG. 8A are emitted, a correlation value corresponding to each fine frequency as shown in FIG. 8B is obtained by the technique of short-time Fourier transform. In the conventional method, as shown in FIG. 8 (c), it is extracted from the note number n but not from the note number n + 1. According to the present invention, FIG. As shown, frequency components corresponding to each note number are extracted.
[0037]
Next, the frequency analysis method of the present invention will be described with reference to the flowchart shown in FIG. 9, taking as an example the case of encoding an acoustic signal. First, a unit interval is set for a time-series acoustic signal, and a segment signal is extracted (step S1). As described above with reference to FIG. 1 in the above (Basic Principle) section, a unit section having a predetermined length is set and extracted.
[0038]
Next, the correlation between the extracted section signal and the harmonic signal prepared in advance is calculated (step S2). This harmonic signal is the same as the periodic function described in the above section (Specific method for obtaining correlation with periodic function). However, in the example of FIG. 2, 128 standard frequencies corresponding to the note number are set. However, in the present invention, 12 fine frequencies are set at intervals of a geometric series between the standard frequencies, and 128 in total. * 13 harmonic signals are prepared. For example, twelve fine frequencies from f (n + 1/13) to f (n + 12/13) are set between adjacent standard frequencies f (n) and f (n + 1). In this step S2, the correlation between the section signal and 128 × 13 harmonic signals is obtained by a short-time Fourier transform technique. As a result, correlation values corresponding to 128 × 13 fine frequencies are obtained. This correlation value is stored in a fine correlation array prepared in advance.
[0039]
Subsequently, a fine frequency that becomes a peak (hereinafter referred to as a peak frequency) is selected based on the calculated correlation value (step S3). Specifically, based on the calculated 128 × 13 correlation values, a fine frequency whose own correlation value is larger than the correlation values of the adjacent fine frequencies on both sides is selected.
[0040]
Next, the correlation between the harmonic signal corresponding to each selected peak frequency and the section signal is obtained by a generalized harmonic analysis technique (step S4). Specifically, in the same manner as described in the above section (Generalized Harmonic Analysis Method), first, the harmonic signal corresponding to the one having the maximum correlation value among the selected peak frequencies and the section signal S ( 1) Find the correlation with (= X). Subsequently, a signal obtained by multiplying the harmonic signal at this time by the correlation value calculated as its amplitude is set as a contained signal G (1), and this contained signal G (1) is subtracted from the section signal S (1). Thus, the difference signal S (2) is obtained. Next, among the peak frequencies selected in step S3, the correlation between the harmonic signal having the second highest peak frequency having the correlation value with the section signal X and the difference signal S (2) is obtained, and the inclusion signal G (2 ) Is subtracted from the section signal to obtain a differential signal S (3). In this way, the correlation values of all the selected peak frequencies are obtained by the generalized harmonic analysis method. Since this peak frequency corresponds to the fine frequency, it is necessary to return to the standard frequency corresponding to the note number at the time of encoding. Therefore, the calculated correlation value is set in the main correlation array as a correlation value corresponding to the standard frequency closest to the peak frequency. As a result, a plurality of sets of standard frequencies and their correlation values are obtained. By using the standard frequencies as note numbers and the correlation values as velocities, encoded data of the MIDI standard can be obtained.
[0041]
By performing the above processing for all unit sections, the entire acoustic signal can be encoded. As shown in FIG. 1, it is rare that the end time of the previous unit section and the start time of the subsequent unit section are set to be the same for the unit section. It is often set so that the following unit sections overlap.
[0042]
(3.2. Two-step process for determining extracted frequency components)
In steps S3 and S4, the peak frequency is selected only once, and the correlation value is calculated for each selected peak frequency by the generalized harmonic analysis method. The accuracy can be increased. Such a case will be described below. By repeatedly performing the process of subtracting the inclusion signal from the section signal X as in step S4, a different section signal X 'is obtained. The processes in steps S2 to S4 are repeated for this section signal X '.
[0043]
The fine frequencies that correlate with the section signal X 'are excluded from those that correspond to the standard frequencies whose correlation values are already stored in the main correlation array. For example, when the correlation value corresponding to the standard frequency f (n) is set in the main correlation array, the fine frequencies f (n−6 / 13) to f (n + 6/13) are the interval signal X ′. Are excluded from the target of correlation calculation. The correlation between the harmonic signal corresponding to the remaining fine frequency and the section signal X ′ is obtained by the short-time Fourier transform method, and the calculated correlation value is stored in the fine correlation array.
[0044]
Subsequently, in step S3, the peak frequency is selected again based on the calculated correlation value, and in step S4, the correlation between the selected peak frequency and the section signal X ′ is obtained, and then the calculated correlation is calculated. Set the value to the main correlation array.
[0045]
The processes in steps S2 to S4 can be repeated any number of times. However, when the process of encoding an acoustic signal is performed, about twice is sufficient. This is because if it is performed twice, about 64 sounds that can be sounded simultaneously by the MIDI standard can be extracted.
[0046]
(3.3. Determination of extracted frequency components within the same standard frequency)
In the determination of the standard frequency and the calculation of the correlation value in step S4, the standard frequency in the vicinity of the peak frequency was determined as corresponding to the calculated correlation value. This is not a problem when there is only one peak frequency included in one standard frequency range, but if there are multiple peak frequencies included in one standard frequency range, which one should be selected? Is a problem. Therefore, in the latter case, only the peak frequency having the maximum correlation value by the short-time Fourier transform is selected as the peak frequency among the peak frequencies included in one standard frequency, and the interval signal X and the interval signal X are selected by a generalized harmonic analysis technique. The correlation is obtained.
[0047]
(3.4. Section update width determination process)
The above frequency component extraction processing and encoding of the extracted frequency components are performed for each unit section. However, as described above, the setting of the unit section is not fixed and can be changed according to the situation. is there. At this time, how to set the length of one unit section is an important problem that greatly affects the analysis result. In other words, the shorter the section length, the better the time resolution, so it is convenient for analyzing frequency changes such as voice signals (vocal signals). There is a problem that the accuracy decreases. Therefore, in the past, a standard section length was determined in advance so that the number of samples (for example, 1024 samples) that would be most convenient for analysis was included in one unit section, and this fixed section In general, the time axis is mechanically divided based on the length.
[0048]
However, in the method of mechanically setting a fixed-length unit section, a unique section setting is always performed regardless of what kind of signal the time series signal to be analyzed is. There is a risk of discontinuity at the boundary of the unit section. That is, a large difference may occur in the frequency analysis results for adjacent unit sections. In general, when the obtained frequency analysis result is used for observing as a graph of a spectrum, even if a difference occurs in the analysis result at the boundary of the unit section, it does not cause a big problem. However, when the code data corresponding to the original sound signal is created using the analysis result of the sound signal, the discontinuity at the boundary becomes a big problem. When an original sound signal is to be reproduced based on data encoded by such a method, a sudden change in pitch occurs or a sound skip occurs at the boundary between unit intervals.
[0049]
In order to avoid such discontinuity at the boundary, a method of setting a unit interval by partially overlapping on the time axis has also been proposed, but since the amount to be overlapped is also fixed in this case, it is inherently overlapping. This results in a problem that redundant processing is increased even in places where it is not necessary to perform processing. In the present invention, when analyzing a time-series signal, a device section is devised for setting the unit section so as to keep the continuity of the sound at the boundary of the unit section and minimize the overlap of the unit sections. This will be described below.
[0050]
In particular, the present invention is characterized in that the unit interval is set by using the correlation value obtained by the short-time Fourier transform in step S2. Specifically, when the frequency component is extracted in a certain unit section, the value of the fine correlation array obtained first in step S2 is copied to the immediately preceding correlation array used for section determination. Then, the processing of step S2 to step S4 is performed a predetermined number of times to determine the frequency component to be extracted in one unit section, and then the position of the next unit section is set. In the present invention, since the unit section has a fixed length, the unit section is determined when the start position of the unit section is determined. Therefore, in the present invention, the subsequent unit section is determined by determining the feed width from the start position of the previous unit section to the start position of the subsequent unit section.
[0051]
First, the similarity between the previously determined unit section and the unit section whose position is to be determined is obtained (step S6). Specifically, in order to select a peak frequency, the value of the fine correlation array obtained as a result of the short-time Fourier transform performed in step S2 is used to calculate by the following [Equation 2].
[0052]
[Formula 2]
SM = 100-100 × [Σk {Sdn-1(k) -Sdn(k)}2]1/2 / {ΣkSdn-1(k)2}1/2
[0053]
In the above [Equation 2], Sdn(k) is a correlation value of the fine frequency k with respect to the section signal of the unit section dn to be determined, and Sdn-1(k) is a correlation value of the fine frequency k with respect to the section signal of the immediately preceding unit section dn-1. However, k does not indicate the frequency itself, but is expressed by a value obtained by dividing the standard frequency corresponding to the note number n by 13, and takes a value of k = −6 to 127 × 13 + 6. The greater the similarity SM, the more similar the signals in both sections.
[0054]
Next, the value of the similarity SM is compared with a threshold value. When the similarity SM is smaller than the threshold 2 (step S7), the set feed width is halved (step S8). The temporary unit section is set again at the position where the feed width is halved (step S1), and the correlation between the section signal of the new temporary unit section and the harmonic signal is obtained (step S2). The processes of steps S1 and S2 and steps S6 to S8 are repeated until the similarity SM becomes equal to or greater than the threshold value 2. That is, the range in which the subsequent unit section overlaps the previous unit section is increased until the threshold value is 2 or more.
[0055]
When the similarity SM is equal to or greater than the threshold 2, the similarity SM is compared with the threshold 1. When the similarity is less than the threshold 1, the temporary unit section is determined as the unit section, and the process proceeds to the peak position selection process (step S3). When the similarity is equal to or greater than the threshold value 1, the feed width is set to double (step S10), the temporary unit section is determined as the unit section, and the process proceeds to the peak position selection process (step S3). Here, the feed width changed to double is used as the feed width of the next unit section. After the unit interval is determined, the processes in steps S3 and S4 are performed in the same manner, and the extraction frequency component is determined. As a matter of course, the above two threshold values satisfy the relationship of threshold value 1> threshold value 2.
[0056]
When the extraction frequency for the unit section is determined, a temporary unit section is set (step S1) with the position moved by the feed width set at this time as the start position (step S5). At this time, a standard feed width that is set in advance is normally used. If the feed width is set to double in step S10, the feed width is set to twice the standard feed width.
[0057]
Here, the set unit section will be described using a specific example shown in FIG.
FIG. 10A is a diagram illustrating time-series acoustic signals. As shown in FIG. 10B, a fixed-length unit section d1 is set from the head position of the acoustic signal, and the extraction frequency is determined by performing the processing from step S2 to step S4. In setting the next unit section d2, in step S5, it is sent after a preset standard feed width and temporarily set. In the present embodiment, the standard feed width is ½ of the fixed length d. Therefore, the unit section d2 is temporarily set so that the position shifted by d / 2 from the head of the unit section d1 becomes the head of the unit section d2. The state of the unit interval d2 temporarily set at this time is shown in FIG.
[0058]
In step S1, the acoustic signal at the position of the temporarily set unit section d2 is extracted as a section signal, and the correlation with the section signal is obtained by the method of step S2. In step S6, the similarity shown in [Formula 2] is calculated. If the calculated similarity is less than the threshold value 2, that is, if both section signals are not very similar, the process proceeds to step S8 and the feed width is halved. Here, since it is set to d / 2, it is set to d / 4. In this case, returning to step S1, the unit section d2 is temporarily set so that the position shifted by d / 4 from the head of the unit section d1 becomes the head of the unit section d2. The state of the unit interval d2 temporarily set at this time is shown in FIG. When the unit section d2 is temporarily set again, the processes of step S2 and step S6 are repeated again. Furthermore, if the similarity is less than the threshold value 2 in step S7, the feed width is set to d / 8 in step S8, and the position shifted by d / 8 from the head of the unit section d1 is returned to step S1. The unit section d2 is temporarily reset so as to be at the head of the section d2.
The state of the unit interval d2 temporarily set at this time is shown in FIG.
[0059]
That is, as shown in FIG. 10C to FIG. 10E, the unit interval d2 is the unit interval d1 until the similarity between the interval signals in the preceding unit interval d1 and the subsequent unit interval d2 is equal to or greater than the threshold value 2. Will increase the number of overlapping sections. However, there is a possibility that the unit section d1 and the unit section d2 will approach endlessly, so if the minimum feed width is set in advance and the feed width is less than the minimum distance, The unit section provisionally set in is determined as a formal unit section, and the process proceeds to step S3.
[0060]
On the other hand, when the similarity between the section signal of the unit section d1 and the section signal of the temporarily set unit section d2 is greater than or equal to the threshold 2 and less than the threshold 1, the temporarily set unit section d2 is determined. Then, the processing after step S3 is performed. Further, when the similarity is equal to or greater than the threshold value 1, the temporarily set unit section d2 is determined and the processing after step S3 is performed. In this case, the feed width is set to double. This process is also performed in parallel. Then, after the extraction frequency component for the unit section d2 is determined, in step S5, the position moved by the feed width set twice from the head of the unit section is set as the head position of the unit section d3. For example, when the unit section d2 is determined at the position shown in FIG. 10C, the unit section d3 is temporarily set at the position shown in FIG.
[0061]
Although the preferred embodiments of the present invention have been described above, the frequency analysis method and the encoding method are naturally executed by a computer or the like. Specifically, a program for executing the steps shown in the flowchart of FIG. 9 according to the above procedure is installed in the computer. Then, after time-series signals such as acoustic signals are digitized by the PCM method or the like, they are taken into a computer and processed in steps S1 to S10, and then the extracted frequency component or code data such as MIDI format is converted into digital data. Output from the computer. For example, in the case of MIDI data, the output code data is reproduced as sound using a MIDI sequencer and a MIDI sound source.
[0062]
【The invention's effect】
As described above, according to the present invention, as a frequency analysis method for separating a signal component corresponding to a predetermined standard frequency from a time series signal, a unit section having a predetermined length is set in the time series signal. To extract a correlation signal between all the harmonic signals and the section signal to calculate a correlation value corresponding to each fine frequency, and out of the fine frequencies corresponding to the calculated correlation value The peak frequency selection stage for extracting a plurality of fine frequencies that locally peak compared to the correlation value at the fine frequency, and recalculating the correlation between the harmonic signal corresponding to the fine frequency that becomes each peak and the interval signal, Set as a correlation value corresponding to the nearest standard frequency of the fine frequency, subtract the inclusion signal generated by the product of the recalculated correlation value and the harmonic signal from the interval signal, the difference signal In addition, since the interval signal is updated to the interval signal, the correlation value corresponding to the standard frequency is determined by sequentially performing the process of updating the interval signal on all the extracted peaks. Even when the fine frequency located at the peak reaches a peak, the frequency component can be accurately extracted. Furthermore, by encoding the extracted frequency component into a format such as MIDI, it is possible to create code data that can faithfully reproduce the original sound signal.
[Brief description of the drawings]
FIG. 1 is a diagram showing a basic principle of a frequency analysis method and an acoustic signal encoding method according to the present invention.
FIG. 2 is a diagram showing an example of a periodic function used in the present invention.
3 is a diagram showing a relational expression between the frequency of each periodic function shown in FIG. 2 and a MIDI note number n. FIG.
FIG. 4 is a diagram illustrating a method of calculating a correlation between a signal to be analyzed and a periodic signal.
FIG. 5 is a diagram showing a calculation formula for performing the correlation calculation shown in FIG. 4;
FIG. 6 is a diagram showing a basic method of generalized harmonic analysis.
FIG. 7 is a diagram showing a first example showing a comparison with a conventional method regarding selection of frequency components.
FIG. 8 is a diagram showing a second example showing comparison with the related art regarding selection of frequency components;
FIG. 9 is a flowchart of a frequency analysis method and an acoustic signal encoding method according to the present invention.
FIG. 10 is a diagram illustrating a procedure for setting unit intervals;
[Explanation of symbols]
d1 to d5 ... Unit interval
d: Unit section length
X: Initial section signal

Claims (7)

時系列信号から所定の標準周波数に対応した信号成分を分離するための周波数解析方法であって、
前記標準周波数の間隔よりも微細な間隔で複数の微細周波数を設定し、各微細周波数に対応する複数の調和信号集合を準備する調和信号準備段階と、
前記各標準周波数に対応する相関値を格納するための主相関配列と、各微細周波数に対応する相関値を格納するための微細相関配列と、直前の単位区間において得られた微細相関配列を保持するための区間決定用相関配列を準備する配列準備段階と、
前記時系列信号に所定の長さの単位区間を設定し、区間信号を抽出するための区間信号抽出段階と、
前記全ての調和信号と前記区間信号との相関を演算して、各微細周波数に対応する相関値を算出し、前記微細相関配列に算出された相関値を設定する相関演算段階と、
前記微細相関配列中の相関配列より周囲の微細周波数における相関値に比べ局所的にピークとなる微細周波数を複数抽出するピーク周波数選出段階と、
前記各ピークとなる微細周波数に対応する調和信号と前記区間信号との相関を再度演算し、前記微細周波数の最近傍の標準周波数に対応する主相関配列に設定し、前記再度算出された相関値と調和信号との積で生成される含有信号を前記区間信号から減じ、差分信号を新たに区間信号とすることにより区間信号を更新する処理を抽出された全てのピークに対して順次行って主相関配列の値を決定するスペクトル算出段階と、
直前の単位区間における微細相関配列の値を複写して得られる区間決定用相関配列の値と、仮設定された現単位区間における微細相関配列の値の類似度を算出し、当該類似度に基づいて単位区間の送り幅を決定する類似度算出段階と、を有し、
前記区間信号抽出段階は、前記決定された送り幅に基づく位置に設定される単位区間から区間信号を抽出するものであることを特徴とする周波数解析方法。
A frequency analysis method for separating a signal component corresponding to a predetermined standard frequency from a time series signal,
A harmonic signal preparation step of setting a plurality of fine frequencies at intervals finer than the interval of the standard frequency, and preparing a plurality of harmonic signal sets corresponding to each fine frequency;
Holds a main correlation array for storing correlation values corresponding to each standard frequency, a fine correlation array for storing correlation values corresponding to each fine frequency, and a fine correlation array obtained in the immediately preceding unit section A sequence preparation step for preparing a correlation sequence for determining an interval for
A section signal extraction step for setting a unit section of a predetermined length in the time series signal and extracting the section signal;
Calculating a correlation value corresponding to each fine frequency by calculating a correlation between all the harmonic signals and the section signal, and setting a correlation value calculated in the fine correlation array;
A peak frequency selection step for extracting a plurality of fine frequencies that locally peak compared to a correlation value at a surrounding fine frequency from the correlation array in the fine correlation array;
Recalculate the correlation between the harmonic signal corresponding to the fine frequency that becomes each peak and the section signal, set the main correlation array corresponding to the nearest standard frequency of the fine frequency, and the recalculated correlation value The content signal generated by the product of the harmonic signal is subtracted from the section signal, and the difference signal is newly used as the section signal to update the section signal sequentially for all the extracted peaks. A spectrum calculation stage for determining the value of the correlation sequence;
Calculates the similarity between the value of the correlation array for section determination obtained by copying the value of the fine correlation array in the previous unit section and the value of the fine correlation array in the temporarily set current unit section, and based on the similarity A similarity calculation stage for determining the feed width of the unit section,
The frequency analysis method according to claim 1, wherein in the section signal extraction step, a section signal is extracted from a unit section set at a position based on the determined feed width .
前記類似度算出段階により算出される類似度が所定値より低い場合には送り幅を小さくなるように設定するものであることを特徴とする請求項に記載の周波数解析方法。The frequency analysis method according to claim 1 , wherein when the similarity calculated in the similarity calculation step is lower than a predetermined value, the feed width is set to be small. 時系列信号から所定の標準周波数に対応した信号成分を分離するための周波数解析方法であって、
前記標準周波数の間隔よりも微細な間隔で複数の微細周波数を設定し、各微細周波数に対応する複数の調和信号集合を準備する調和信号準備段階と、
前記各標準周波数に対応する相関値を格納するための主相関配列と、各微細周波数に対応する相関値を格納するための微細相関配列を準備する配列準備段階と、
前記時系列信号に所定の長さの単位区間を設定し、区間信号を抽出するための区間信号抽出段階と、
前記全ての調和信号と前記区間信号との相関を演算して、各微細周波数に対応する相関値を算出し、前記微細相関配列に算出された相関値を設定する相関演算段階と、
前記微細相関配列中の相関配列より周囲の微細周波数における相関値に比べ局所的にピークとなる微細周波数を複数抽出するピーク周波数選出段階と、
前記各ピークとなる微細周波数に対応する調和信号と前記区間信号との相関を再度演算し、前記微細周波数の最近傍の標準周波数に対応する主相関配列に設定し、前記再度算出された相関値と調和信号との積で生成される含有信号を前記区間信号から減じ、差分信号を新たに区間信号とすることにより区間信号を更新する処理を抽出された全てのピークに対して順次行って主相関配列の値を決定するスペクトル算出段階と、を有し、
前記スペクトル算出段階は、1つの標準周波数が最近傍となる複数の微細周波数がピークとして選出された場合に、そのうち最大の相関値を有する微細周波数についてのみ、区間信号との相関を求めるようにするものであることを特徴とする周波数解析方法。
A frequency analysis method for separating a signal component corresponding to a predetermined standard frequency from a time series signal,
A harmonic signal preparation step of setting a plurality of fine frequencies at intervals finer than the interval of the standard frequency, and preparing a plurality of harmonic signal sets corresponding to each fine frequency;
An array preparation stage for preparing a main correlation array for storing correlation values corresponding to the respective standard frequencies and a fine correlation array for storing correlation values corresponding to the respective fine frequencies;
A section signal extraction step for setting a unit section of a predetermined length in the time series signal and extracting the section signal;
Calculating a correlation value corresponding to each fine frequency by calculating a correlation between all the harmonic signals and the section signal, and setting a correlation value calculated in the fine correlation array;
A peak frequency selection step for extracting a plurality of fine frequencies that locally peak compared to a correlation value at a surrounding fine frequency from the correlation array in the fine correlation array;
Recalculate the correlation between the harmonic signal corresponding to the fine frequency that becomes each peak and the section signal, set the main correlation array corresponding to the nearest standard frequency of the fine frequency, and the recalculated correlation value The content signal generated by the product of the harmonic signal is subtracted from the section signal, and the difference signal is newly used as the section signal to update the section signal sequentially for all the extracted peaks. a spectrum calculation step of determining the value of the correlation sequence, possess,
In the spectrum calculation step, when a plurality of fine frequencies having one standard frequency closest to each other are selected as peaks, only the fine frequency having the maximum correlation value is obtained as a correlation with the section signal. A frequency analysis method characterized by being a thing.
前記相関演算段階、前記ピーク周波数選出段階、および前記スペクトル算出段階を、ある単位区間から抽出された1つの区間信号に対して、複数回実行するようにしていることを特徴とする請求項1から請求項3のいずれかに記載の周波数解析方法。The correlation operation step, the peak frequency selection step, and the spectrum calculation step, from claim 1 for one interval signal extracted from a certain unit section, characterized in that so as to perform a plurality of times The frequency analysis method according to claim 3 . 前記時系列信号は音響信号であって、
前記スペクトル算出段階によって選出された標準周波数に対応する音の高さ情報と、相関値に対応する音の強さ情報と、各単位区間の開始点に対応する音の発音開始時刻と、各単位区間の終了点に対応する音の発音終了時刻からなる4つの情報に所定の変換を施して符号データを生成する符号化段階をさらに有することを特徴とする請求項1から請求項のいずれかに記載の周波数解析方法。
The time series signal is an acoustic signal,
Sound pitch information corresponding to the standard frequency selected by the spectrum calculation step, sound intensity information corresponding to the correlation value, sound start time corresponding to the start point of each unit section, and each unit any one of claims 1 to 4, characterized by further comprising an encoding step of generating encoded data by performing a predetermined conversion to the four information consisting pronunciation end time of the sound corresponding to the end point of the section The frequency analysis method described in 1.
コンピュータに、時系列信号から所定の標準周波数に対応した信号成分を分離するための周波数解析を実行させるプログラムであって、前記標準周波数の間隔よりも微細な間隔で複数の微細周波数を設定して各微細周波数に対応する複数の調和信号集合を準備する調和信号準備段階、前記各標準周波数に対応する相関値を格納するための主相関配列と、各微細周波数に対応する相関値を格納するための微細相関配列と、直前の単位区間において得られた微細相関配列を保持するための区間決定用相関配列を準備する配列準備段階、前記時系列信号に所定の長さの単位区間を設定し、区間信号を抽出するための区間信号抽出段階、前記全ての調和信号と前記区間信号との相関を演算して、各微細周波数に対応する相関値を算出し、前記微細相関配列に算出された相関値を設定する相関演算段階、前記微細相関配列中の相関配列より周囲の微細周波数における相関値に比べ局所的にピークとなる微細周波数を複数抽出するピーク周波数選出段階、前記各ピークとなる微細周波数に対応する調和信号と前記区間信号との相関を再度演算し、前記微細周波数の最近傍の標準周波数に対応する主相関配列に設定し、前記再度算出された相関値と調和信号との積で生成される含有信号を前記区間信号から減じ、差分信号を新たに区間信号とすることにより区間信号を更新する処理を抽出された全てのピークに対して順次行って主相関配列の値を決定するスペクトル算出段階、直前の単位区間における微細相関配列の値を複写して得られる区間決定用相関配列の値と、仮設定された現単位区間における微細相関配列の値の類似度を算出し、当該類似度に基づいて単位区間の送り幅を決定する類似度算出段階、をコンピュータに実行させるためのものであり、前記区間信号抽出段階は、前記決定された送り幅に基づく位置に設定される単位区間から区間信号を抽出するものであることを特徴とするプログラム。 A program for causing a computer to perform frequency analysis for separating a signal component corresponding to a predetermined standard frequency from a time-series signal, wherein a plurality of fine frequencies are set at intervals smaller than the intervals of the standard frequencies. Harmonic signal preparation stage for preparing a plurality of harmonic signal sets corresponding to each fine frequency, a main correlation array for storing correlation values corresponding to each standard frequency, and a correlation value corresponding to each fine frequency An array preparation step of preparing a correlation array for determining a section for holding the fine correlation array and the fine correlation array obtained in the immediately preceding unit section, setting a unit section of a predetermined length in the time series signal, An interval signal extraction step for extracting an interval signal, calculating a correlation value corresponding to each fine frequency by calculating a correlation between all the harmonic signals and the interval signal; A correlation calculation step for setting a correlation value calculated in a column; a peak frequency selection step for extracting a plurality of fine frequencies that locally peak compared to a correlation value at a surrounding fine frequency from the correlation array in the fine correlation array; Recalculate the correlation between the harmonic signal corresponding to the fine frequency that becomes each peak and the interval signal, set the main correlation array corresponding to the standard frequency nearest to the fine frequency, and the recalculated correlation value The main correlation is performed by sequentially performing the process of updating the interval signal by subtracting the inclusion signal generated by the product with the harmonic signal from the interval signal and newly setting the difference signal as the interval signal for all the extracted peaks. spectrum calculation step of determining the value of the array, the value of the section determining correlation sequence obtained by copying the value of the fine correlation sequences in the immediately preceding unit segment, it the current unit sections is temporarily set For calculating the similarity of the values of the fine correlation arrays and determining the feed width of the unit section based on the similarity, and causing the computer to execute the section signal extraction step. A program for extracting a section signal from a unit section set at a position based on the determined feed width . コンピュータに、時系列信号から所定の標準周波数に対応した信号成分を分離するための周波数解析を実行させるプログラムであって、前記標準周波数の間隔よりも微細な間隔で複数の微細周波数を設定して各微細周波数に対応する複数の調和信号集合を準備する調和信号準備段階、前記各標準周波数に対応する相関値を格納するための主相関配列と、各微細周波数に対応する相関値を格納するための微細相関配列を準備する配列準備段階と、前記時系列信号に所定の長さの単位区間を設定し、区間信号を抽出するための区間信号抽出段階と、前記全ての調和信号と前記区間信号との相関を演算して、各微細周波数に対応する相関値を算出し、前記微細相関配列に算出された相関値を設定する相関演算段階と、前記微細相関配列中の相関配列より周囲の微細周波数における相関値に比べ局所的にピークとなる微細周波数を複数抽出するピーク周波数選出段階と、前記各ピークとなる微細周波数に対応する調和信号と前記区間信号との相関を再度演算し、前記微細周波数の最近傍の標準周波数に対応する主相関配列に設定し、前記再度算出された相関値と調和信号との積で生成される含有信号を前記区間信号から減じ、差分信号を新たに区間信号とすることにより区間信号を更新する処理を抽出された全てのピークに対して順次行って主相関配列の値を決定するスペクトル算出段階、をコンピュータに実行させるためのものであり、前記スペクトル算出段階は、1つの標準周波数が最近傍となる複数の微細周波数がピークとして選出された場合に、そのうち最大の相関値を有する微細周波数についてのみ、区間信号との相関を求めるようにするものであることを特徴とするプログラム。A program for causing a computer to perform frequency analysis for separating a signal component corresponding to a predetermined standard frequency from a time series signal, wherein a plurality of fine frequencies are set at intervals smaller than the intervals of the standard frequencies. Harmonic signal preparation stage for preparing a plurality of harmonic signal sets corresponding to each fine frequency, a main correlation array for storing correlation values corresponding to each standard frequency, and a correlation value corresponding to each fine frequency An array preparation stage for preparing a fine correlation array, a section signal extraction stage for extracting a section signal by setting a unit section of a predetermined length in the time series signal, and all the harmonic signals and the section signal A correlation calculation step of calculating a correlation value corresponding to each fine frequency and setting the calculated correlation value in the fine correlation array, and a correlation array in the fine correlation array A peak frequency selection stage that extracts a plurality of fine frequencies that locally peak compared to the correlation values at the surrounding fine frequencies, and recalculates the correlation between the harmonic signal corresponding to each of the fine frequencies and the interval signal. Set to the main correlation array corresponding to the nearest standard frequency of the fine frequency, subtract the inclusion signal generated by the product of the recalculated correlation value and the harmonic signal from the interval signal, the difference signal It is for causing a computer to execute a spectrum calculation stage in which a process of updating a section signal by newly setting a section signal is sequentially performed on all extracted peaks to determine a value of a main correlation array, In the spectrum calculation step, when a plurality of fine frequencies having one standard frequency closest to each other are selected as peaks, a fine value having the maximum correlation value among them is selected. A program characterized by wave number only, and is to determine the correlation between the interval signals.
JP2001243179A 2001-08-10 2001-08-10 Frequency analysis method Expired - Fee Related JP4662407B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001243179A JP4662407B2 (en) 2001-08-10 2001-08-10 Frequency analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001243179A JP4662407B2 (en) 2001-08-10 2001-08-10 Frequency analysis method

Publications (2)

Publication Number Publication Date
JP2003058149A JP2003058149A (en) 2003-02-28
JP4662407B2 true JP4662407B2 (en) 2011-03-30

Family

ID=19073318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001243179A Expired - Fee Related JP4662407B2 (en) 2001-08-10 2001-08-10 Frequency analysis method

Country Status (1)

Country Link
JP (1) JP4662407B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10307581A (en) * 1997-05-08 1998-11-17 Fueisu:Kk Waveform data compressing device and method
JPH1173200A (en) * 1997-08-29 1999-03-16 Dainippon Printing Co Ltd Acoustic signal encoding method and record medium readable by computer
JP2000099093A (en) * 1998-09-18 2000-04-07 Dainippon Printing Co Ltd Acoustic signal encoding method
JP2000261322A (en) * 1999-03-05 2000-09-22 Dainippon Printing Co Ltd Method for encoding acoustic signal and program recording medium
JP2001005451A (en) * 1999-06-24 2001-01-12 Dainippon Printing Co Ltd Method of encoding and decoding acoustic signal
JP2001005450A (en) * 1999-06-24 2001-01-12 Dainippon Printing Co Ltd Method of encoding acoustic signal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10307581A (en) * 1997-05-08 1998-11-17 Fueisu:Kk Waveform data compressing device and method
JPH1173200A (en) * 1997-08-29 1999-03-16 Dainippon Printing Co Ltd Acoustic signal encoding method and record medium readable by computer
JP2000099093A (en) * 1998-09-18 2000-04-07 Dainippon Printing Co Ltd Acoustic signal encoding method
JP2000261322A (en) * 1999-03-05 2000-09-22 Dainippon Printing Co Ltd Method for encoding acoustic signal and program recording medium
JP2001005451A (en) * 1999-06-24 2001-01-12 Dainippon Printing Co Ltd Method of encoding and decoding acoustic signal
JP2001005450A (en) * 1999-06-24 2001-01-12 Dainippon Printing Co Ltd Method of encoding acoustic signal

Also Published As

Publication number Publication date
JP2003058149A (en) 2003-02-28

Similar Documents

Publication Publication Date Title
JP4132362B2 (en) Acoustic signal encoding method and program recording medium
JP2000099009A (en) Acoustic signal coding method
JP4662407B2 (en) Frequency analysis method
JP4695781B2 (en) Method for encoding an acoustic signal
JP4156252B2 (en) Method for encoding an acoustic signal
JP4580548B2 (en) Frequency analysis method
JP3776782B2 (en) Method for encoding an acoustic signal
JP4662406B2 (en) Frequency analysis method and acoustic signal encoding method
JP2003216147A (en) Encoding method of acoustic signal
JP4156269B2 (en) Frequency analysis method for time series signal and encoding method for acoustic signal
JP3935745B2 (en) Method for encoding acoustic signal
JP4268328B2 (en) Method for encoding an acoustic signal
JP4061070B2 (en) Frequency analysis method and acoustic signal encoding method
JP4220108B2 (en) Acoustic signal coding system
JP2002244691A (en) Encoding method for sound signal
JP4601865B2 (en) Method for encoding an acoustic signal
JP2002215142A (en) Encoding method for acoustic signal
JP4156268B2 (en) Frequency analysis method for time series signal and encoding method for acoustic signal
JP2003084799A (en) Frequency analysis method and sound signal encoding method
JP4697919B2 (en) Method for encoding an acoustic signal
JP4473979B2 (en) Acoustic signal encoding method and decoding method, and recording medium storing a program for executing the method
JP4268327B2 (en) Method for encoding an acoustic signal
JP2003263155A (en) Frequency analyzer and acoustic signal encoding device
JP4398049B2 (en) Time-series signal analysis method and acoustic signal encoding method
JP2002123296A (en) Method for encoding acoustic signals and method for separating acoustic signals

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101228

R150 Certificate of patent or registration of utility model

Ref document number: 4662407

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees