JP3454147B2 - Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis program - Google Patents
Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis programInfo
- Publication number
- JP3454147B2 JP3454147B2 JP11343598A JP11343598A JP3454147B2 JP 3454147 B2 JP3454147 B2 JP 3454147B2 JP 11343598 A JP11343598 A JP 11343598A JP 11343598 A JP11343598 A JP 11343598A JP 3454147 B2 JP3454147 B2 JP 3454147B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- harmonic
- peak
- musical tone
- overtone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、楽音波形からその
高調波成分を自動的に抽出する楽音波形分析装置及び楽
音波形分析方法並びに楽音波形分析プログラムを記録し
たコンピュータ読み取り可能な媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a musical tone waveform analyzing apparatus and a musical tone waveform analyzing method for automatically extracting a harmonic component from a musical tone waveform, and a computer-readable medium recording a musical tone waveform analyzing program.
【0002】[0002]
【従来の技術】従来、楽音の性質を分析したり楽音波形
を合成する楽音分析・合成の技術分野において、次のよ
うな処理が行われている。先ず、時系列なサンプリング
波形に窓関数を掛けてフレームを切り出し、高速フーリ
エ変換(FFT)処理を施して周波数スペクトル成分を
得る。この周波数スペクトル成分は、周波数軸上のデー
タすなわち周波数データ、位相データ、振幅データであ
り、振幅データからピークを成す全ての周波数位置(周
波数値)を検出する。そして窓関数の窓を移動してフレ
ームを更新し、上記の処理を繰り返し、各フレームにお
けるピークを検出する。2. Description of the Related Art Conventionally, the following processing has been performed in the technical field of tone analysis / synthesis for analyzing the properties of musical tones and synthesizing tone waveforms. First, a time-series sampling waveform is multiplied by a window function to cut out a frame, and fast Fourier transform (FFT) processing is performed to obtain a frequency spectrum component. This frequency spectrum component is data on the frequency axis, that is, frequency data, phase data, and amplitude data, and all frequency positions (frequency values) forming a peak are detected from the amplitude data. Then, the window of the window function is moved to update the frame, and the above processing is repeated to detect the peak in each frame.
【0003】ここで、各フレームにおけるピークは、一
般に、複数の周波数に対応して複数個検出され、これら
のピークは、元のサンプリング波形の基音、その倍音に
相当する高調波成分、ノイズ成分、FFTの窓関数のサ
イドローブ等に対応して検出される。しかし、楽音波形
の聴感上のピッチは主に基音および低次の倍音成分によ
り得られ、また主に高次の倍音成分により音色感が得ら
れるように、楽音の性質を分析したり楽音波形を合成す
るためには、上記各フレームのピークから楽音の特徴を
示す高調波成分を抽出する必要がある。そこで、従来
は、元のサンプリング波形の既知な基音に基づいて、そ
の整数倍の倍音関係にある周波数成分の近傍でピークを
高調波成分としてピッキングするようにしている。Here, generally, a plurality of peaks in each frame are detected corresponding to a plurality of frequencies, and these peaks are a fundamental tone of the original sampling waveform, a harmonic component corresponding to its overtone, and a noise component. It is detected corresponding to the side lobe of the FFT window function. However, the perceptual pitch of a musical tone waveform is obtained mainly by the fundamental tone and the low-order harmonic components, and the timbre of the musical tone is analyzed so that the timbre can be obtained mainly by the higher-order harmonic components. In order to synthesize them, it is necessary to extract the harmonic component showing the characteristic of the musical sound from the peak of each frame. Therefore, conventionally, based on a known fundamental tone of the original sampling waveform, a peak is picked as a harmonic component in the vicinity of a frequency component having an overtone relation of an integral multiple thereof.
【0004】[0004]
【発明が解決しようとする課題】しかしながら、従来の
ように基音と整数倍の倍音関係にある周波数成分の近傍
でピッキングする方法では、楽音の種類によっては本来
の高調波成分をうまく抽出することができず、ノイズ成
分等を抽出してしまうことがある。このような楽音とし
て、ピアノの楽音の周波数スペクトルを図1に示す。図
1は横軸を連続する複数フレームに対応する時間軸、縦
軸を周波数軸として連続する複数フレームの各線スペク
トル(この図では周波数のみ)を表したものである。す
なわち1本の縦線が1つのフレームに対応し、その線上
に載る点がそのフレームの線スペクトルとなる。なお、
この例はピアノの中央ハ音(基本周波数はだいたい26
4ヘルツ)を分析したものである。However, in the conventional method of picking in the vicinity of the frequency component having an integral multiple harmonic relationship with the fundamental tone, the original harmonic component may be well extracted depending on the type of musical tone. It may not be possible and noise components may be extracted. As such a musical tone, a frequency spectrum of a musical tone of a piano is shown in FIG. FIG. 1 shows each line spectrum (only frequency in this figure) of a plurality of consecutive frames with the horizontal axis representing the time axis corresponding to the plurality of consecutive frames and the vertical axis representing the frequency axis. That is, one vertical line corresponds to one frame, and the points on that line are the line spectrum of that frame. In addition,
This example shows the middle C sound of a piano (fundamental frequency is approximately 26
4 Hertz).
【0005】図に示したように、ピークはフレーム毎に
点状となるもの、フレーム間で短い連続性を有するも
の、フレーム間で長い連続性を有するものとして検出さ
れ、このうち、特に長い連続性を有するもの(周波数に
軌跡が現れるもの)が楽音の特徴を示す基音および高調
波に対応している。しかし、特に高周波数側の高次の高
調波は、基音の整数倍の倍音位置(周波数値)からずれ
る傾向にあり、このずれの大きさは高次になるほど顕著
に現れている。例えば図1では、分析対象とした楽音の
第14倍音に対応する高調波成分(ピークの軌跡)は基
音周波数に基づいた計算上の第14倍音と第15倍音の
略中間にあり、この計算上の第14倍音の位置にはノイ
ズ成分が現れている。このため従来の方法では、実際の
高調波成分の間にあるノイズ成分等を高調波成分として
ピッキングしてしまうことがある。本発明は、楽音波形
の高調波成分を精度良く抽出することを課題とする。As shown in the figure, the peaks are detected as being dot-like for each frame, having short continuity between frames, and having long continuity between frames. Of these, particularly long continuations are detected. Those having characteristics (those whose locus appears in frequency) correspond to the fundamental and harmonics that are characteristic of musical tones. However, particularly higher harmonics on the high frequency side tend to deviate from an overtone position (frequency value) that is an integral multiple of the fundamental tone, and the magnitude of this deviation becomes more pronounced at higher frequencies. For example, in FIG. 1, the harmonic component (peak locus) corresponding to the 14th overtone of the musical tone to be analyzed is located approximately in the middle between the 14th overtone and the 15th overtone calculated based on the fundamental frequency. A noise component appears at the position of the 14th harmonic. Therefore, in the conventional method, a noise component or the like between actual harmonic components may be picked as a harmonic component. An object of the present invention is to accurately extract a harmonic component of a musical tone waveform.
【0006】[0006]
【課題を解決するための手段】本発明の請求項1記載の
楽音波形分析装置は、楽音波形の周波数スペクトル成分
に基づいて低周波数側の低次の高調波から高周波数側の
高次の高調波にかけて順次高調波成分の周波数を抽出す
る楽音波形分析装置であって、低次の高調波から高次の
高調波にかけて順次高調波成分の周波数を抽出する処理
を行う繰り返し手段と、前記繰り返し手段で第k倍音の
周波数を抽出する際に、第k−1倍音の周波数FP k-1
にk/(k−1)を乗算して該乗算値を第k倍音の周波
数として推定する推定手段と、該推定手段で推定した周
波数と評価対象となるピーク軌跡の周波数F i との差分
を基音FBで除算した値を引数とする関数Funcに、評価
対象となるピーク軌跡の振幅A i を乗算した次式(a)
の評価関数H ki を演算し、該評価関数H ki が最大となる
次数iの周波数F i を第k倍音の周波数として振幅のピ
ークを検出する検出手段と、を備えたことを特徴とす
る。H ki =Func[ |k・FP k-1 /(k−1)−F i |/F
B]・A i …(a) The musical tone waveform analyzer according to claim 1 of the present invention is based on the frequency spectrum component of the musical tone waveform and is based on the low-order harmonics on the low frequency side to the high-order harmonics on the high frequency side. A repeating unit for performing a process of sequentially extracting the frequencies of harmonic components from low-order harmonics to high-order harmonics, which is a musical tone waveform analyzer for sequentially extracting the frequencies of harmonic components by applying waves. At the kth harmonic
When extracting the frequency, the frequency FP k-1 of the k− 1th harmonic
Is multiplied by k / (k-1) and the multiplied value is multiplied by the frequency of the kth harmonic.
Difference between the estimation means for estimating a number, and the frequency F i of the peak trace to be evaluated and the frequency estimated in said estimation means
Is evaluated by a function Func that takes as an argument the value obtained by dividing
The following expression (a) obtained by multiplying the amplitude A i of the target peak locus
Calculating the evaluation function H ki of the evaluation function H ki is maximum
And a detection unit that detects the peak of the amplitude with the frequency F i of the order i as the frequency of the k-th overtone . H ki = Func [│k · FP k-1 / (k-1) -F i | / F
B] · A i (a)
【0007】上記のように構成された請求項1記載の楽
音波形分析装置において、繰り返し手段は、低次の高調
波から高次の高調波にかけて順次高調波成分の周波数を
抽出する処理を行う。推定手段は、前記繰り返し手段で
第k倍音の周波数を抽出する際に、第k−1倍音の周波
数FP k-1 にk/(k−1)を乗算して該乗算値を第k
倍音の周波数として推定し、該推定手段で推定した周波
数と評価対象となるピーク軌跡の周波数F i との差分を
基音FBで除算した値を引数とする関数Funcに、評価対
象となるピーク軌跡の振幅A i を乗算した次式(a)の
評価関数H ki を演算し、該評価関数H ki が最大となる次
数iの周波数F i を第k倍音の周波数として振幅のピー
クを検出する。In the musical tone waveform analyzing apparatus according to claim 1 configured as described above, the repeating means performs a process of sequentially extracting the frequencies of the harmonic components from the low order harmonics to the high order harmonics. The estimating means is the above repeating means.
When extracting the frequency of the kth harmonic, the frequency of the k-1th harmonic
The number FP k-1 is multiplied by k / (k-1) and the multiplication value is multiplied by the k th
It is estimated as the frequency of the overtone, and the difference between the frequency estimated by the estimation means and the frequency F i of the peak locus to be evaluated is calculated.
To the function Func that takes the value divided by the fundamental tone FB as an argument,
Of the following equation (a), which is obtained by multiplying the amplitude A i of the peak locus as an elephant
The evaluation function H ki is calculated, and the evaluation function H ki is maximized next
The peak of the amplitude is detected with the frequency F i of the number i as the frequency of the kth harmonic .
【0008】既に抽出した低次の高調波成分の周波数
は、基音の整数倍の倍音位置からのずれの影響を受けて
いるので、その低次の高調波成分の周波数に基づいて推
定された高次の高調波成分の周波数の推定値(FP k-1
にk/(k−1))も、基音の整数倍の倍音位置からの
ずれの影響を加味したものとなっている。したがって、
基音の整数倍の倍音位置からずれた実際の高調波成分の
周波数(評価関数H ki が最大となる次数iの周波数
F i )を抽出できる。また、評価対象となるピーク軌跡
の振幅A i を加味した評価関数H ki を用いているので高
精度にピークを検出できる。 Since the frequency of the already extracted low-order harmonic component is affected by the deviation from the harmonic overtone position of an integer multiple of the fundamental tone, the high frequency estimated based on the frequency of the low-order harmonic component is detected. Estimated value of the frequency of the next harmonic component (FP k-1
In addition, k / (k-1)) also takes into consideration the influence of the shift from the overtone position of an integer multiple of the fundamental tone. Therefore,
The frequency of the actual harmonic component deviated from the overtone position of an integer multiple of the fundamental tone ( the frequency of the order i at which the evaluation function H ki is maximum).
F i ) can be extracted. Also, the peak locus to be evaluated
High because of the use of the evaluation function H ki in consideration of the amplitude A i
The peak can be detected accurately.
【0009】本発明の請求項2記載の楽音波形分析方法
は、楽音波形の周波数スペクトル成分に基づいて低周波
数側の低次の高調波から高周波数側の高次の高調波にか
けて順次高調波成分の周波数を抽出する楽音波形分析方
法であって、第k倍音の周波数を抽出する際に、第k−
1倍音の周波数FP k-1 にk/(k−1)を乗算して該
乗算値を第k倍音の周波数として推定し、該推定した周
波数と評価対象となるピーク軌跡の周波数F i との差分
を基音FBで除算した値を引数とする関数Funcに、評価
対象となるピーク軌跡の振幅A i を乗算した次式(a)
の評価関数H ki を演算し、該評価関数H ki が最大となる
次数iの周波数F i を第k倍音の周波数として振幅のピ
ークを検出して、高調波成分の周波数を抽出していくこ
とを特徴とする。 H ki =Func[ |k・FP k-1 /(k−1)−F i |/F
B]・A i …(a)
このように構成された請求項2記載の楽音波形分析方法
によれば、請求項1と同様な作用効果が得られる。According to a second aspect of the present invention, there is provided a method for analyzing a musical tone waveform according to the frequency spectrum component of the musical tone waveform, in which harmonic components are sequentially arranged from low-order harmonics on the low frequency side to high-order harmonics on the high frequency side. Is a musical tone waveform analyzing method for extracting the frequency of the k-th harmonic overtone .
The frequency FP k−1 of the first harmonic is multiplied by k / (k−1)
The multiplication value is estimated as the frequency of the kth overtone, and the difference between the estimated frequency and the frequency F i of the peak locus to be evaluated.
Is evaluated by a function Func that takes as an argument the value obtained by dividing
The following expression (a) obtained by multiplying the amplitude A i of the target peak locus
Calculating the evaluation function H ki of the evaluation function H ki is maximum
It is characterized in that the peak of the amplitude is detected by using the frequency F i of the order i as the frequency of the k-th overtone and the frequency of the harmonic component is extracted . H ki = Func [│k · FP k-1 / (k-1) -F i | / F
B] · A i (a) According to the musical tone waveform analysis method of the second aspect configured as described above, the same operational effect as that of the first aspect can be obtained.
【0010】また、本発明の請求項3記載の媒体は、楽
音波形の周波数スペクトル成分に基づいて低周波数側の
低次の高調波から高周波数側の高次の高調波にかけて順
次高調波成分の周波数を抽出する処理をコンピュータで
実行するための楽音波形分析プログラムを記録した媒体
であって、第k倍音の周波数を抽出する際に、第k−1
倍音の周波数FP k-1 にk/(k−1)を乗算して該乗
算値を第k倍音の周波数として推定するとともに、該推
定した周波数と評価対象となるピーク軌跡の周波数F i
との差分を基音FBで除算した値を引数とする関数Func
に、評価対象となるピーク軌跡の振幅A i を乗算した次
式(a)の評価関数H ki を演算し、該評価関数H ki が最
大となる次数iの周波数F i を第k倍音の周波数として
振幅のピークを検出するステップ、を実行する楽音波形
分析プログラムを記録したコンピュータ読み取り可能な
媒体である。 H ki =Func[ |k・FP k-1 /(k−1)−F i |/F
B]・A i …(a)
この請求項3の媒体に記録された楽音波形分析プログラ
ムの実行によれば請求項1と同様な作用効果が得られ
る。According to a third aspect of the present invention, the medium is composed of harmonic components sequentially from the low-order harmonics on the low frequency side to the high-order harmonics on the high frequency side based on the frequency spectrum component of the tone waveform. a recorded medium tone waveform analysis program for executing a process of extracting the frequency with computer, when extracting the frequency of the k-th harmonic, the k-1
The harmonic frequency FP k-1 is multiplied by k / (k-1)
The calculated value is estimated as the frequency of the k-th overtone , and the estimated frequency and the frequency F i of the peak locus to be evaluated are calculated.
Function Func whose argument is the value obtained by dividing the difference between
Is multiplied by the amplitude A i of the peak locus to be evaluated.
The evaluation function H ki of the equation (a) is calculated, and the evaluation function H ki is the maximum.
Step, computer-readable recording the musical sound waveform analysis program for the execution of detecting the peak of <br/> amplitude frequency F i as the frequency of the k harmonic of order i to be large
It is a medium. H ki = Func [│k · FP k-1 / (k-1) -F i | / F
B] · A i (a) By executing the musical tone waveform analysis program recorded on the medium of the third aspect, the same effect as that of the first aspect can be obtained.
【0011】[0011]
【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。図3は本発明の一実施形態の楽音波形分析
装置のブロック図であり、CPUシステム1を備えたパ
ーソナルコンピュータで構成した場合を示している。プ
ログラムメモリ2はハードディスク装置やCD−ROM
装置あるいはその他の外部記憶装置であり、後述説明す
る楽音波形分析プログラムが記憶されている。また、デ
ータメモリ3はRAM等であり、分析対象となる楽音波
形データや分析結果等が記憶される。また、入力装置4
および演奏操作子5はキーボード等であり、ディスプレ
イ6はCRTあるいは液晶表示器等である。さらに、ネ
ットワークインターフェイス7はMIDI、LAN、電
話回線等の各種ネットワーク10に接続するインターフ
ェイスである。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below. FIG. 3 is a block diagram of a musical tone waveform analyzer according to an embodiment of the present invention, and shows a case where the musical tone waveform analyzer is configured by a personal computer including the CPU system 1. The program memory 2 is a hard disk device or a CD-ROM
It is a device or other external storage device, and stores a musical tone waveform analysis program described later. The data memory 3 is a RAM or the like, and stores musical tone waveform data to be analyzed and analysis results. Also, the input device 4
The performance operator 5 is a keyboard or the like, and the display 6 is a CRT or a liquid crystal display. Further, the network interface 7 is an interface connected to various networks 10 such as MIDI, LAN, and telephone lines.
【0012】楽音合成部8は各種LSIチップを搭載し
た音源ボードあるいは音源装置等であり、CPUシステ
ム1に対するインターフェイスである各種レジスタ(FR
DATAレジスタ、 RDATAレジスタ)を備えたCPUインタ
ーフェイス81、複数の正弦波発生回路(SWG1〜S
WGn)を備えた正弦波波形演算部82、後述説明する
残差波形を発生する残差波形発生部83、および、正弦
波波形発生部82の出力と残差波形発生部83の出力を
合成するミキサとこのミキサ出力をアナログ信号に変換
するDAC(ディジタル・アナログ変換器)を備えた合
成変換部84とで構成されている。The tone synthesizer 8 is a tone generator board or tone generator device having various LSI chips mounted thereon, and various registers (FR) which are interfaces to the CPU system 1.
CPU interface 81 with DATA register and RDATA register, multiple sine wave generation circuits (SWG1 to SWG1)
WGn) having a sinusoidal waveform calculation section 82, a residual waveform generation section 83 for generating a residual waveform described later, and an output of the sinusoidal waveform generation section 82 and an output of the residual waveform generation section 83 are combined. It is composed of a mixer and a synthesizing converter 84 including a DAC (digital-analog converter) that converts the mixer output into an analog signal.
【0013】以上の構成により、CPUシステム1はプ
ログラムメモリ2に格納されている波形分析プログラム
に基づいてデータメモリ3の指定された楽音波形データ
についてフーリエ解析により波形分析処理を行い、各フ
レームの周波数データ、振幅データ、位相データ(フレ
ームデータ)等の基本分析データANLDATA を得る。ま
た、この基本分析データANLDATA のフレームデータに基
づいて線スペクトル成分のフーリエ合成を行うととも
に、元波形データとこのフーリエ合成した波形データと
の差分を残差波形データRDATA として求める。そして、
データメモリ3に記憶した基本分析データANLDATA のフ
レームデータと残差波形データRDATA を楽音合成部8に
出力することで、楽音合成部8で楽音波形を合成する。With the above configuration, the CPU system 1 performs the waveform analysis processing by Fourier analysis on the designated musical tone waveform data in the data memory 3 based on the waveform analysis program stored in the program memory 2, and the frequency of each frame. Obtain basic analysis data ANLDATA such as data, amplitude data, phase data (frame data). In addition, the line spectrum component is Fourier-synthesized based on the frame data of the basic analysis data ANLDATA, and the difference between the original waveform data and the Fourier-synthesized waveform data is obtained as residual waveform data RDATA. And
By outputting the frame data of the basic analysis data ANLDATA and the residual waveform data RDATA stored in the data memory 3 to the musical tone synthesizer 8, the musical tone synthesizer 8 synthesizes musical tone waveforms.
【0014】すなわち、楽音合成部8は、CPUインタ
ーフェイス81のFRDATAレジスタに設定されたフレーム
データFRDATAに基づいて、正弦波波形発生部82で線ス
ペクトルの正弦波を合成したフーリエ合成波を発生する
とともに、CPUインターフェイス81の RDATAレジス
タに設定された残差波形データRDATA に基づいて残差波
形発生部83で残差波形を発生し、合成変換部84でフ
ーリエ合成波と残差波形を合成してディジタル・アナロ
グ変換をして楽音信号を発生する。That is, the musical tone synthesizing section 8 generates a Fourier synthetic wave by synthesizing the sine waves of the line spectrum in the sine wave waveform generating section 82 based on the frame data FRDATA set in the FRDATA register of the CPU interface 81. , The residual waveform generation unit 83 generates a residual waveform based on the residual waveform data RDATA set in the RDATA register of the CPU interface 81, and the synthesis conversion unit 84 synthesizes the Fourier synthetic wave and the residual waveform to generate a digital signal.・ Analog conversion is performed to generate a tone signal.
【0015】次に、実施形態における波形分析処理の概
略を説明する。分析対象とする元波形データは楽音波形
の振幅を量子化した時系列なサンプリングデータであ
り、この元波形データに対して窓関数を時間軸上で移動
して切り出した各フレームにおいてフーリエ解析処理を
施し、時系列な各フレーム毎に周波数スペクトルのデー
タを得る。この周波数スペクトルのデータとは、周波数
軸上でのデータとしての周波数、位相および振幅のデー
タである。そして、この周波数スペクトルにおける振幅
のピークを抽出して例えば前掲の図1のような線スペク
トル成分(1フレームの線スペクトルは縦軸上に離散す
る点で構成される。)を得る。なお、この図1では周波
数のデータ(縦軸の値)のみが示されているが、各点に
対応する位相および振幅のデータも同時に記憶してい
る。Next, the outline of the waveform analysis processing in the embodiment will be described. The original waveform data to be analyzed is time-series sampling data in which the amplitude of a musical tone waveform is quantized.For this original waveform data, a Fourier analysis process is performed on each frame cut out by moving the window function on the time axis. The frequency spectrum data is obtained for each time-series frame. The data of the frequency spectrum is data of frequency, phase and amplitude as data on the frequency axis. Then, the peak of the amplitude in this frequency spectrum is extracted to obtain, for example, the line spectrum component as shown in FIG. 1 (the line spectrum of one frame is composed of points scattered on the vertical axis). Although only the frequency data (vertical axis value) is shown in FIG. 1, the phase and amplitude data corresponding to each point are also stored at the same time.
【0016】次に、線スペクトルからフレーム間でピー
クが連続するようなピーク軌跡を検出し、軌跡選択処理
によりピーク軌跡の中から高調波成分に相当するピーク
軌跡を選択する。このとき、図1のような表示画像を見
て高調波成分に相当するピーク軌跡を人が判断すること
は可能であるが、各フレーム毎に対応付けられたフレー
ムデータ(すなわち複数のピークに対応する周波数、位
相および振幅のデータから自動検出する場合に、前記従
来のように、基音の整数倍の倍音位置だけで判断すると
特に高次になるとノイズ成分等を検出してしまう。Next, a peak locus in which peaks are continuous between frames is detected from the line spectrum, and a locus selection process selects a peak locus corresponding to a harmonic component from the peak locus. At this time, although it is possible for a person to determine the peak locus corresponding to the harmonic component by looking at the display image as shown in FIG. 1, the frame data associated with each frame (ie, corresponding to a plurality of peaks). In the case of automatic detection from frequency, phase, and amplitude data, the noise component or the like is detected at a particularly high order if the judgment is made only by the harmonic overtone position of an integer multiple of the fundamental tone as in the conventional case.
【0017】そこで、後述説明する「ハーモニックピッ
キング処理」により、各フレーム毎にそのフレームに対
応するフレームデータから、先ず、ピッチから基音の周
波数のピーク軌跡を求め、次に第2倍音のピーク軌跡を
求め、この求めたピーク軌跡から高次側のピーク軌跡の
位置(周波数値)を順次推定しながら、高次の高調波成
分に対応するピーク軌跡を求める。Therefore, by a "harmonic picking process" which will be described later, first, the peak locus of the frequency of the fundamental tone is obtained from the pitch from the frame data corresponding to that frame, and then the peak locus of the second overtone is obtained. Then, the position (frequency value) of the peak locus on the higher order side is sequentially estimated from the obtained peak locus, and the peak locus corresponding to the higher-order harmonic component is obtained.
【0018】図4は実施形態における分析処理のフロー
チャート、図5〜図7は実施形態におけるハーモニック
ピッキング処理のフローチャートであり、各フローチャ
ートに基づいて実施形態の処理を説明する。なお、以下
の説明および各フローチャートにおいて各レジスタ等を
下記のラベルで表記し、それらの記憶内容は特に断らな
い限り同一のラベルで表す。また、フローチャートにお
いては、見やすくするために添え字を半角文字で表記し
ている。FIG. 4 is a flowchart of the analysis process in the embodiment, and FIGS. 5 to 7 are flowcharts of the harmonic picking process in the embodiment. The process of the embodiment will be described based on each flowchart. In the following description and each flowchart, each register and the like are labeled with the following label, and the stored contents are labeled with the same label unless otherwise specified. In addition, in the flowchart, subscripts are written in half-width characters for easy viewing.
【0019】
m:フレームインデックスのレジスタ
i:ピーク次数インデックスのレジスタ
N:ピーク次数iの最大値(ピーク軌跡の数−1)のレ
ジスタ
M:フレームインデックスの最大値のレジスタ
H1i:基音のピーク軌跡検出時のピーク次数iについて
の評価値のレジスタ
H2i:第2倍音のピーク軌跡検出時のピーク次数iにつ
いての評価値のレジスタ
H3i:第3倍音のピーク軌跡検出時のピーク次数iにつ
いての評価値のレジスタ
Hki:第k倍音のピーク軌跡検出時のピーク次数iにつ
いての評価値のレジスタ
FB:基音のピッチのレジスタ
FP1 :検出した基音の周波数のレジスタ
FP2 :検出した第2倍音の周波数のレジスタ
FP3 :検出した第3倍音の周波数のレジスタ
FPk :検出した第k倍音の周波数のレジスタ
Ai :各フレームにおけるピーク次数iについての振幅
のレジスタM: register of frame index i: register of peak order index N: register of maximum value of peak order i (number of peak loci-1) M: register of maximum value of frame index H 1i : peak locus of fundamental tone Register H 2i of the evaluation value for the peak order i at the time of detection: Register H 3i of the evaluation value for the peak order i when the peak locus of the second overtone is detected H 3i : For the peak order i at the peak locus of the third overtone Register of evaluation value H ki : Register of evaluation value for peak order i at peak locus detection of k-th harmonic FB: Register of pitch of fundamental tone FP 1 : Register of frequency of fundamental tone detected FP 2 : Detected second overtone register frequency FP 3: register FP k of the frequency of the third harmonic detected: the frequency of the k-th harmonic of the detected register a i: Register of the amplitude of the peak order i in frame
【0020】図4の分析処理では、ステップS1で、分
析対象の元波形データを指定する処理や、元波形データ
のピッチが予めわかっている場合にピッチを設定する処
理、第何倍音まで高調波を分析するかなどの分析仕様を
決定する処理など、各種の準備処理を行う。なお、元波
形データのピッチがわかっていない場合は、ステップS
1′でピッチ検出の処理を行う。次に、ステップS2で
元波形データへの窓関数の乗算処理を行ってフレームを
切り出し、ステップS3でSFFT処理(短時間高速フ
ーリエ解析)を行って、ステップS4で元波形データの
全区間の分析が完了したか否かを判定する。完了してい
なければステップS5で窓関数の時間移動(フレームの
時間移動)を行ってステップS2に戻る。In the analysis process of FIG. 4, in step S1, the process of designating the original waveform data to be analyzed, the process of setting the pitch when the pitch of the original waveform data is known in advance, the harmonics up to the harmonic overtone. Various preparatory processes are performed, such as the process of determining analysis specifications such as whether to analyze. If the pitch of the original waveform data is not known, step S
At 1 ', pitch detection processing is performed. Next, in step S2, the window function is multiplied to the original waveform data to cut out a frame, the SFFT process (short-time fast Fourier analysis) is performed in step S3, and the entire section of the original waveform data is analyzed in step S4. Is completed. If not completed, window function time shift (frame time shift) is performed in step S5, and the process returns to step S2.
【0021】全区間の分析が完了すると、ステップS6
で各フレームデータにおける周波数スペクトルの振幅の
ピークを検出するスペクトルピークピッキングの処理を
行い、ステップS7でピークがフレーム間で連続する部
分を検出するピーク軌跡検出処理を行い、ステップS8
で軌跡選択処理を行う。この軌跡選択処理において、後
述説明する図5〜図7のハーモニックピッキング処理を
行う。When the analysis of all sections is completed, step S6
In step S7, spectrum peak picking processing for detecting the peak of the amplitude of the frequency spectrum in each frame data is performed. In step S7, peak locus detection processing for detecting a continuous portion of the peaks between frames is performed.
The trajectory selection processing is performed with. In this trajectory selection process, the harmonic picking process of FIGS. 5 to 7 described later is performed.
【0022】ステップS8の軌跡選択処理が終了すると
基音から高次の高調波成分のフレームデータ(周波数デ
ータ、振幅データ、位相データ)等の基本分析データAN
LDATA が得られるので、ステップS9で基本分析データ
ANLDATA をデータメモリ3に記憶し、ステップS10で
楽音の再合成の処理を行う。この再合成の処理は、基本
分析データのフレームデータ(周波数、位相および振幅
のデータ)に基づいてフレーム時間毎に線スペクトルの
成分波形を生成してフーリエ合成する。次に、ステップ
S11で元波形データと再合成した波形データとの差を
とって残差波形データRDATA とし、ステップS12でこ
の残差波形データRDATA をデータメモリ3に記憶し、分
析処理を終了する。Upon completion of the trajectory selection process in step S8, basic analysis data AN such as frame data (frequency data, amplitude data, phase data) of the fundamental to higher harmonic components
Since LDATA is obtained, basic analysis data is obtained in step S9.
ANLDATA is stored in the data memory 3, and the process of re-synthesizing the musical sound is performed in step S10. In this recombining process, the component waveform of the line spectrum is generated for each frame time based on the frame data (frequency, phase, and amplitude data) of the basic analysis data, and Fourier combining is performed. Next, in step S11, the difference between the original waveform data and the re-synthesized waveform data is calculated to obtain residual waveform data RDATA. In step S12, this residual waveform data RDATA is stored in the data memory 3, and the analysis process ends. .
【0023】以上の処理により、元波形データの分析結
果である基本分析データANLDATA 、および残差波形デー
タRDATA が得られる。そして、この基本分析データANLD
ATAのフレームデータFRDATA を楽音合成部8のFRDATAレ
ジスタ、 RDATAレジスタ(CPUインターフェイス8
1)にぞれぞれ設定することにより、前述のように楽音
合成部8で楽音が再生される。Through the above processing, basic analysis data ANLDATA and residual waveform data RDATA, which are the analysis results of the original waveform data, are obtained. And this basic analysis data ANLD
The ATA frame data FRDATA is used as the FRDATA register and RDATA register (CPU interface 8
By setting each of 1), a musical sound is reproduced by the musical sound synthesizer 8 as described above.
【0024】次に、図5〜図7のハーモニックピッキン
グ処理について説明する。先ず、ステップS20でフレ
ームインデックスmに“1”をセットし、ステップS2
1でピーク次数インデックスiを“0”にリセットし、
ステップS23の判定とステップS24のiのインクリ
メントにより、i=0,1,…,Nの全次数についてス
テップS22の処理を行う。ステップS22では、図8
に示した関数Func[]、基音のピッチFB、ピーク次数i
のピーク軌跡の周波数Fi および振幅Ai により、次式
(1)の評価関数H1iを演算する。
H1i=Func[|FB−Fi|/FB]・Ai …(1)
なお、関数Func[|F−x|/FB]の変数Fには基音の
ピッチFBまたは推定したピーク軌跡の周波数FP1 〜
FPk-1 が代入され、変数xには評価対象となるピーク
軌跡の周波数Fi が代入される。Next, the harmonic picking process of FIGS. 5 to 7 will be described. First, in step S20, "1" is set to the frame index m, and then step S2
At 1, the peak order index i is reset to “0”,
By the determination in step S23 and the increment of i in step S24, the processing in step S22 is performed for all orders of i = 0, 1, ..., N. In step S22, FIG.
Function Func [], fundamental pitch FB, peak order i
The evaluation function H 1i of the following equation (1) is calculated from the frequency F i and the amplitude A i of the peak locus of H 1i = Func [| FB−F i | / FB] · A i (1) Note that the variable F of the function Func [| F−x | / FB] is the pitch FB of the fundamental tone or the frequency of the estimated peak locus. FP 1 ~
FP k−1 is substituted, and the frequency F i of the peak locus to be evaluated is substituted for the variable x.
【0025】以上のH1iの計算を全次数について計算
し、ステップS23でi=Nとなると、ステップS25
でH1iが最大となる次数iの周波数Fi を決定してFP
1 として記憶し、ステップS26に進む。すなわち、こ
のFP1 は基音のピッチFBから線スペクトルのデータ
に基づいて決定された基本周波数となる。The above calculation of H 1i is performed for all orders, and when i = N in step S23, step S25
And determine the frequency Fi of order i that maximizes H 1i at
It is stored as 1 , and the process proceeds to step S26. That is, this FP 1 becomes a fundamental frequency determined based on the line spectrum data from the pitch FB of the fundamental tone.
【0026】ステップS26以降は、第2倍音以降の高
次の高調波の周波数を決定する処理であり、ステップS
21〜S25と同様に、ピーク次数インデックスiのリ
セット(ステップS26,S31,S36)、iのイン
クリメント(ステップS29,S34,S39)および
Nとの判定処理(ステップS28,S33,S38)に
より、評価関数の演算(ステップS27,S32,S3
7)を全次数について計算する。Steps S26 and thereafter are processings for determining the frequencies of higher harmonics of the second and subsequent harmonics.
Similar to 21 to S25, the peak order index i is reset (steps S26, S31, S36), i is incremented (steps S29, S34, S39), and N is determined (steps S28, S33, S38) to evaluate. Function calculation (steps S27, S32, S3
7) is calculated for all orders.
【0027】すなわち、ステップS27では、ステップ
S25で決定した基本周波数FP1を用いて次式(2)
の評価関数H2iを演算する。
H2i=Func[ |2・FP1 −Fi |/FB ]・Ai …(2)
そして、H2iの計算を全次数について計算し、ステップ
S28でi=Nとなると、ステップS30で、H2iが最
大となる次数iの周波数Fi を決定してFP2として記
憶し、図6のステップS31に進む。すなわち、このF
P2 は基音周波数FP1 から線スペクトルのデータに基
づいて決定された第2倍音に対応する高調波の周波数と
なる。That is, in step S27, using the fundamental frequency FP 1 determined in step S25, the following equation (2)
The evaluation function H 2i of H 2i = Func [| 2 · FP 1 −F i | / FB] · A i (2) Then, H 2i is calculated for all orders, and when i = N in step S 28, in step S 30, The frequency F i of the order i that maximizes H 2i is determined and stored as FP 2 , and the process proceeds to step S31 in FIG. That is, this F
P 2 is a harmonic frequency corresponding to the second overtone determined from the fundamental frequency FP 1 based on the data of the line spectrum.
【0028】また、図6のステップS32では、上記第
2倍音に対応する高調波の周波数FP2 を用いて次式
(3)の評価関数H3iを演算する。
H3i=Func[ |3・FP2 /2−Fi |/FB ]・Ai …(3)
そして、H3iの計算を全次数について計算し、ステップ
S33でi=Nとなると、ステップS35で、H3iが最
大となる次数iの周波数Fi を決定してFP3として記
憶し、ステップS36に進む。すなわち、このFP3 は
第2倍音に対応する高調波の周波数FP2 から線スペク
トルのデータに基づいて決定された第3倍音に対応する
高調波の周波数となる。In step S32 of FIG. 6, the evaluation function H 3i of the following equation (3) is calculated using the frequency FP 2 of the harmonic corresponding to the second overtone. H 3i = Func [| 3 · FP 2 / 2-F i | / FB] · A i (3) Then, H 3i is calculated for all orders, and when i = N in step S 33, step S 35 Then, the frequency F i of the order i that maximizes H 3i is determined and stored as FP 3 , and the process proceeds to step S36. That is, this FP 3 becomes the frequency of the harmonic corresponding to the third overtone determined from the frequency FP 2 of the harmonic corresponding to the second overtone based on the data of the line spectrum.
【0029】以下同様の処理を順次高次の倍音に対して
行い、一般に第k倍音についての処理をステップS37
で行う。すなわち、ステップS37では、第k−1倍音
に対応する高調波の周波数FPk-1 を用いて次式(4)
の評価関数Hkiを演算する。Hki=Func[ |k・FP
k-1 /(k−1)−Fi |/FB]・Ai …(4)そし
て、Hkiの計算を全次数について計算し、ステップS3
8でi=Nとなると、ステップS40で、Hkiが最大と
なる次数iの周波数Fi を決定してFPkとして記憶
し、図7のステップS41に進む。すなわち、このFP
k は第k−1倍音に対応する高調波の周波数FPk-1 か
ら線スペクトルのデータに基づいて決定された第k倍音
に対応する高調波の周波数となる。Thereafter, the same processing is sequentially performed for the higher harmonics, and the processing for the kth harmonic is generally performed in step S37.
Done in. That is, in step S37, using the frequency FP k−1 of the harmonic corresponding to the k−1 th harmonic, the following equation (4)
Of the evaluation function H ki of H ki = Func [| k ・ FP
k-1 / (k-1) -F i | / FB] · A i (4) Then, the calculation of H ki is calculated for all orders, and step S3
When i = N in 8, the frequency F i of the order i that maximizes H ki is determined and stored as FP k in step S40, and the process proceeds to step S41 in FIG. That is, this FP
k is the frequency of the harmonic corresponding to the k-th overtone determined from the frequency FP k-1 of the harmonic corresponding to the k−1-th overtone based on the data of the line spectrum.
【0030】ここで、低次の高調波から推定した高次の
高調波の周波数の推定値とは、例えば式(4)では絶対
値記号内の第1項の“k・FPk-1 /(k−1)”に対
応し、この推定した周波数の近傍における振幅のピーク
を検出する処理とは、“Hkiが最大となる次数iの周波
数Fi を決定してFPk とする処理”に対応している。
なお、図5,図6のフローチャートは、基本周波数、第
2倍音、第3倍音の処理の後に第2倍音以降に適用でき
る一般化した処理として第k倍音についての処理を示し
ているが、実際のプログラムでは、適当な変数を用いた
ループ処理により第k倍音についての処理を第2倍音以
降に適用するようにしてもよい。Here, the estimated value of the higher harmonic frequency estimated from the lower harmonic is, for example, in equation (4), "k · FP k-1 /" in the first term in the absolute value symbol. Corresponding to (k-1) "and detecting the peak of the amplitude in the vicinity of the estimated frequency is" processing to determine the frequency F i of the order i that maximizes H ki and set it as FP k ". It corresponds to.
The flowcharts of FIGS. 5 and 6 show the process for the kth overtone as a generalized process that can be applied after the second overtone after the process of the fundamental frequency, the second overtone, and the third overtone. In the program, the process for the kth overtone may be applied to the second and subsequent overtones by a loop process using an appropriate variable.
【0031】以上の処理は一つのフレームについての処
理であり、図7のステップS41で、“m=M”である
か否かすなわちフレームインデックスmが最大値Mにな
ったか否かを判定し、“m=M”でなければステップS
42でフレームインデックスmをインクリメントしてス
テップS21(図5)に戻り、次のフレームについての
処理を行う。“m=M”であれば、ステップS43でフ
レーム毎に周波数が[FPk ]m (m=1〜M)である
各次数kである成分を第k倍音のピークとして選択す
る。そして、ステップS44で各フレームのフレームデ
ータFRDATAについて倍音のピークから外れた線スペクト
ルのデータを削除するなど、FRDATA編集処理を行い、処
理を終了する。The above processing is for one frame. In step S41 of FIG. 7, it is determined whether "m = M", that is, whether the frame index m reaches the maximum value M, If not "m = M", step S
At 42, the frame index m is incremented, the process returns to step S21 (FIG. 5), and the process for the next frame is performed. If "m = M", in step S43, a component of each order k whose frequency is [FP k ] m (m = 1 to M) is selected for each frame as the peak of the kth overtone. Then, in step S44, the FRDATA editing process is performed, such as deleting the line spectrum data deviating from the peak of the overtone in the frame data FRDATA of each frame, and the process ends.
【0032】図2は図1の線スペクトル成分についてハ
ーモニックピッキング処理を施した場合のフレームデー
タFRDATAの周波数データ、およびこのフレームデータFR
DATAに基づいてフーリエ合成した波形を示す図である。
なお、この図2では時間軸(横軸)の倍率を図1の2倍
に拡大してある。図のように、周波数が高くなるほど、
すなわち高次の倍音ほど基音周波数の単純整数倍の周波
数位置からずれていくような特性を持った楽音の高調波
成分のピーク軌跡を検出することができ、不要なノイズ
成分も除去することができる。FIG. 2 shows the frequency data of the frame data FRDATA when the harmonic picking processing is applied to the line spectrum components of FIG. 1 and the frame data FR.
It is a figure which shows the waveform which carried out the Fourier synthesis based on DATA.
Note that, in FIG. 2, the magnification on the time axis (horizontal axis) is enlarged to twice that of FIG. As the figure shows, the higher the frequency,
That is, it is possible to detect a peak locus of a harmonic component of a musical tone having a characteristic that higher harmonic overtones deviate from a frequency position that is a simple integer multiple of the fundamental frequency, and unnecessary noise components can be removed. .
【0033】以上の実施形態では、ステップS10のフ
レームデータに基づく楽音の再合成の処理をソフトウエ
アで行うようにしているが、図3の楽音合成部8に破線
で示したように、フレームデータFRDATAを楽音合成部8
に出力して正弦波波形演算部82でフーリエ合成した波
形を出力し、その出力を取り込んでステップS11で元
波形データとの差をとって残差波形データRDATA を得る
ようにしてもよい。In the above embodiment, the process of re-synthesizing the musical tone based on the frame data in step S10 is performed by software. However, as shown by the broken line in the musical tone synthesizing section 8 in FIG. FRDATA is a musical sound synthesizer 8
Alternatively, the sine wave waveform calculation unit 82 may output a waveform that has been Fourier-combined, and the output may be fetched to obtain the residual waveform data RDATA by calculating the difference from the original waveform data in step S11.
【0034】また、以上の実施形態では、フレームデー
タFRDATAと残差波形データRDATA 残差を楽音合成部8に
設定することで合成音を発生するようにしているが、図
9にフローチャートを示したように、ソフトウエアで処
理してもよい。この図9の合成音発生処理は、先ず、ス
テップS50で演奏操作子5等により発音指示があるか
を監視し、発音指示があればステップS51以降の処理
を行う。ステップS51では、基本分析データANLDATA
のフレームデータFRDATAに基づいてフレーム時間毎に線
スペクトルの成分波形を生成して合成し、レジスタS
P.wavに格納し、ステップS52で、残差波形データRD
ATA に基づいて現フレームあるいは発音開始からの時間
に対応した残差波形を再生し、レジスタRS.wavに格納
する。そして、ステップS53でRS.wavとRS.wavを
加算して楽音波形として出力し、ステップS54で発音
終了であるか否かを判定する。発音終了でなければステ
ップS55でフレーム更新のタイミングであるかを判定
し、フレーム更新のタイミングでなければステップS5
1に戻り、フレーム更新のタイミングであればステップ
S56でフレームを更新してステップS51に戻る。ま
た、発音終了であればステップS57で消音処理を行っ
て処理を終了する。なお、発音する楽音のピッチを変更
するには、フレームデータFRDATAの各線スペクトル成分
の周波数を制御すればよい。Further, in the above embodiment, the synthetic sound is generated by setting the frame data FRDATA and the residual waveform data RDATA residual in the musical sound synthesizing section 8, but a flow chart is shown in FIG. Thus, it may be processed by software. In the synthetic sound generation process of FIG. 9, first, in step S50, it is monitored whether or not there is a sounding instruction by the performance operator 5, etc., and if there is a sounding instruction, the processing of step S51 and thereafter is performed. In step S51, basic analysis data ANLDATA
A line spectrum component waveform is generated and synthesized for each frame time based on the frame data FRDATA of
P.wav, and in step S52, residual waveform data RD
Based on ATA, the residual waveform corresponding to the current frame or the time from the start of sound generation is reproduced and stored in the register RS.wav. Then, in step S53, RS.wav and RS.wav are added and output as a musical tone waveform, and in step S54, it is determined whether or not the sound generation ends. If the pronunciation has not ended, it is determined in step S55 whether it is the frame update timing.
Returning to step 1, if it is the frame update timing, the frame is updated in step S56 and the process returns to step S51. If the sound generation ends, the mute processing is performed in step S57 and the processing ends. Note that the frequency of each line spectrum component of the frame data FRDATA may be controlled in order to change the pitch of the generated musical sound.
【0035】以上の実施形態では、基本周波数FP1 を
求める際に全てのピーク次数について評価関数H1iを計
算するようにしているが、計算の高速化のために、明ら
かに基本周波数を示すピークではないと判断されるピー
クに関しては計算しなくてもよい。例えば
FB/2<Fi <FB・2
の範囲内に入っているピークのみ計算すればよい。同様
に、一般に評価関数Hkiを計算するときは、
FPk-1 /<Fi <(k+1)・FPk-1 /(k−1)
の範囲内に入るピークのみ計算すればよい。In the above embodiment, the evaluation function H 1i is calculated for all peak orders when the fundamental frequency FP 1 is calculated. However, in order to speed up the calculation, the peak clearly showing the fundamental frequency is calculated. It is not necessary to calculate the peaks that are determined not to be. For example, only the peaks within the range of FB / 2 <F i <FB · 2 may be calculated. Similarly, when calculating the evaluation function H ki , generally, only the peaks falling within the range of FP k−1 / <F i <(k + 1) · FP k−1 / (k−1) need be calculated.
【0036】また、例えば奇数次の倍音のみを持つよう
な波形など、途中の倍音が欠けているような波形データ
があり得るので、評価関数Hkiの最小値を決めておき、
最大の評価関数Hkiの値が最小値以下である場合にはそ
の第k倍音は無いものとすればよい。そして、第k倍音
が無い場合の第k+1倍音の周波数の推定値としては、
第k−1倍音の周波数FPk-1 を用いて(k+1)・F
Pk-1 /(k−1)を推定値とする。また、基音が無い
ような波形の場合には、その上の次数、例えば第2倍音
からピーク軌跡の評価を行えばよい。この場合には第2
倍音の周波数の推定値を2・FBとする。Further, since there may be waveform data in which halftones in the middle are missing, such as a waveform having only odd-numbered harmonics, the minimum value of the evaluation function H ki is determined,
If the value of the maximum evaluation function H ki is less than or equal to the minimum value, the kth harmonic should not be present. Then, as the estimated value of the frequency of the (k + 1) th overtone when there is no kth overtone,
(K + 1) · F using the frequency FP k−1 of the k−1 th harmonic
Let P k-1 / (k-1) be the estimated value. In the case of a waveform with no fundamental tone, the peak locus may be evaluated from the order above that, for example, the second overtone. In this case the second
The estimated value of the overtone frequency is 2 · FB.
【0037】また、ピッチより周波数の低い低調波が含
まれているような波形もある。例えば図1のピアノの楽
音のピークデータでも0.5・BF(BFはピッチ)の
近辺にピーク軌跡が現れている。このような場合に低調
波も含めてピッキングしたい場合には、前記処理のFB
を0.5・FBに置き換えればよい。すなわち基音が
0.5FBであるとして評価すればよい。この場合に
は、第3,5,7倍音は見付からなくなるが、前述のよ
うに、第k倍音が無い場合の第k+1倍音の周波数の推
定値を(k+1)・FPk-1 /(k−1)とする処理に
より対応できる。There is also a waveform that includes subharmonics whose frequency is lower than the pitch. For example, even in the peak data of the musical tone of the piano shown in FIG. 1, a peak locus appears near 0.5 · BF (BF is the pitch). In such a case, if picking including subharmonic is desired, FB of the above processing
Should be replaced with 0.5 · FB. That is, it may be evaluated that the fundamental tone is 0.5 FB. In this case, the 3rd, 5th, and 7th overtones are not found, but as described above, the estimated value of the frequency of the k + 1th overtone in the absence of the kth overtone is (k + 1) · FP k−1 / (k− This can be dealt with by the process 1).
【0038】以上のように、高次の高調波の周波数を推
定するためには、1次下の次数に基づいて推定するもの
に限らず、推定する次数よりも低次であればよい。な
お、1次下の次数に基づいて推定するのが好ましい。As described above, in order to estimate the frequency of the higher-order harmonic, it is not limited to the estimation based on the order below the first order, but any order lower than the estimated order may be used. Note that it is preferable to make an estimation based on the order that is one order lower.
【0039】また、実施形態では波形分析後に波形の合
成、楽音の発生等を行うようにしているが、本発明は波
形分析に関するものであり、波形の合成や楽音の発生等
の処理の有無に限定されるものではない。また、残差波
形データの生成もしなくてもよい。In the embodiment, the waveforms are synthesized and the musical sounds are generated after the waveforms are analyzed. However, the present invention relates to the waveform analysis. It is not limited. Further, the residual waveform data may not be generated.
【0040】上記の実施形態では、楽音波形分析プログ
ラムがプログラムメモリ2に予め記憶されている場合に
ついて説明したが、これに限らず次のようにしてもよ
い。例えば、CD−ROMに楽音波形分析プログラムを
記録しておき、CD−ROM装置から楽音波形分析プロ
グラムをハードディスクにロードする。そして、CPU
システム1が、このハードディスクの楽音波形分析プロ
グラムをRAM等に展開し、このRAMのプログラムに
基づいて前記実施形態同様に楽音波形分析の動作を制御
する。これにより、プログラムメモリ2に楽音波形分析
プログラムを記憶している場合と同様の動作をCPUに
させることができる。このようにすると、楽音波形分析
プログラムの新規インストールや追加あるいはバージョ
ンアップ等が容易に行える。また、フロッピディスク、
磁気ディスク(MO)等に楽音波形分析プログラムを記
録しておいて、RAMあるいはハードディスクに供給す
るようにしてもよい。In the above embodiment, the case where the musical tone waveform analysis program is stored in the program memory 2 in advance has been described, but the present invention is not limited to this, and may be performed as follows. For example, the musical tone waveform analysis program is recorded in a CD-ROM, and the musical tone waveform analysis program is loaded from the CD-ROM device to the hard disk. And CPU
The system 1 develops the musical tone waveform analysis program of the hard disk in the RAM or the like, and controls the operation of the musical tone waveform analysis as in the above-described embodiment based on the program of the RAM. As a result, the CPU can be caused to perform the same operation as when the musical tone waveform analysis program is stored in the program memory 2. In this way, new installation, addition, or version upgrade of the musical tone waveform analysis program can be easily performed. Also, a floppy disk,
The musical tone waveform analysis program may be recorded on a magnetic disk (MO) or the like and supplied to the RAM or the hard disk.
【0041】また、ネットワークインターフェース7を
利用し、楽音波形分析プログラムをダウンロードするよ
うにしてもよい。この場、例えば、LAN(ローカルエ
リアネットワーク)やインターネットあるいは電話回線
等のネットワーク10に接続し、該ネットワーク10を
介して、サーバコンピュータから楽音波形分析プログラ
ムの配信を受けることにより、それをハードディスクに
記録してダウンロードが完了する。The network interface 7 may be used to download the musical tone waveform analysis program. In this case, for example, by connecting to a network 10 such as a LAN (local area network), the Internet, or a telephone line, and receiving the distribution of the musical tone waveform analysis program from the server computer via the network 10, it is recorded on the hard disk. Then the download is completed.
【0042】本発明は上記実施形態のようなパーソナル
コンピュータに限らず、鍵盤式の電子楽器、音源装置、
シーケンサ、エフェクタなどそれぞれが別体の装置であ
って、MIDIあるいは各種ネットワーク等の通信手段
を用いて各装置を接続するようなものであってもよい。The present invention is not limited to the personal computer as in the above embodiment, but may be a keyboard type electronic musical instrument, sound source device,
A sequencer, an effector, and the like may be separate devices, and each device may be connected using communication means such as MIDI or various networks.
【0043】なお、以上の実施形態で説明したような楽
音波形分析プログラムが記録された媒体、すなわちRO
M、RAM、ハードディスク、CD−ROM、光磁気デ
ィスク、DVD(デジタル多目的ディスク)あるいはネ
ットワークのサーバコンピュータなど配信先の記憶装置
は、本発明の請求項3の楽音波形分析プログラムを記録
した媒体に相当する。The medium in which the musical tone waveform analysis program as described in the above embodiment is recorded, that is, RO
The storage device of the delivery destination such as M, RAM, hard disk, CD-ROM, magneto-optical disk, DVD (digital multipurpose disk) or network server computer corresponds to the medium recording the musical tone waveform analysis program of claim 3 of the present invention. To do.
【0044】[0044]
【発明の効果】以上説明したように、本発明の請求項1
記載の楽音波形分析装置または請求項2記載の楽音波形
分析方法または請求項3の媒体に記録された楽音波形分
析プログラムの実行によればによれば、第k倍音の周波
数を抽出する際に、第k−1倍音の周波数FP k-1 にk
/(k−1)を乗算して該乗算値を第k倍音の周波数と
して推定し、該推定した周波数と評価対象となるピーク
軌跡の周波数F i との差分を基音FBで除算した値を引
数とする関数Funcに、評価対象となるピーク軌跡の振幅
A i を乗算した評価関数H ki を演算し、該評価関数H ki
が最大となる次数iの周波数F i を第k倍音の周波数と
して振幅のピークを高調波成分の周波数として検出する
ようにしたので、基音の整数倍の倍音位置からずれた実
際の高調波成分の周波数を抽出でき、楽音波形の高調波
成分を精度良く抽出することができる。As described above, according to the first aspect of the present invention.
According to the musical tone waveform analyzing apparatus described above, the musical tone waveform analyzing method according to claim 2, or the musical tone waveform analyzing program recorded on the medium according to claim 3, the frequency of the k-th harmonic is
When extracting the number , k is added to the frequency FP k-1 of the k−1 th harmonic.
/ (K-1) and multiply the product by the frequency of the kth harmonic.
Peak was estimated, it is evaluated and frequencies the estimated
Subtract the value obtained by dividing the difference between the locus frequency F i and the fundamental frequency FB.
The function Func that is a number, and the amplitude of the peak locus to be evaluated
The evaluation function H ki multiplied by A i is calculated, and the evaluation function H ki is calculated.
The frequency of the k-th harmonic frequency F i of order i which maximizes but
Since the peak of the amplitude is detected as the frequency of the harmonic component, the frequency of the actual harmonic component that is deviated from the harmonic overtone position of an integer multiple of the fundamental tone can be extracted, and the harmonic component of the musical tone waveform can be accurately extracted. can do.
【図1】本発明の一実施形態および従来の課題を説明す
るピアノの楽音の周波数スペクトルを示す図である。FIG. 1 is a diagram showing a frequency spectrum of a musical sound of a piano for explaining an embodiment of the present invention and a conventional problem.
【図2】図1のスペクトル成分について実施形態のハー
モニックピッキング処理を施した結果および合成した波
形を示す図である。FIG. 2 is a diagram showing a result of performing the harmonic picking process of the embodiment on the spectral components of FIG. 1 and a synthesized waveform.
【図3】実施形態の楽音波形分析装置のブロック図であ
る。FIG. 3 is a block diagram of the musical tone waveform analyzer of the embodiment.
【図4】実施形態における分析処理のフローチャートで
ある。FIG. 4 is a flowchart of analysis processing according to the embodiment.
【図5】実施形態におけるハーモニックピッキング処理
のフローチャートの一部である。FIG. 5 is a part of a flowchart of harmonic picking processing in the embodiment.
【図6】実施形態におけるハーモニックピッキング処理
のフローチャートの他の一部である。FIG. 6 is another part of the flowchart of the harmonic picking process in the embodiment.
【図7】実施形態におけるハーモニックピッキング処理
のフローチャートのさらに他の一部である。FIG. 7 is still another part of the flowchart of the harmonic picking process in the embodiment.
【図8】実施形態における評価関数を算出するための関
数Func[]を示す図である。FIG. 8 is a diagram showing a function Func [] for calculating an evaluation function in the embodiment.
【図9】実施形態における合成楽音発生処理のフローチ
ャートである。FIG. 9 is a flowchart of a synthetic tone generation process in the embodiment.
1…CPUシステム、2…プログラムメモリ、3…デー
タメモリ、8…楽音合成部。1 ... CPU system, 2 ... program memory, 3 ... data memory, 8 ... tone synthesis section.
Claims (3)
いて低周波数側の低次の高調波から高周波数側の高次の
高調波にかけて順次高調波成分の周波数を抽出する楽音
波形分析装置であって、 低次の高調波から高次の高調波にかけて順次高調波成分
の周波数を抽出する処理を行う繰り返し手段と、 前記繰り返し手段で第k倍音の周波数を抽出する際に、
第k−1倍音の周波数FP k-1 にk/(k−1)を乗算
して該乗算値を第k倍音の周波数として推定する推定手
段と、該推定手段で 推定した周波数と評価対象となるピーク軌
跡の周波数F i との差分を基音FBで除算した値を引数
とする関数Funcに、評価対象となるピーク軌跡の振幅A
i を乗算した次式(a)の評価関数H ki を演算し、該評
価関数H ki が最大となる次数iの周波数F i を第k倍音
の周波数として振幅のピークを検出する検出手段と、を
備えたことを特徴とする楽音波形分析装置。H ki =Func[ |k・FP k-1 /(k−1)−F i |/F
B]・A i …(a) 1. A musical tone waveform analyzer for sequentially extracting frequencies of harmonic components from low-order harmonics on the low frequency side to high-order harmonics on the high frequency side based on the frequency spectrum components of the musical tone waveform. A repeating means for sequentially extracting frequencies of harmonic components from low-order harmonics to high-order harmonics; and when extracting the frequency of the kth harmonic by the repeating means,
Multiply the frequency FP k-1 of the k-1 th harmonic by k / (k-1)
To an estimation means for estimating a multiplication value as the frequency of the k-th harmonic, peak trajectories to be evaluated and the frequency estimated in said estimation means
The argument is the value obtained by dividing the difference from the trace frequency F i by the fundamental tone FB.
To the function Func that is the amplitude A of the peak locus to be evaluated
The evaluation function H ki of the following expression (a) multiplied by i is calculated, and the evaluation
The frequency F i of order i that maximizes the valence function H ki is set to the kth harmonic
And a detecting means for detecting the peak of the amplitude as the frequency of the musical tone waveform analyzer. H ki = Func [│k · FP k-1 / (k-1) -F i | / F
B] · A i (a)
いて低周波数側の低次の高調波から高周波数側の高次の
高調波にかけて順次高調波成分の周波数を抽出する楽音
波形分析方法であって、第k倍音の周波数を 抽出する際に、第k−1倍音の周波
数FP k-1 にk/(k−1)を乗算して該乗算値を第k
倍音の周波数として推定し、 該推定した周波数と評価対象となるピーク軌跡の周波数
F i との差分を基音FBで除算した値を引数とする関数
Funcに、評価対象となるピーク軌跡の振幅A i を乗算し
た次式(a)の評価関数H ki を演算し、該評価関数H ki
が最大となる次数iの周波数F i を第k倍音の周波数と
して振幅のピークを検出して、高調波成分の周波数を抽
出していくことを特徴とする楽音波形分析方法。H ki =Func[ |k・FP k-1 /(k−1)−F i |/F
B]・A i …(a) 2. A musical tone waveform analysis method for sequentially extracting frequencies of harmonic components from low-order harmonics on the low frequency side to high-order harmonics on the high frequency side based on frequency spectrum components of the musical tone waveform. , when extracting the frequency of the k-th harmonic, frequency of the k-1 overtone
The number FP k-1 is multiplied by k / (k-1) and the multiplication value is multiplied by the k th
Estimated as the overtone frequency, the estimated frequency and the frequency of the peak locus to be evaluated
A function that takes as an argument the value obtained by dividing the difference from F i by the fundamental tone FB
Multiply Func by the amplitude A i of the peak locus to be evaluated.
And it calculates the evaluation function H ki of the formula (a), the evaluation function H ki
The frequency of the k-th harmonic frequency F i of order i which maximizes but
Then, the peak of the amplitude is detected, and the frequency of the harmonic component is extracted. H ki = Func [│k · FP k-1 / (k-1) -F i | / F
B] · A i (a)
いて低周波数側の低次の高調波から高周波数側の高次の
高調波にかけて順次高調波成分の周波数を抽出する処理
をコンピュータで実行するための楽音波形分析プログラ
ムを記録した媒体であって、第k倍音の周波数を 抽出する際に、第k−1倍音の周波
数FP k-1 にk/(k−1)を乗算して該乗算値を第k
倍音の周波数として推定するとともに、該推定した周波
数と評価対象となるピーク軌跡の周波数F i との差分を
基音FBで除算した値を引数とする関数Funcに、評価対
象となるピーク軌跡の振幅A i を乗算した次式(a)の
評価関数H ki を演算し、該評価関数H ki が最大となる次
数iの周波数F i を第k倍音の周波数として振幅のピー
クを検出するステップ、を実行する楽音波形分析プログ
ラムを記録したコンピュータ読み取り可能な媒体。H ki =Func[ |k・FP k-1 /(k−1)−F i |/F
B]・A i …(a) 3. A computer executes a process of sequentially extracting the frequencies of the harmonic components from the low-order harmonics on the low frequency side to the high-order harmonics on the high frequency side based on the frequency spectrum components of the musical tone waveform. a recorded medium tone waveform analysis program, when extracting the frequency of the k-th harmonic, frequency of the k-1 overtone
The number FP k-1 is multiplied by k / (k-1) and the multiplication value is multiplied by the k th
The frequency of the overtone is estimated , and the difference between the estimated frequency and the frequency F i of the peak locus to be evaluated is calculated.
To the function Func that takes the value divided by the fundamental tone FB as an argument,
Of the following equation (a), which is obtained by multiplying the amplitude A i of the peak locus as an elephant
The evaluation function H ki is calculated, and the evaluation function H ki is maximized next
The number i of the frequency F i of steps, a computer readable medium storing tone waveform analysis program that performs for detecting a peak amplitude as the frequency of the k-th harmonic. H ki = Func [│k · FP k-1 / (k-1) -F i | / F
B] · A i (a)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11343598A JP3454147B2 (en) | 1998-04-23 | 1998-04-23 | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11343598A JP3454147B2 (en) | 1998-04-23 | 1998-04-23 | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11305778A JPH11305778A (en) | 1999-11-05 |
JP3454147B2 true JP3454147B2 (en) | 2003-10-06 |
Family
ID=14612158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11343598A Expired - Lifetime JP3454147B2 (en) | 1998-04-23 | 1998-04-23 | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3454147B2 (en) |
-
1998
- 1998-04-23 JP JP11343598A patent/JP3454147B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH11305778A (en) | 1999-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2906970B2 (en) | Sound analysis and synthesis method and apparatus | |
US7659472B2 (en) | Method, apparatus, and program for assessing similarity of performance sound | |
EP1696419B1 (en) | Sound effecter, fundamental tone extraction method, and computer program | |
US8853516B2 (en) | Audio analysis apparatus | |
JP3797283B2 (en) | Performance sound control method and apparatus | |
JP3251555B2 (en) | Signal analyzer | |
JP3454147B2 (en) | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable medium recording musical sound waveform analysis program | |
JP3775319B2 (en) | Music waveform time stretching apparatus and method | |
JP3801029B2 (en) | Performance information generation method, performance information generation device, and program | |
JP3644296B2 (en) | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable recording medium recording a musical sound waveform analysis program | |
JPH01219634A (en) | Automatic score taking method and apparatus | |
JP3521821B2 (en) | Musical sound waveform analysis method and musical sound waveform analyzer | |
von Coler | Statistical Sinusoidal Modeling for Expressive Sound Synthesis | |
JP5163606B2 (en) | Speech analysis / synthesis apparatus and program | |
JP2002278544A (en) | Transcription method and transcription system | |
JP3767236B2 (en) | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable recording medium recording a musical sound waveform analysis program | |
JP3744315B2 (en) | Waveform analysis method and waveform analysis apparatus | |
JP4625934B2 (en) | Sound analyzer and program | |
JP4625935B2 (en) | Sound analyzer and program | |
Castells-Rufas | Key detection evaluation by using variable window castells-galin transform method (VCGT) | |
JPH11143460A (en) | Method for separating, extracting by separating, and removing by separating melody included in musical performance | |
JP2005208627A (en) | Speech analysis and synthesis device, and program thereof | |
JP2001134269A (en) | Acoustic signal analysis method | |
JP3304709B2 (en) | Music signal analysis method | |
EP2043089B1 (en) | Method and device for humanizing music sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030624 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080725 Year of fee payment: 5 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100725 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100725 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130725 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term |