JPH05127668A - Automatic transcription device - Google Patents

Automatic transcription device

Info

Publication number
JPH05127668A
JPH05127668A JP29167891A JP29167891A JPH05127668A JP H05127668 A JPH05127668 A JP H05127668A JP 29167891 A JP29167891 A JP 29167891A JP 29167891 A JP29167891 A JP 29167891A JP H05127668 A JPH05127668 A JP H05127668A
Authority
JP
Japan
Prior art keywords
frequency
cpu
resolution
time
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP29167891A
Other languages
Japanese (ja)
Inventor
Shigeaki Komatsu
慈明 小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP29167891A priority Critical patent/JPH05127668A/en
Publication of JPH05127668A publication Critical patent/JPH05127668A/en
Pending legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

PURPOSE:To provide the automatic transcription device with high precision by taking an analysis so that frequency resolution is high in a low-frequency range and time resolution is high in a high-frequency range. CONSTITUTION:A CPU performs a frequency analyzing process for a music signal, which is sampled and stored in a RAM by an A/D conversion device, by wavelet conversion (S1). Then the output value of the wavelet conversion is inputted and a fundamental frequency component is extracted (S2); and note information such as MIDI codes is generated according to the frequency channel, intensity, start time, and end time of the fundamental frequency component and outputted on a display (S3).

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音響的な楽曲信号に対
して周波数分析を行なう自動採譜装置に係わり、特にそ
の周波数分析処理に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an automatic music transcription device for performing frequency analysis on an acoustic music signal, and more particularly to its frequency analysis processing.

【0002】[0002]

【従来の技術】従来、この種の自動採譜装置は図1に示
すように構成されていた。オーディオ・アンプ1は演奏
された楽曲信号を入力とし、この信号を適切な電圧値に
増幅する。ローパス・フィルター2はオーディオ・アン
プ1により増幅された信号における5.5kHz以下の
周波数成分のみを通過させることにより、標本化時の折
返し歪を抑えている。A/D変換装置3は、ローパス・
フィルター通過信号を、サンプリング周波数12kH
z、16ビットのディジタル信号に変換する。I/Oポ
ート4はCPU5とA/D変換装置3、ディスプレイ8
とを接続している。CPU5は楽曲信号データの周波数
分析処理、基本周波数成分の抽出処理、符号化処理等を
行ない、RAM6、及びROM7に接続されている。前
記RAM6には、A/D変換装置3により標本化された
楽曲信号データ、CPU5により処理された周波数分析
結果等が格納されるエリアが用意されている。前記RO
M7には、周波数分析ロジック、基本周波数成分抽出ロ
ジック、符号化処理ロジック等が格納されている。前記
ディスプレイ8は処理結果等の表示を行なう。
2. Description of the Related Art Conventionally, this type of automatic music transcription device has been constructed as shown in FIG. The audio amplifier 1 receives the played music signal as an input and amplifies this signal to an appropriate voltage value. The low-pass filter 2 suppresses aliasing distortion at the time of sampling by passing only the frequency component of 5.5 kHz or less in the signal amplified by the audio amplifier 1. The A / D converter 3 is a low-pass
Sampling frequency of 12 kHz for the filtered signal
z, 16-bit digital signal is converted. I / O port 4 is CPU 5, A / D converter 3, display 8
And are connected. The CPU 5 performs frequency analysis processing of music signal data, extraction processing of basic frequency components, encoding processing, etc., and is connected to the RAM 6 and the ROM 7. The RAM 6 is provided with an area for storing the music signal data sampled by the A / D converter 3 and the frequency analysis result processed by the CPU 5. The RO
M7 stores a frequency analysis logic, a fundamental frequency component extraction logic, an encoding processing logic, and the like. The display 8 displays processing results and the like.

【0003】以下、従来例の作動について図2、図4を
参照して説明する。
The operation of the conventional example will be described below with reference to FIGS. 2 and 4.

【0004】図2は従来例により行なわれる処理を示す
フローチャートである。
FIG. 2 is a flowchart showing the processing performed by the conventional example.

【0005】CPU5は始めに、A/D変換装置3によ
り標本化されRAM6に格納されている楽曲信号データ
i:i=0,1,・・・,N-1に対して、25msec毎に短時間
フーリエ分析により周波数分析処理を行なう(S1)。
First, the CPU 5 receives the music signal data s i: i = 0, 1, ..., N-1 sampled by the A / D converter 3 and stored in the RAM 6 every 25 msec. Frequency analysis processing is performed by short-time Fourier analysis (S1).

【0006】ここで、周波数分析処理(S1)について
図4を参照し説明する。まず、CPU5は楽曲信号デー
タに対する観測位置を示すポインタhを初期化する(h
=0:S41)。次に、RAM6に格納されている楽曲
信号データを入力とし、短時間フーリエ分析を行う。短
時間フーリエ分析は、数1のような離散フーリエ変換に
より行なわれる。
The frequency analysis process (S1) will be described with reference to FIG. First, the CPU 5 initializes a pointer h indicating an observation position for the music signal data (h
= 0: S41). Next, the music signal data stored in the RAM 6 is input, and short-time Fourier analysis is performed. The short-time Fourier analysis is performed by the discrete Fourier transform as shown in equation 1.

【0007】[0007]

【数1】 [Equation 1]

【0008】このとき、離散フーリエ変換の周波数分解
能は各周波数帯域において均一であり数1のLに比例
し、時間分解能はLに反比例することが一般に知られて
いる。実際の処理においては、CPU5は数1を直接計
算するのではなく、高速フーリエ変換によりX
k:k=0,1,・・・、L-1を求めている(S43)。
At this time, it is generally known that the frequency resolution of the discrete Fourier transform is uniform in each frequency band and is proportional to L of the equation 1 and the time resolution is inversely proportional to L. In the actual processing, the CPU 5 does not directly calculate the equation 1, but uses the fast Fourier transform to calculate X.
k: k = 0,1, ..., L-1 is obtained (S43).

【0009】次に、CPU5は離散フーリエ変換の出力
に対し、数2により対数パワー・スペクトルP
k:k-0,1,・・・、L-1を算出する(S44)。
Next, the CPU 5 outputs the logarithmic power spectrum P to the output of the discrete Fourier transform according to the equation (2).
k: k-0,1, ..., L-1 are calculated (S44).

【0010】[0010]

【数2】 [Equation 2]

【0011】次に、CPU5は、対数パワー・スペクト
ルのピーク値を検出する。そして、ピーク値に対応する
周波数を、一般的な440Hzを基準とする平均律音階
の音階番号に変換し、この音階番号、及び、ピーク値を
RAM6に格納する(S45)。
Next, the CPU 5 detects the peak value of the logarithmic power spectrum. Then, the frequency corresponding to the peak value is converted into the scale number of the equal temperament scale based on the general 440 Hz, and the scale number and the peak value are stored in the RAM 6 (S45).

【0012】次に、CPU5は、前記ポインタhを30
0ポイント分(25msec)インクリメントし、処理
を(S42)に戻す(S46)。
Next, the CPU 5 sets the pointer h to 30
It is incremented by 0 point (25 msec), and the process is returned to (S42) (S46).

【0013】次に、CPU5は前記ポインタhと楽曲信
号データのサンプル数Nとを比較し、h<Nの判断が
「YES」の場合、以上で説明した(S43〜S46)
の処理を繰り返し、判断が「NO」である場合周波数分
析処理(S1)を終了する(S42)。
Next, the CPU 5 compares the pointer h with the sample number N of the music signal data, and if h <N is "YES", it is explained above (S43 to S46).
When the judgment is “NO”, the frequency analysis processing (S1) is ended (S42).

【0014】次に、CPU5は、前記RAM6に格納さ
れている、スペクトルのピークに対応する音階番号、及
び、そのピーク値を入力とし、基本周波数成分の抽出を
行なう。基本周波数成分の抽出方法としては、例えば、
特開平3−94072号公報に示される方法等を使用す
る(S2)。
Next, the CPU 5 inputs the scale number corresponding to the peak of the spectrum stored in the RAM 6 and the peak value thereof, and extracts the fundamental frequency component. As a method of extracting the fundamental frequency component, for example,
The method disclosed in Japanese Patent Laid-Open No. 3-94072 is used (S2).

【0015】次に、CPU5は、基本周波数成分の音階
番号、強さ、始端時刻、終端時刻から、MIDIコード
等の音符情報を作成し結果をディスプレイ8に出力する
(S3)。
Next, the CPU 5 creates musical note information such as a MIDI code from the scale number, strength, start time and end time of the fundamental frequency component and outputs the result to the display 8 (S3).

【0016】[0016]

【発明が解決しようとする課題】自動採譜装置において
は、楽曲信号を処理し、楽器音の基本周波数を同定する
ことが目的となる。代表的な平均律音階は、オクターブ
間隔を対数的に12等分したものであり、周波数分析処
理においては、12分の1オクターブの周波数分解能が
要求される。つまり、低周波数領域では、高い周波数分
解能が必要とされるが、高周波数領域では、あまり高い
周波数分解能は必要とされない。しかし、楽曲の特性と
して一般的に、高周波数領域では高い時間分解能が要求
されことが多い。
SUMMARY OF THE INVENTION In an automatic transcription apparatus, it is an object to process a music signal and identify a fundamental frequency of a musical instrument sound. A typical equal tempered scale is an octave interval logarithmically divided into 12 equal parts, and a frequency analysis process requires a frequency resolution of 1/12 octave. That is, high frequency resolution is required in the low frequency region, but not very high frequency resolution in the high frequency region. However, as a characteristic of music, generally, a high time resolution is often required in a high frequency region.

【0017】しかし、上記従来の自動採譜装置の周波数
分析処理においては、数1の様な離散フーリエ変換によ
る短時間スペクトル分析が使われているが、前記したよ
うに離散フーリエ変換の周波数分解能は数1のLに比例
し、時間分解能はLに反比例し、それらは各周波数帯域
において均一であることが知られている。したがって、
低周波数領域における周波数分解能を上げようとする
と、高周波数領域での時間分解能が不足することにな
る。逆に、高周波数領域における時間分解能を上げよう
とすると、低周波数領域での周波数分解能が不足してし
まうという欠点があった。
However, in the frequency analysis processing of the above-mentioned conventional automatic transcription apparatus, short-time spectrum analysis by discrete Fourier transform as shown in equation 1 is used, but the frequency resolution of discrete Fourier transform is several as described above. It is known that it is proportional to L of 1 and the temporal resolution is inversely proportional to L, and they are uniform in each frequency band. Therefore,
When trying to increase the frequency resolution in the low frequency region, the time resolution in the high frequency region becomes insufficient. On the other hand, there is a drawback in that the frequency resolution in the low frequency region becomes insufficient when trying to increase the time resolution in the high frequency region.

【0018】本発明は、上述した問題点を解決するもの
で、低周波数領域では周波数分解能が高く、高周波数領
域では時間分解能が高くなるような分析方法を用いるこ
とにより、精度の高い自動採譜装置を提供することを目
的としている。
The present invention solves the above-mentioned problems, and by using an analysis method in which the frequency resolution is high in the low frequency region and the time resolution is high in the high frequency region, a highly accurate automatic transcription device is provided. Is intended to provide.

【0019】[0019]

【課題を解決するための手段】この目的を達成するため
に本発明は、音響的な信号データを入力とし周波数分析
を行う周波数分析手段と、周波数分析結果から基本周波
数成分を抽出する基本周波数成分抽出手段と、基本周波
数成分の音程、強さ、始端時刻、終端時刻等からMID
Iコード等の音符情報を出力する符号化手段とを備え、
前記周波数分析手段を、ウェーブレット変換により構成
した。
To achieve this object, the present invention provides a frequency analysis means for performing frequency analysis with acoustic signal data as input, and a fundamental frequency component for extracting a fundamental frequency component from the frequency analysis result. From the extraction means and the pitch, strength, start time, end time, etc. of the fundamental frequency component, MID
An encoding means for outputting note information such as an I-code,
The frequency analysis means is constructed by wavelet transform.

【0020】また、前記ウェーブレット変換の出力の中
心周波数を、演奏高度を基準とする平均律音階の各周波
数に等しくなるようにしてもよい。
Further, the center frequency of the output of the wavelet transform may be set to be equal to each frequency of the equal tempered scale based on the performance altitude.

【0021】また、前記ウェーブレット変換の基本ウェ
ーブレット関数としてガボール関数を用いてもよい。
A Gabor function may be used as the basic wavelet function of the wavelet transform.

【0022】[0022]

【作用】上記の構成を有する本発明の周波数分析手段
は、音響的な信号を入力としウェーブレット変換により
周波数分析を行う。基本周波数成分抽出手段は周波数分
析結果から基本周波数成分を抽出する。符号化手段は基
本周波数成分の音程、強さ、始端時刻、終端時刻等から
MIDIコード等の音符情報を出力する。
The frequency analyzing means of the present invention having the above-mentioned structure receives the acoustic signal as an input and performs the frequency analysis by the wavelet transform. The fundamental frequency component extracting means extracts the fundamental frequency component from the frequency analysis result. The encoding means outputs note information such as MIDI code from the pitch, strength, start time, end time, etc. of the fundamental frequency component.

【0023】[0023]

【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

【0024】図1は本実施例による自動採譜装置のブロ
ック図である。本実施例を構成するオーディオ・アンプ
1は演奏された楽曲信号を入力とし、この信号を適切な
電圧値に増幅する。ローパス・フィルター2はオーディ
オ・アンプ1により増幅された信号における5.5kH
z以下の周波数成分のみを通過させることにより、標本
化時の折返し歪を抑えている。A/D変換装置3はロー
パス・フィルター通過信号を、サンプリング周波数12
kHz、16ビットのディジタル信号に変換する。I/
Oポート4はCPU5と、A/D変換装置3、ディスプ
レイ8とを接続している。CPU5は楽曲信号データの
周波数分析処理、基本周波数成分の抽出処理、符号化処
理等を行ない、RAM6、及びROM7に接続されてい
る。前記RAM6にはA/D変換装置3により標本化さ
れた楽曲信号データ、CPU5により処理された周波数
分析結果等が格納されるエリアが用意されている。前記
ROM7には周波数分析ロジック、基本周波数抽出ロジ
ック、符号化処理ロジック等が格納されている。前記デ
ィスプレイ8は処理結果等の表示を行なう。
FIG. 1 is a block diagram of an automatic music transcription device according to this embodiment. The audio amplifier 1 constituting the present embodiment receives the played music signal as an input and amplifies this signal to an appropriate voltage value. The low-pass filter 2 is 5.5 kHz in the signal amplified by the audio amplifier 1.
The aliasing distortion at the time of sampling is suppressed by passing only the frequency components equal to or lower than z. The A / D converter 3 converts the low-pass filtered signal into the sampling frequency 12
Converted to a 16-bit digital signal of kHz. I /
The O port 4 connects the CPU 5, the A / D conversion device 3, and the display 8. The CPU 5 performs frequency analysis processing of music signal data, extraction processing of basic frequency components, encoding processing, etc., and is connected to the RAM 6 and the ROM 7. The RAM 6 is provided with an area for storing the music signal data sampled by the A / D converter 3 and the frequency analysis result processed by the CPU 5. The ROM 7 stores a frequency analysis logic, a fundamental frequency extraction logic, an encoding processing logic and the like. The display 8 displays processing results and the like.

【0025】以下、本実施例の作動について図2、図3
を参照して説明する。
The operation of this embodiment will be described below with reference to FIGS.
Will be described.

【0026】図2は本実施例により行なわれる処理を示
すフローチャートである。
FIG. 2 is a flow chart showing the processing performed by this embodiment.

【0027】CPU5は始めに、A/D変換装置3によ
り標本化されRAM6に格納されている楽曲信号データ
i:i=0,1,・・・,N-1に対してウェーブレット変換による
周波数分析処理を行なう(S1)。
First, the CPU 5 performs frequency conversion by wavelet transformation on the music signal data s i: i = 0,1, ..., N-1 sampled by the A / D converter 3 and stored in the RAM 6. Analysis processing is performed (S1).

【0028】ここで、ウェーブレット変換について説明
する。1次元の信号f(t)のウェーブレット変換F(a,b)
は数3で定義されている。
Here, the wavelet transform will be described. Wavelet transform F (a, b) of one-dimensional signal f (t )
Is defined by Equation 3.

【0029】[0029]

【数3】 [Equation 3]

【0030】ここで、Ψは基本ウェーブレット関数と呼
ばれる関数である。ウェーブレット変換は周波数に対す
るスケールを表わすパラメータaと、時刻を表わすパラ
メータbを動かすことによりΨから作り出される関数の
族と解析の対象となる関数f(t)との内積として定義さ
れる。Ψ*はΨの複素共役である。本実施例ではa,b
を数4、数5で定義し、ディジタル化された入力信号s
iに対する離散化されたウェーブレット変換Sm,nを数6
で定義する。
Here, Ψ is a function called a basic wavelet function. The wavelet transform is defined as an inner product of a parameter a representing a scale with respect to frequency and a family of functions created from Ψ by moving a parameter b representing time and a function f (t) to be analyzed. Ψ * is the complex conjugate of Ψ. In this embodiment, a, b
Is defined by Equations 4 and 5, and the digitized input signal s
The discretized wavelet transform S m, n for i is given by
Define in.

【0031】[0031]

【数4】 [Equation 4]

【0032】[0032]

【数5】 [Equation 5]

【0033】[0033]

【数6】 [Equation 6]

【0034】ここで,1/Tsは前記サンプリング周波
数(本実施例では12000)である。m、nはそれぞ
れ周波数、観測位置(時刻)に関するパラメータであ
り、今後本明細書中において周波数チャンネル番号、観
測位置と呼ぶ。周波数チャンネル番号mは小さいほど高
周波数領域を、大きいほど低周波数領域を表わす。ま
た、基本ウェーブレット関数Ψ(t)としてはラプラシア
ンガウシアン関数、聴覚系インパルス応答を利用したも
のなどが知られているが、本実施例では時間と周波数に
関する不確定性が最小であり、この意味で時間−周波数
空間において最も局在性が良いとされるガボール関数を
使用している。ガボール関数は数7で定義される。
Here, 1 / T s is the sampling frequency (12000 in this embodiment). m and n are parameters relating to frequency and observation position (time), respectively, and will be referred to as frequency channel number and observation position in the present specification. The smaller the frequency channel number m, the higher the frequency range, and the larger the frequency channel number m, the lower the frequency range. Further, as the basic wavelet function Ψ (t) , a Laplacian-Gaussian function, one using an auditory system impulse response, etc. are known, but in this embodiment, uncertainty about time and frequency is minimum, and in this sense, The Gabor function, which is said to have the best localization in the time-frequency space, is used. The Gabor function is defined by Equation 7.

【0035】[0035]

【数7】 [Equation 7]

【0036】数6、数7より時間分解能はaに反比例
し、aが小さい(高周波数領域)ほど時間分解能は高く
なり、aが大さい(低周波数領域)ほど低くなることが
分かる。また、ガボール関数のフーリエ変換Ψ(ω)は数
8のようになり、a-1/2・Ψ((t-b)/a)のフーリエ変換
がa1/2・Ψ(aω)・exp[−iωb]となることか
ら、周波数分解能はaに比例し、aが大さい(低周波数
領域)ほど周波数分解能は高くなり、aが小さい(高周
波数領域)ほど低くなることが分かる。
From Equations 6 and 7, it is understood that the time resolution is inversely proportional to a, that is, the smaller a (high frequency region), the higher the time resolution, and the larger a (low frequency region), the lower. In addition, the Fourier transform Ψ ( ω ) of the Gabor function is as shown in Equation 8, and the Fourier transform of a −1 / 2 · Ψ ((tb) / a) is a 1/2 · Ψ () · exp [− iωb], the frequency resolution is proportional to a, and it can be seen that the larger a is (low frequency region), the higher the frequency resolution, and the smaller a is (high frequency region), the lower.

【0037】[0037]

【数8】 [Equation 8]

【0038】以上説明したように、数6を計算すること
により低周波数領域では周波数分解能が高く、高周波数
領域では時間分解能が高くなる様な分析を行うことがで
きる。
As described above, by calculating equation 6, it is possible to perform analysis such that the frequency resolution is high in the low frequency region and the time resolution is high in the high frequency region.

【0039】数7において、ωpは最も高い周波数チャ
ンネル(m=0)に対する出力の中心周波数に2πをか
けたものであり、本実施例ではωp=2π×5586H
zとした。これにより各周波数チャンネルの出力の中心
周波数が、一般的な440Hzを基準とする平均律音階
の周波数に程等しくなるようにすることができる。ま
た、周波数空間での半値幅は(2ωp/r)で与えら
れ、本実施例ではr=30としている。
In Expression 7, ω p is the output center frequency for the highest frequency channel (m = 0) multiplied by 2π, and in this embodiment ω p = 2π × 5586H
z. As a result, the center frequency of the output of each frequency channel can be made approximately equal to the frequency of the equal temperament scale based on the general 440 Hz. Further, the half width in the frequency space is given by (2ω p / r), and in this embodiment, r = 30.

【0040】また、本実施例において、M=72とし
た。これにより87Hz〜5586Hzまでの周波数帯
域の分析を行うことができる。また、NはRAM6に格
納されている楽曲信号データのサンプル数である。
In the present embodiment, M = 72. This enables analysis of the frequency band from 87 Hz to 5586 Hz. N is the number of samples of the music signal data stored in the RAM 6.

【0041】ここで、図3を使い周波数分析処理(S
1)の作動について説明する。まず始めに、CPU5は
周波数チャンネル番号mの初期化を行う(m=0:S3
1)。次に、CPU5は観測位置nの初期化を行う(n
=0:S33)。次に、CPU5は前記数6によりS
m,nを算出する(S35)。次に、CPU5は数8によ
りSm,nを対数化し、RAMに格納する(S36)。
Here, the frequency analysis process (S
The operation of 1) will be described. First, the CPU 5 initializes the frequency channel number m (m = 0: S3).
1). Next, the CPU 5 initializes the observation position n (n
= 0: S33). Next, the CPU 5 uses S by the above equation 6.
m and n are calculated (S35). Next, the CPU 5 logarithmizes S m, n by the equation 8 and stores it in the RAM (S36).

【0042】[0042]

【数9】 [Equation 9]

【0043】次に、CPU5は観測位置nをインクリメ
ントし、処理を(S34)に戻す(S37)。CPU5
は観測位置nと楽曲信号データのサンプル数Nとを比較
し、n<Nの判断が「YES」なら以上で説明した(S
35〜S37)の処理を繰り返し、「NO」なら処理を
(S38)に移す(S34)。(S34)において判断
が「NO」である場合、CPU5は周波数チャンネル番
号mをインクリメントし処理を(S32)に戻す(S3
8)。CPU5は、周波数チャンネル番号mとMとを比
較し、m≦Mの判断が「YES」なら以上で説明した
(S33〜S38)の処理を繰り返し、「NO」なら周
波数分析処理(S1)を終了する(S32)。
Next, the CPU 5 increments the observation position n and returns the processing to (S34) (S37). CPU5
Compares the observation position n with the sample number N of the music signal data, and if the judgment of n <N is “YES”, it is explained above (S
The processes of 35 to S37 are repeated, and if “NO”, the process proceeds to (S38) (S34). When the determination is (NO) in (S34), the CPU 5 increments the frequency channel number m and returns the process to (S32) (S3).
8). The CPU 5 compares the frequency channel numbers m and M, and repeats the above-described processing of (S33 to S38) if the determination of m ≦ M is “YES”, and ends the frequency analysis processing (S1) if “NO”. Yes (S32).

【0044】次に、CPU5は前記RAM6に格納され
ているウェーブレット変換の出力値を入力とし、基本周
波数成分の抽出を行なう。基本周波数成分の抽出方法と
しては、例えば特開平3−94072号公報に示される
方法等を使用する(S2)。
Next, the CPU 5 receives the output value of the wavelet transform stored in the RAM 6 as an input, and extracts the fundamental frequency component. As a method of extracting the fundamental frequency component, for example, the method disclosed in Japanese Patent Laid-Open No. 3-94072 is used (S2).

【0045】次に、CPU5は基本周波数成分の周波数
チャンネル番号、強さ、始端時刻、終端時刻等から、M
IDIコード等の音符情報を作成しディスプレイ8に出
力する(S3)。
Next, the CPU 5 determines M from the frequency channel number, strength, start time, end time, etc. of the basic frequency component.
Note information such as an IDI code is created and output to the display 8 (S3).

【0046】本発明は、以上詳述した構成に限定される
ものではなく、その主旨を逸脱しない範囲において種々
の変更を加えることができる。
The present invention is not limited to the configuration described in detail above, and various modifications can be made without departing from the spirit of the invention.

【0047】[0047]

【発明の効果】以上説明したことから明かなように、本
発明の自動採譜装置によれば、音響的な信号を入力とし
周波数分析を行う周波数分析手段と、周波数分析結果か
ら基本周波数成分を抽出する基本周波数成分抽出手段
と、基本周波数成分の音程、強さ、始端時刻、終端時刻
等からMIDIコード等の音符情報を出力する符号化手
段とを備えた自動採譜装置において、前記周波数分析手
段をウェーブレット変換で実現したことにより、低周波
数領域では高い周波数分解能が要求され、高周波数領域
では高い時間分解能が要求されるような、楽曲信号の採
譜処理に適した周波数分析を行うことができる。
As is apparent from the above description, according to the automatic music transcription apparatus of the present invention, the frequency analysis means for performing frequency analysis with an acoustic signal as an input, and the fundamental frequency component extracted from the frequency analysis result. In the automatic music transcription device, the frequency analysis means is provided with a fundamental frequency component extracting means and a coding means for outputting musical note information such as MIDI code from the pitch, strength, start time, end time, etc. of the fundamental frequency component. By implementing the wavelet transform, it is possible to perform frequency analysis suitable for music notation processing, which requires high frequency resolution in the low frequency region and high time resolution in the high frequency region.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は、本発明の一実施例によるブロック構成
図である。
FIG. 1 is a block diagram according to an embodiment of the present invention.

【図2】図2は、本発明の一実施例による自動採譜装置
のフローチャートである。
FIG. 2 is a flowchart of an automatic music transcription device according to an embodiment of the present invention.

【図3】図3は、周波数分析処理のフローチャートであ
る。
FIG. 3 is a flowchart of frequency analysis processing.

【図4】図4は、従来例の周波数分析処理のフローチャ
ートである。
FIG. 4 is a flowchart of a conventional frequency analysis process.

【符号の説明】[Explanation of symbols]

1 オーディオ・アンプ 2 ローパス・フィルター 3 A/D変換装置 5 CPU 8 ディスプレイ 1 Audio amplifier 2 Low pass filter 3 A / D converter 5 CPU 8 Display

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 音響的な信号データを入力とし周波数分
析を行う周波数分析手段と、周波数分析結果から基本周
波数成分を抽出する基本周波数成分抽出手段と、基本周
波数成分の音程、強さ、始端時刻、終端時刻等からMI
DIコード等の音符情報を出力する符号化手段とを備え
た自動採譜装置において、 前記周波数分析手段をウェーブレット変換で構成したこ
とを特徴とする自動採譜装置。
1. A frequency analysis means for inputting acoustic signal data to perform a frequency analysis, a fundamental frequency component extraction means for extracting a fundamental frequency component from the frequency analysis result, a pitch, a strength, and a start time of the fundamental frequency component. , From the end time, etc. to MI
An automatic music transcription device comprising an encoding means for outputting musical note information such as a DI code, wherein the frequency analysis means is constituted by a wavelet transform.
【請求項2】 前記ウェーブレット変換の出力の中心周
波数が、演奏高度を基準とする平均律音階の各周波数に
等しいことを特徴とする請求項1に記載の自動採譜装
置。
2. The automatic music transcription device according to claim 1, wherein the center frequency of the output of the wavelet transform is equal to each frequency of the equal tempered scale with the performance altitude as a reference.
【請求項3】 前記ウェーブレット変換の基本ウェーブ
レット関数が、ガボール関数であることを特徴とする請
求項1に記載の自動採譜装置。
3. The automatic music transcription device according to claim 1, wherein the basic wavelet function of the wavelet transform is a Gabor function.
JP29167891A 1991-11-07 1991-11-07 Automatic transcription device Pending JPH05127668A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29167891A JPH05127668A (en) 1991-11-07 1991-11-07 Automatic transcription device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29167891A JPH05127668A (en) 1991-11-07 1991-11-07 Automatic transcription device

Publications (1)

Publication Number Publication Date
JPH05127668A true JPH05127668A (en) 1993-05-25

Family

ID=17772009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29167891A Pending JPH05127668A (en) 1991-11-07 1991-11-07 Automatic transcription device

Country Status (1)

Country Link
JP (1) JPH05127668A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001024459A (en) * 1999-07-07 2001-01-26 Alpine Electronics Inc Audio device
WO2005081222A1 (en) * 2004-02-20 2005-09-01 Kabushiki Kaisha Kawai Gakki Seisakusho Device for judging music sound of natural musical instrument played according to a performance instruction, music sound judgment program, and medium containing the program
JP2005234304A (en) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd Performance sound decision apparatus and performance sound decision program
JP2011048385A (en) * 2000-04-14 2011-03-10 Harman Internatl Industries Inc Method and apparatus for dynamic sound optimization
US7982119B2 (en) * 2007-02-01 2011-07-19 Museami, Inc. Music transcription

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001024459A (en) * 1999-07-07 2001-01-26 Alpine Electronics Inc Audio device
JP4522509B2 (en) * 1999-07-07 2010-08-11 アルパイン株式会社 Audio equipment
JP2011048385A (en) * 2000-04-14 2011-03-10 Harman Internatl Industries Inc Method and apparatus for dynamic sound optimization
WO2005081222A1 (en) * 2004-02-20 2005-09-01 Kabushiki Kaisha Kawai Gakki Seisakusho Device for judging music sound of natural musical instrument played according to a performance instruction, music sound judgment program, and medium containing the program
JP2005234304A (en) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd Performance sound decision apparatus and performance sound decision program
US7982119B2 (en) * 2007-02-01 2011-07-19 Museami, Inc. Music transcription

Similar Documents

Publication Publication Date Title
EP0388104B1 (en) Method for speech analysis and synthesis
JP4177755B2 (en) Utterance feature extraction system
US6266003B1 (en) Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
EP1422693B1 (en) Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program
US20040225493A1 (en) Pitch determination method and apparatus on spectral analysis
US20040098431A1 (en) Device and method for interpolating frequency components of signal
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
JPH05127668A (en) Automatic transcription device
JP2779325B2 (en) Pitch search time reduction method using pre-processing correlation equation in vocoder
JP2914332B2 (en) Spectrum feature parameter extraction device based on frequency weight evaluation function
JP3102089B2 (en) Automatic transcription device
JPH05273964A (en) Attack time detecting device used for automatic musical transcription system or the like
JPH05143098A (en) Method and apparatus for spectrum analysis
JP3233448B2 (en) Pitch period extraction method
KR0128851B1 (en) Pitch detecting method by spectrum harmonics matching of variable length dual impulse having different polarity
JP2806048B2 (en) Automatic transcription device
JP3352144B2 (en) Voice recognition device
JPH1062460A (en) Signal separator
JP3321841B2 (en) Pitch frequency estimation method and device
JP3302075B2 (en) Synthetic parameter conversion method and apparatus
US5899974A (en) Compressing speech into a digital format
JP2806047B2 (en) Automatic transcription device
JPH1020886A (en) System for detecting harmonic waveform component existing in waveform data
JPH05127697A (en) Speech synthesis method by division of linear transfer section of formant
JP2002372982A (en) Method and device for analyzing acoustic signal