JPH04261591A - Automatic music scoreing device - Google Patents

Automatic music scoreing device

Info

Publication number
JPH04261591A
JPH04261591A JP1143291A JP1143291A JPH04261591A JP H04261591 A JPH04261591 A JP H04261591A JP 1143291 A JP1143291 A JP 1143291A JP 1143291 A JP1143291 A JP 1143291A JP H04261591 A JPH04261591 A JP H04261591A
Authority
JP
Japan
Prior art keywords
frequency
fundamental frequency
peak
power spectrum
peaks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1143291A
Other languages
Japanese (ja)
Other versions
JP2871120B2 (en
Inventor
Seiko Ishikawa
石川 せい子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP1143291A priority Critical patent/JP2871120B2/en
Publication of JPH04261591A publication Critical patent/JPH04261591A/en
Application granted granted Critical
Publication of JP2871120B2 publication Critical patent/JP2871120B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

PURPOSE:To satisfactorily extract the basic frequency by extracting a basic frequency candidate from a power spectrum obtained by executing a frequency analysis at every prescribed time with respect to data. CONSTITUTION:A signal fetching part 21 executes an A/D conversion of music, and sets it to a digital signal handled in a computer. Also, a frequency analysis processing part 22 calculates a power spectrum in the frequency direction within a prescribed time by executing a frequency analysis at every certain prescribed time with respected to data fetched by the signal fetching part 21. Subsequently, a basic frequency candidate extracting part 23 extracts a basic frequency from the power spectrum.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、音楽を楽譜もしくは楽
譜に相当する符号に変換する自動採譜装置に係り、さら
に詳細には、実際に鳴っている音である基本周波数の抽
出のための構成に関する。
[Field of Industrial Application] The present invention relates to an automatic score transcription device that converts music into a musical score or a code corresponding to a musical score, and more specifically, the present invention relates to an automatic score transcription device that converts music into a musical score or a code corresponding to a musical score. Regarding.

【0002】0002

【従来の技術】従来、複数の楽器によって演奏された音
楽の採譜は、音楽的知識を有する採譜者によって行われ
てきた。また、採譜を人が行うのでなく装置により自動
的に行うものでは、単音からなる音楽を採譜したり、あ
るいは鍵盤の押された情報から採譜を行う装置が提案さ
れている。
2. Description of the Related Art Conventionally, music played by a plurality of musical instruments has been transcribed by a transcriber with musical knowledge. In addition, in the case where music is automatically transcribed by a device rather than by a person, there have been proposed devices that transcribe music consisting of single notes or that transcribe music based on information about keyboard presses.

【0003】0003

【発明が解決しようとする課題】しかしながら、従来の
採譜装置では、楽器の種類や楽器数に制約があり、採譜
の範囲が限定され、一般的な音楽の演奏をそのまま採譜
できないという問題があった。また、複数の楽器によっ
て演奏された音楽をA/D変換した信号をFFT等によ
り周波数分析しただけでは、各楽器の倍音が多数観測さ
れ、どの音が基本周波数であるのか容易に判断できない
という問題があった。本発明は、上述した問題点を解決
するもので、音楽をA/D変換した信号を周波数分析し
、その結果から倍音を除去し、基本周波数のみを取り出
すことによって、楽器の種類や楽器数に制約を受けない
自動採譜装置を提供することを目的とする。
[Problems to be Solved by the Invention] However, with conventional music transcription devices, there are restrictions on the types and number of instruments, which limits the range of music transcription, and there is a problem in that it is not possible to transcribe general musical performances as they are. . Another problem is that if you simply frequency-analyze the A/D-converted signal of music played by multiple instruments using FFT, etc., many harmonics of each instrument will be observed, making it impossible to easily determine which sound is the fundamental frequency. was there. The present invention solves the above-mentioned problems by frequency-analyzing the A/D-converted music signal, removing overtones from the result, and extracting only the fundamental frequency. The purpose is to provide an automatic score transcription device that is not subject to restrictions.

【0004】0004

【課題を解決するための手段】上記目的を達成するため
に請求項1の発明は、音楽信号を楽譜もしくは楽譜に相
当する符号に変換する採譜装置において、音楽信号を取
り込みA/D変換する信号取り込み部と、前記信号取り
込み部で取り込んだデータに対して、一定時間毎に周波
数解析を行うことにより、一定時間内での周波数方向の
パワー・スペクトルを計算する周波数解析処理部と、前
記パワー・スペクトルより基本周波数候補を抽出する基
本周波数候補抽出部とを備えたものである。請求項2の
発明は、上記の基本周波数候補抽出部が、パワー・スペ
クトルのピークからパワーのしきい値を計算するパワー
のしきい値計算手段と、前記パワー・スペクトルのピー
クのうちの一つが演奏音の基本周波数かどうかを、それ
より高い周波数の他のピークのなかで元のピークの倍音
となっているピークと、元のピークと、両者の間にある
ピークの周波数とパワーに基づいて判定する基本周波数
らしさ判定手段と、前記パワー・スペクトルのピークの
うちの一つがそれより低い周波数の他のピークの中のど
れかの倍音となっているかを検索する基本周波数検索手
段と、前記基本周波数検索手段で検索されたピークの倍
音系列が、パワー・スペクトルのピークの中にどの程度
含まれているかどうかを算出する倍音系列含有度計算手
段と、前記パワー・スペクトルのピークのうちの一つが
他のピークの倍音であると判断された時に、倍音とされ
た方のピークをパワー・スペクトルから除去する倍音除
去手段とからなるものである。
Means for Solving the Problems In order to achieve the above object, the invention of claim 1 provides a score recording device that converts a music signal into a musical score or a code corresponding to the musical score, in which a music signal is taken in and A/D converted. an acquisition unit; a frequency analysis processing unit that calculates a power spectrum in the frequency direction within a certain time by performing frequency analysis on the data acquired by the signal acquisition unit at certain time intervals; and a fundamental frequency candidate extraction section that extracts fundamental frequency candidates from the spectrum. The invention according to claim 2 is characterized in that the fundamental frequency candidate extracting unit includes power threshold calculation means for calculating a power threshold from the peak of the power spectrum, and Determines whether a performance note has the fundamental frequency based on the frequency and power of the peak that is a harmonic of the original peak among other peaks with higher frequencies, the original peak, and the peaks between the two. fundamental frequency retrieval means for determining whether one of the peaks of the power spectrum is a harmonic of any of the other peaks having a lower frequency; a harmonic series content calculation means for calculating to what extent the harmonic series of the peak searched by the frequency search means is included in the peaks of the power spectrum; The overtone removing means removes the peak determined to be an overtone from the power spectrum when the peak is determined to be an overtone of another peak.

【0005】[0005]

【作用】請求項1の構成によれば、信号取り込み部は、
音楽をA/D変換し、計算機内で扱えるデジタル信号に
する。周波数解析処理部は、信号取り込み部で取り込ん
だデータに対して、ある一定時間毎に周波数解析を行う
ことにより、前記一定時間内での周波数方向のパワー・
スペクトルを計算する。基本周波数候補抽出部はこのパ
ワー・スペクトルより基本周波数候補を抽出する。請求
項2に記載した基本周波数候補抽出部を構成する各手段
は以下のような作用をする。パワーのしきい値計算手段
は、パワー・スペクトルのピークからパワーのしきい値
を計算する。基本周波数らしさ判定手段は、パワー・ス
ペクトルのピークのうちの一つが基本周波数かどうかを
、それより高い周波数の他のピークのなかで元のピーク
の倍音となっているピークと、元のピークと、両者の間
にあるピークの周波数とパワーとから判定する。基本周
波数検索手段は、前記パワー・スペクトルのピークのう
ちの一つが、それより低い周波数の他のピークの中のど
れかの倍音となっているかを検索する。倍音系列含有度
計算手段は、前記基本周波数検索手段で検索されたピー
クの倍音系列が、パワー・スペクトルのピークの中にど
の程度含まれているかどうかを算出する。倍音除去手段
は、前記パワー・スペクトルのピークのうちの一つが他
のピークの倍音であると判断された場合に、倍音とされ
た方のピークをパワー・スペクトルから除去する。
[Operation] According to the structure of claim 1, the signal acquisition section:
Converts music from A/D to a digital signal that can be handled within a computer. The frequency analysis processing section performs frequency analysis on the data acquired by the signal acquisition section at certain fixed time intervals, thereby calculating the power/power in the frequency direction within the fixed time period.
Calculate the spectrum. The fundamental frequency candidate extraction section extracts fundamental frequency candidates from this power spectrum. Each means constituting the fundamental frequency candidate extracting section described in claim 2 operates as follows. The power threshold calculation means calculates a power threshold from the peak of the power spectrum. The fundamental frequency similarity determining means determines whether one of the peaks in the power spectrum is a fundamental frequency or not, and compares it with a peak that is a harmonic of the original peak among other peaks with higher frequencies, and a peak that is a harmonic of the original peak. , based on the frequency and power of the peak between the two. The fundamental frequency search means searches whether one of the peaks of the power spectrum is a harmonic of any of the other peaks having a lower frequency. The harmonic series content calculating means calculates to what extent the harmonic series of the peak searched by the fundamental frequency searching means is included in the peaks of the power spectrum. The overtone removing means removes the peak determined to be an overtone from the power spectrum when it is determined that one of the peaks of the power spectrum is an overtone of another peak.

【0006】[0006]

【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。図1は本発明による自動採譜装置の
ブロック図である。本装置は、音楽信号が入力されるオ
ーディオ・アンプ1と、ローパス・フィルター2と、A
/D変換装置3と、I/Oポート4と、基本周波数候補
を抽出処理するCPU5と、RAM6と、ROM7と、
抽出した結果を表示するデイスプレイ8とから構成され
ている。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment embodying the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram of an automatic score transcription apparatus according to the present invention. This device includes an audio amplifier 1 to which a music signal is input, a low-pass filter 2, and an A
/D conversion device 3, I/O port 4, CPU 5 for extracting fundamental frequency candidates, RAM 6, ROM 7,
It is composed of a display 8 that displays the extracted results.

【0007】次に、上記図1に図2、図3を加えて、本
自動採譜装置により行われる基本周波数抽出処理のため
の機能構成を説明する。本装置は、機能構成要素として
、信号取り込み部21と高速フーリエ変換(FFT)処
理部22と基本周波数候補抽出部23とからなる。信号
取り込み部21は、オーディオ・アンプ1、ローパス・
フィルタ2、A/D変換装置3、I/Oポート4、CP
U5等により構成される。入力された音楽信号はオーデ
ィオ・アンプ1により増幅され、この増幅された信号は
、ローパス・フィルタ2に入力され、例えば、5.5k
Hz以下の周波数成分のみが通過し、標本化時の折返し
歪みを抑えている。この出力信号は、A/D変換装置3
により12kHz、16bitで標本化される。標本化
されたデータは、I/Oポート4を介し、CPU5に取
り込まれ、RAM6に記憶される。
Next, by adding FIGS. 2 and 3 to FIG. 1 above, the functional configuration for fundamental frequency extraction processing performed by the automatic score transcription apparatus will be explained. This device includes a signal acquisition section 21, a fast Fourier transform (FFT) processing section 22, and a fundamental frequency candidate extraction section 23 as functional components. The signal acquisition unit 21 includes an audio amplifier 1, a low-pass
Filter 2, A/D converter 3, I/O port 4, CP
Consists of U5 etc. The input music signal is amplified by the audio amplifier 1, and this amplified signal is input to the low-pass filter 2, for example, 5.5k.
Only frequency components below Hz pass through, suppressing aliasing distortion during sampling. This output signal is transmitted to the A/D converter 3
The signal is sampled at 12 kHz and 16 bits. The sampled data is taken into the CPU 5 via the I/O port 4 and stored in the RAM 6.

【0008】FFT処理部22は、CPU5、RAM6
等でなり、CPU5はRAM6より標本化されたデータ
を読み出し、25msec毎を1フレームとし、1フレ
ーム毎に85.3msecハミング窓を掛けた後、FF
T分析により対数パワー・スペクトルが算出される。次
に、CPU5は、算出された対数パワー・スペクトルか
ら放射線内挿処理によりピーク周波数を求める。図5は
以上のようにして求めたピーク・スペクトルを、時間軸
を横軸に、ピーク周波数を鍵盤番号に変換して縦軸にと
り、強度を濃淡で示したものである。同図は倍音除去前
のデータである。基本周波数候補抽出部23は、CPU
5でなり、図3のようにパワーのしきい値計算手段31
と、基本周波数らしさ判定手段32と、基本周波数検索
手段33と、倍音系列含有度計算手段34と、倍音除去
手段35とから構成されている。
[0008] The FFT processing section 22 includes a CPU 5 and a RAM 6.
etc., the CPU 5 reads the sampled data from the RAM 6, takes every 25 msec as one frame, multiplies an 85.3 msec Hamming window for each frame, and then reads the sampled data from the FF
A logarithmic power spectrum is calculated by T analysis. Next, the CPU 5 determines the peak frequency from the calculated logarithmic power spectrum by radiation interpolation processing. FIG. 5 shows the peak spectrum obtained as described above, with the time axis on the horizontal axis and the peak frequency converted into a keyboard number on the vertical axis, and the intensity shown in shading. The figure shows data before overtone removal. The fundamental frequency candidate extracting unit 23 uses the CPU
5, and the power threshold calculation means 31 as shown in FIG.
, a fundamental frequency likelihood determining means 32 , a fundamental frequency searching means 33 , an overtone series content calculating means 34 , and an overtone removing means 35 .

【0009】基本周波数候補抽出部23では、FFT処
理部22の各フレーム毎に処理を進める。いま、あるフ
レームに対して、FFT処理部22で求めたスペクトル
のピークがN個あるとし、以下、図4のフローチャート
に従って説明する。図4は、基本周波数候補抽出部23
での処理を、ある1フレーム分について示したものであ
る。N個のピークについては、各々周波数Fとパワーの
値Pが周波数によってソートされてRAM6に記憶され
ている。このN個のピークのパワーの値から、パワーに
よるしきい値Spを計算する(ステップ#1)。N個の
ピークについては、周波数の高い方から低い方へ、順に
処理を進める。N個のピークの、周波数の高い方からn
番目のピークの周波数をF(n)、パワーをP(n)と
する。F(n)が基本周波数であるかどうかを、F(n
)よりも高い周波数F(m)およびパワーP(m)(1
≦m<n)から判定する(#2,#3)。この判定は以
下のようにして行う。まず、F(m)の中にF(n)の
第X次倍音(X≧2)となっているF(x)があるかど
うか探す。F(x)が見つかった場合、F(n)とF(
x)の関係は、F(n)が基本周波数で、F(x)が第
X次倍音となっている場合(これをケース1とする)と
、F(n)、F(x)がより低い、両者の公約数となっ
ている周波数の、それぞれれL次(L≧2)、L×X次
倍音となっている場合(これをケース2とする)とがあ
り得る。
[0009] The fundamental frequency candidate extracting section 23 advances the processing for each frame of the FFT processing section 22. Now, it is assumed that there are N peaks in the spectrum obtained by the FFT processing unit 22 for a certain frame, and the following description will be made according to the flowchart of FIG. FIG. 4 shows the fundamental frequency candidate extraction unit 23
This figure shows the processing for one frame. Regarding the N peaks, the frequency F and power value P are sorted by frequency and stored in the RAM 6. A power threshold Sp is calculated from the power values of these N peaks (step #1). Regarding the N peaks, processing is performed in order from the highest frequency to the lowest frequency. Of N peaks, n from the highest frequency
Let the frequency of the th peak be F(n) and the power be P(n). Check whether F(n) is the fundamental frequency by F(n
) higher frequency F(m) and power P(m)(1
Judgment is made from ≦m<n) (#2, #3). This determination is made as follows. First, a search is made to see if there is an F(x) in F(m) that is the X-th harmonic (X≧2) of F(n). If F(x) is found, then F(n) and F(
x) relationship is when F(n) is the fundamental frequency and F(x) is the There may be a case (this is referred to as case 2) where the low frequency is an L-order (L≧2) or L×X-order overtone of a frequency that is a common divisor of both.

【0010】このどちらの場合であるかを判断するため
に、F(x)とF(n)の間に存在する周波数F(y)
、およびパワーP(y)(x<y<n)について、以下
のような処理をする。P(y)>(P(x)+P(n)
)/2であれば、F(y)とF(x)、F(n)の周波
数差を計算する。いま、Fxy=F(x)−F(y)、
Fyn=F(y)−F(n)とする。FxyとFynの
小さい方をF0とする。F0がF(n)、F(x)を両
方とも倍音とする場合は、前述のケース2である可能性
が高いので、F(n)は基本周波数でないと判断する。 また、F(x)が見つからなかった場合もF(n)は基
本周波数でないと判断する。これ以外の場合、すなわち
F(m)の中に存在するF(n)の第X次倍音(X≧2
)となっている全てのF(x)について、F(x)とF
(n)の間に存在するF(y)から計算された全てのF
0の中に、F(n)、F(x)を両方とも倍音とするも
のがひとつもない場合、F(n)は基本周波数であると
判断される。
In order to determine which of these cases is the case, the frequency F(y) that exists between F(x) and F(n) is
, and power P(y) (x<y<n), the following processing is performed. P(y)>(P(x)+P(n)
)/2, calculate the frequency difference between F(y), F(x), and F(n). Now, Fxy=F(x)-F(y),
Let Fyn=F(y)−F(n). The smaller of Fxy and Fyn is set as F0. If F0 has both F(n) and F(x) as overtones, the above-mentioned case 2 is likely, and therefore F(n) is determined not to be the fundamental frequency. Also, if F(x) is not found, it is determined that F(n) is not the fundamental frequency. In other cases, that is, the Xth harmonic of F(n) existing in F(m) (X≧2
) for all F(x), F(x) and F
All F calculated from F(y) existing between (n)
If there is no one in which both F(n) and F(x) are overtones, F(n) is determined to be the fundamental frequency.

【0011】以上により、P(n)>SpかつF(n)
が基本周波数であると判断された場合は(#4,#5で
YES)、そのピークは基本周波数であるとして次のピ
ークに処理を移す(#6,#7)。そうでない場合は、
F(n)よりも低い周波数F(p)(n<p≦N)の中
に、F(n)を第Z次倍音(Z≧2)とするF(z)が
あるか探す(#8,#9)。F(z)が見つかった場合
には、F(z)のZ次までの倍音系列をF(q)(z≦
q≦n)の中で探す。F(q)の中にZ個含まれるはず
のF(z)の倍音系列のうち、実際にF(q)の中で見
つかった個数をW個とし、倍音系列含有度W/Zを計算
する(#10)。W/Zがあるしきい値以上の場合には
(#11でYES)、F(n)はF(z)の倍音である
として除去する(#12)。条件を満たすF(z)が見
つからなかった場合には、F(n)を除去しない。なお
、F(n)を除去した場合でも以降の処理に支障をきた
すことのないように、F(n)にピークが存在したとい
う情報は残しておく。以上の処理をN個のピーク全てに
ついて行ったら、次のフレームに処理を移す。FFT処
理部22でパワー・スペクトルを算出した全てのフレー
ムについて以上の処理を終了した時、基本周波数候補抽
出部23の処理が終了する。
From the above, P(n)>Sp and F(n)
If it is determined that is the fundamental frequency (YES in #4, #5), that peak is determined to be the fundamental frequency, and processing is shifted to the next peak (#6, #7). If not,
Search for F(z) with F(n) as the Z-th harmonic (Z≧2) among the frequencies F(p) (n<p≦N) lower than F(n) (#8 , #9). If F(z) is found, the overtone series up to the Zth order of F(z) is expressed as F(q)(z≦
Search within q≦n). Of the Z overtone series of F(z) that should be included in F(q), let W be the number actually found in F(q), and calculate the overtone series content W/Z. (#10). If W/Z is above a certain threshold (YES in #11), F(n) is considered to be an overtone of F(z) and is removed (#12). If F(z) that satisfies the conditions is not found, F(n) is not removed. Note that even if F(n) is removed, the information that a peak exists in F(n) is left so as not to interfere with subsequent processing. After the above processing is performed for all N peaks, processing is moved to the next frame. When the FFT processing section 22 completes the above processing for all frames for which power spectra have been calculated, the processing of the fundamental frequency candidate extraction section 23 ends.

【0012】図6は、図5のデータに基本周波数候補抽
出部23による倍音除去の処理を施した後のデータであ
る。図6では、図5に比べて、倍音除去により不要なデ
ータが除去されていることが分かる。本発明は上記の実
施例に限定するものではなく、その趣旨を逸脱しない範
囲において種々の変更を加えることができる。例えば、
本実施例においては、FFT処理部22のフレーム毎に
基本周波数候補抽出部23の処理を行ったが、予め近接
するフレーム間でパワー・スペクトルの安定部が続く区
間を一つの分析区間として設定し、その分析区間毎に以
降の処理を行うことも可能である。
FIG. 6 shows the data after the data shown in FIG. 5 has been subjected to overtone removal processing by the fundamental frequency candidate extraction section 23. In FIG. 6, compared to FIG. 5, it can be seen that unnecessary data has been removed by overtone removal. The present invention is not limited to the above embodiments, and various changes can be made without departing from the spirit thereof. for example,
In this embodiment, the fundamental frequency candidate extracting section 23 processes each frame of the FFT processing section 22, but the section in which the stable part of the power spectrum continues between adjacent frames is set in advance as one analysis section. , it is also possible to perform subsequent processing for each analysis section.

【0013】[0013]

【発明の効果】以上のように本発明によれば、A/D変
換して取り込んだ音楽信号を周波数解析し、その結果か
ら倍音を除去することによって、実際に鳴っている音の
基本周波数のみを取り出すようにしているので、楽器の
種類や楽器数に制約を受けずに基本周波数を抽出するこ
とができ、採譜することが容易となる。
As described above, according to the present invention, by frequency-analyzing the A/D-converted music signal and removing overtones from the result, only the fundamental frequency of the sound actually being played can be obtained. , the fundamental frequency can be extracted without being restricted by the type of instrument or the number of instruments, making it easy to transcribe.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】  本発明の一実施例による自動採譜装置のブ
ロック図である。
FIG. 1 is a block diagram of an automatic score transcription apparatus according to an embodiment of the present invention.

【図2】  自動採譜装置の基本周波数抽出までの機能
構成図である。
FIG. 2 is a functional configuration diagram of the automatic score transcription device up to fundamental frequency extraction.

【図3】  基本周波数候補抽出部23の構成図である
FIG. 3 is a configuration diagram of a fundamental frequency candidate extraction unit 23.

【図4】  基本周波数候補抽出部23における処理を
示すフローチャートである。
FIG. 4 is a flowchart showing processing in the fundamental frequency candidate extracting unit 23.

【図5】  FFT処理部22により算出された、倍音
除去処理前のパワー・スペクトルの説明図である。
FIG. 5 is an explanatory diagram of a power spectrum calculated by the FFT processing unit 22 before overtone removal processing.

【図6】  図5に基本周波数候補抽出部2による倍音
除去処理を施した後のパワー・スペクトルの説明図であ
る。
6 is an explanatory diagram of the power spectrum after the overtone removal process is performed by the fundamental frequency candidate extraction unit 2 in FIG. 5. FIG.

【符号の説明】[Explanation of symbols]

3  A/D変換装置 5  CPU 6  RAM 21  信号取り込み部 22  FFT処理部 23  基本周波数候補抽出部 31  パワーのしきい値計算手段 32  基本周波数らしさ判定手段 33  基本周波数検索手段 34  倍音系列含有度計算手段 35  倍音除去手段 3 A/D conversion device 5 CPU 6 RAM 21 Signal acquisition section 22 FFT processing section 23 Fundamental frequency candidate extraction unit 31 Power threshold calculation means 32 Fundamental frequency likeness determination means 33 Fundamental frequency search means 34 Overtone series content calculation means 35 Overtone removal means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】  音楽信号を楽譜もしくは楽譜に相当す
る符号に変換する採譜装置において、音楽信号を取り込
みA/D変換する信号取り込み部と、前記信号取り込み
部で取り込んだデータに対して、一定時間毎に周波数解
析を行うことにより、一定時間内での周波数方向のパワ
ー・スペクトルを計算する周波数解析処理部と、前記パ
ワー・スペクトルより基本周波数候補を抽出する基本周
波数候補抽出部とを備えたことを特徴とする自動採譜装
置。
Claim 1. A score transcription device that converts a music signal into a musical score or a code corresponding to the musical score, which includes a signal acquisition section that takes in the music signal and performs A/D conversion, and a signal acquisition section that converts the music signal into an A/D converter, and a signal acquisition section that converts the music signal into a musical score or a code corresponding to the musical score. a frequency analysis processing unit that calculates a power spectrum in the frequency direction within a certain period of time by performing frequency analysis at each time; and a fundamental frequency candidate extraction unit that extracts fundamental frequency candidates from the power spectrum. An automatic music transcription device featuring:
【請求項2】  基本周波数候補抽出部が、パワー・ス
ペクトルのピークからパワーのしきい値を計算するパワ
ーのしきい値計算手段と、前記パワー・スペクトルのピ
ークのうちの一つが演奏音の基本周波数かどうかを、そ
れより高い周波数の他のピークのなかで元のピークの倍
音となっているピークと、元のピークと、両者の間にあ
るピークの周波数とパワーに基づいて判定する基本周波
数らしさ判定手段と、前記パワー・スペクトルのピーク
のうちの一つがそれより低い周波数の他のピークの中の
どれかの倍音となっているかを検索する基本周波数検索
手段と、前記基本周波数検索手段で検索されたピークの
倍音系列が、パワー・スペクトルのピークの中にどの程
度含まれているかどうかを算出する倍音系列含有度計算
手段と、前記パワー・スペクトルのピークのうちの一つ
が他のピークの倍音であると判断された時に、倍音とさ
れた方のピークをパワー・スペクトルから除去する倍音
除去手段とからなることを特徴とする請求項1記載の自
動採譜装置。
2. The fundamental frequency candidate extraction section includes a power threshold calculation means for calculating a power threshold from a peak of a power spectrum, and one of the peaks of the power spectrum is a fundamental frequency candidate of a performance sound. The fundamental frequency, which is determined based on the frequency and power of the peak that is a harmonic of the original peak among other peaks at higher frequencies, the original peak, and the peaks between them. similarity determining means, fundamental frequency searching means for searching whether one of the peaks of the power spectrum is a harmonic of any of the other peaks having a lower frequency, and the fundamental frequency searching means a harmonic series content calculating means for calculating to what extent the harmonic series of the searched peak is included in the peaks of the power spectrum; 2. The automatic score transcription apparatus according to claim 1, further comprising an overtone removing means for removing the peak determined to be an overtone from the power spectrum when the peak is determined to be an overtone.
JP1143291A 1991-01-07 1991-01-07 Automatic transcription device Expired - Fee Related JP2871120B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1143291A JP2871120B2 (en) 1991-01-07 1991-01-07 Automatic transcription device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1143291A JP2871120B2 (en) 1991-01-07 1991-01-07 Automatic transcription device

Publications (2)

Publication Number Publication Date
JPH04261591A true JPH04261591A (en) 1992-09-17
JP2871120B2 JP2871120B2 (en) 1999-03-17

Family

ID=11777922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1143291A Expired - Fee Related JP2871120B2 (en) 1991-01-07 1991-01-07 Automatic transcription device

Country Status (1)

Country Link
JP (1) JP2871120B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015690A (en) * 2001-06-29 2003-01-17 Dainippon Printing Co Ltd Encoding method for acoustic signal
WO2007010638A1 (en) * 2005-07-22 2007-01-25 Kabushiki Kaisha Kawai Gakki Seisakusho Automatic music transcriptor and program
JP2008209550A (en) * 2007-02-26 2008-09-11 National Institute Of Advanced Industrial & Technology Chord discrimination device, chord discrimination method, and program
JP2015043014A (en) * 2013-08-26 2015-03-05 カシオ計算機株式会社 Fundamental tone visualization device, fundamental tone visualization method, and program
JP2019060976A (en) * 2017-09-25 2019-04-18 富士通株式会社 Voice processing program, voice processing method and voice processing device
WO2019092791A1 (en) * 2017-11-07 2019-05-16 ヤマハ株式会社 Data generation device and program

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015690A (en) * 2001-06-29 2003-01-17 Dainippon Printing Co Ltd Encoding method for acoustic signal
JP4697919B2 (en) * 2001-06-29 2011-06-08 大日本印刷株式会社 Method for encoding an acoustic signal
WO2007010638A1 (en) * 2005-07-22 2007-01-25 Kabushiki Kaisha Kawai Gakki Seisakusho Automatic music transcriptor and program
JP2007033479A (en) * 2005-07-22 2007-02-08 Kawai Musical Instr Mfg Co Ltd Automatic music transcription apparatus and program therefor
US7507899B2 (en) 2005-07-22 2009-03-24 Kabushiki Kaisha Kawai Gakki Seisakusho Automatic music transcription apparatus and program
JP2008209550A (en) * 2007-02-26 2008-09-11 National Institute Of Advanced Industrial & Technology Chord discrimination device, chord discrimination method, and program
JP2015043014A (en) * 2013-08-26 2015-03-05 カシオ計算機株式会社 Fundamental tone visualization device, fundamental tone visualization method, and program
JP2019060976A (en) * 2017-09-25 2019-04-18 富士通株式会社 Voice processing program, voice processing method and voice processing device
WO2019092791A1 (en) * 2017-11-07 2019-05-16 ヤマハ株式会社 Data generation device and program
JPWO2019092791A1 (en) * 2017-11-07 2020-07-16 ヤマハ株式会社 Data generator and program
US11430417B2 (en) 2017-11-07 2022-08-30 Yamaha Corporation Data generation device and non-transitory computer-readable storage medium

Also Published As

Publication number Publication date
JP2871120B2 (en) 1999-03-17

Similar Documents

Publication Publication Date Title
US9313593B2 (en) Ranking representative segments in media data
CN110599987A (en) Piano note recognition algorithm based on convolutional neural network
CN113012720B (en) Depression detection method by multi-voice feature fusion under spectral subtraction noise reduction
US20160027421A1 (en) Audio signal analysis
RU2427909C2 (en) Method to generate print for sound signal
CN114582354A (en) Voice control method, device and equipment based on voiceprint recognition and storage medium
CN108847251B (en) Voice duplicate removal method, device, server and storage medium
CN113271386B (en) Howling detection method and device, storage medium and electronic equipment
JP2871120B2 (en) Automatic transcription device
EP1531457B1 (en) Apparatus and method for segmentation of audio data into meta patterns
JP4799333B2 (en) Music classification method, music classification apparatus, and computer program
JP2876861B2 (en) Automatic transcription device
Gurunath Reddy et al. Predominant melody extraction from vocal polyphonic music signal by time-domain adaptive filtering-based method
KR100766170B1 (en) Music summarization apparatus and method using multi-level vector quantization
Chandra Keyword spotting system for Tamil isolated words using Multidimensional MFCC and DTW algorithm
CN113066512B (en) Buddhism music identification method, device, equipment and storage medium
JP2006195384A (en) Musical piece tonality calculating device and music selecting device
JP2004102023A (en) Specific sound signal detection method, signal detection device, signal detection program, and recording medium
JP3102089B2 (en) Automatic transcription device
JP2806048B2 (en) Automatic transcription device
JP3232112B2 (en) Measure boundary time extraction device
Nava et al. A convolutional-kernel based approach for note onset detection in piano-solo audio signals
JP3423233B2 (en) Audio signal processing method and apparatus
JP3012994B2 (en) Phoneme identification method
JPH0451840B2 (en)

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19981208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080108

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100108

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees