JPH04261591A - Automatic music scoreing device - Google Patents
Automatic music scoreing deviceInfo
- Publication number
- JPH04261591A JPH04261591A JP1143291A JP1143291A JPH04261591A JP H04261591 A JPH04261591 A JP H04261591A JP 1143291 A JP1143291 A JP 1143291A JP 1143291 A JP1143291 A JP 1143291A JP H04261591 A JPH04261591 A JP H04261591A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- fundamental frequency
- peak
- power spectrum
- peaks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 32
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 238000000605 extraction Methods 0.000 claims description 13
- 238000013518 transcription Methods 0.000 claims description 12
- 230000035897 transcription Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
Description
【0001】0001
【産業上の利用分野】本発明は、音楽を楽譜もしくは楽
譜に相当する符号に変換する自動採譜装置に係り、さら
に詳細には、実際に鳴っている音である基本周波数の抽
出のための構成に関する。[Field of Industrial Application] The present invention relates to an automatic score transcription device that converts music into a musical score or a code corresponding to a musical score, and more specifically, the present invention relates to an automatic score transcription device that converts music into a musical score or a code corresponding to a musical score. Regarding.
【0002】0002
【従来の技術】従来、複数の楽器によって演奏された音
楽の採譜は、音楽的知識を有する採譜者によって行われ
てきた。また、採譜を人が行うのでなく装置により自動
的に行うものでは、単音からなる音楽を採譜したり、あ
るいは鍵盤の押された情報から採譜を行う装置が提案さ
れている。2. Description of the Related Art Conventionally, music played by a plurality of musical instruments has been transcribed by a transcriber with musical knowledge. In addition, in the case where music is automatically transcribed by a device rather than by a person, there have been proposed devices that transcribe music consisting of single notes or that transcribe music based on information about keyboard presses.
【0003】0003
【発明が解決しようとする課題】しかしながら、従来の
採譜装置では、楽器の種類や楽器数に制約があり、採譜
の範囲が限定され、一般的な音楽の演奏をそのまま採譜
できないという問題があった。また、複数の楽器によっ
て演奏された音楽をA/D変換した信号をFFT等によ
り周波数分析しただけでは、各楽器の倍音が多数観測さ
れ、どの音が基本周波数であるのか容易に判断できない
という問題があった。本発明は、上述した問題点を解決
するもので、音楽をA/D変換した信号を周波数分析し
、その結果から倍音を除去し、基本周波数のみを取り出
すことによって、楽器の種類や楽器数に制約を受けない
自動採譜装置を提供することを目的とする。[Problems to be Solved by the Invention] However, with conventional music transcription devices, there are restrictions on the types and number of instruments, which limits the range of music transcription, and there is a problem in that it is not possible to transcribe general musical performances as they are. . Another problem is that if you simply frequency-analyze the A/D-converted signal of music played by multiple instruments using FFT, etc., many harmonics of each instrument will be observed, making it impossible to easily determine which sound is the fundamental frequency. was there. The present invention solves the above-mentioned problems by frequency-analyzing the A/D-converted music signal, removing overtones from the result, and extracting only the fundamental frequency. The purpose is to provide an automatic score transcription device that is not subject to restrictions.
【0004】0004
【課題を解決するための手段】上記目的を達成するため
に請求項1の発明は、音楽信号を楽譜もしくは楽譜に相
当する符号に変換する採譜装置において、音楽信号を取
り込みA/D変換する信号取り込み部と、前記信号取り
込み部で取り込んだデータに対して、一定時間毎に周波
数解析を行うことにより、一定時間内での周波数方向の
パワー・スペクトルを計算する周波数解析処理部と、前
記パワー・スペクトルより基本周波数候補を抽出する基
本周波数候補抽出部とを備えたものである。請求項2の
発明は、上記の基本周波数候補抽出部が、パワー・スペ
クトルのピークからパワーのしきい値を計算するパワー
のしきい値計算手段と、前記パワー・スペクトルのピー
クのうちの一つが演奏音の基本周波数かどうかを、それ
より高い周波数の他のピークのなかで元のピークの倍音
となっているピークと、元のピークと、両者の間にある
ピークの周波数とパワーに基づいて判定する基本周波数
らしさ判定手段と、前記パワー・スペクトルのピークの
うちの一つがそれより低い周波数の他のピークの中のど
れかの倍音となっているかを検索する基本周波数検索手
段と、前記基本周波数検索手段で検索されたピークの倍
音系列が、パワー・スペクトルのピークの中にどの程度
含まれているかどうかを算出する倍音系列含有度計算手
段と、前記パワー・スペクトルのピークのうちの一つが
他のピークの倍音であると判断された時に、倍音とされ
た方のピークをパワー・スペクトルから除去する倍音除
去手段とからなるものである。Means for Solving the Problems In order to achieve the above object, the invention of claim 1 provides a score recording device that converts a music signal into a musical score or a code corresponding to the musical score, in which a music signal is taken in and A/D converted. an acquisition unit; a frequency analysis processing unit that calculates a power spectrum in the frequency direction within a certain time by performing frequency analysis on the data acquired by the signal acquisition unit at certain time intervals; and a fundamental frequency candidate extraction section that extracts fundamental frequency candidates from the spectrum. The invention according to claim 2 is characterized in that the fundamental frequency candidate extracting unit includes power threshold calculation means for calculating a power threshold from the peak of the power spectrum, and Determines whether a performance note has the fundamental frequency based on the frequency and power of the peak that is a harmonic of the original peak among other peaks with higher frequencies, the original peak, and the peaks between the two. fundamental frequency retrieval means for determining whether one of the peaks of the power spectrum is a harmonic of any of the other peaks having a lower frequency; a harmonic series content calculation means for calculating to what extent the harmonic series of the peak searched by the frequency search means is included in the peaks of the power spectrum; The overtone removing means removes the peak determined to be an overtone from the power spectrum when the peak is determined to be an overtone of another peak.
【0005】[0005]
【作用】請求項1の構成によれば、信号取り込み部は、
音楽をA/D変換し、計算機内で扱えるデジタル信号に
する。周波数解析処理部は、信号取り込み部で取り込ん
だデータに対して、ある一定時間毎に周波数解析を行う
ことにより、前記一定時間内での周波数方向のパワー・
スペクトルを計算する。基本周波数候補抽出部はこのパ
ワー・スペクトルより基本周波数候補を抽出する。請求
項2に記載した基本周波数候補抽出部を構成する各手段
は以下のような作用をする。パワーのしきい値計算手段
は、パワー・スペクトルのピークからパワーのしきい値
を計算する。基本周波数らしさ判定手段は、パワー・ス
ペクトルのピークのうちの一つが基本周波数かどうかを
、それより高い周波数の他のピークのなかで元のピーク
の倍音となっているピークと、元のピークと、両者の間
にあるピークの周波数とパワーとから判定する。基本周
波数検索手段は、前記パワー・スペクトルのピークのう
ちの一つが、それより低い周波数の他のピークの中のど
れかの倍音となっているかを検索する。倍音系列含有度
計算手段は、前記基本周波数検索手段で検索されたピー
クの倍音系列が、パワー・スペクトルのピークの中にど
の程度含まれているかどうかを算出する。倍音除去手段
は、前記パワー・スペクトルのピークのうちの一つが他
のピークの倍音であると判断された場合に、倍音とされ
た方のピークをパワー・スペクトルから除去する。[Operation] According to the structure of claim 1, the signal acquisition section:
Converts music from A/D to a digital signal that can be handled within a computer. The frequency analysis processing section performs frequency analysis on the data acquired by the signal acquisition section at certain fixed time intervals, thereby calculating the power/power in the frequency direction within the fixed time period.
Calculate the spectrum. The fundamental frequency candidate extraction section extracts fundamental frequency candidates from this power spectrum. Each means constituting the fundamental frequency candidate extracting section described in claim 2 operates as follows. The power threshold calculation means calculates a power threshold from the peak of the power spectrum. The fundamental frequency similarity determining means determines whether one of the peaks in the power spectrum is a fundamental frequency or not, and compares it with a peak that is a harmonic of the original peak among other peaks with higher frequencies, and a peak that is a harmonic of the original peak. , based on the frequency and power of the peak between the two. The fundamental frequency search means searches whether one of the peaks of the power spectrum is a harmonic of any of the other peaks having a lower frequency. The harmonic series content calculating means calculates to what extent the harmonic series of the peak searched by the fundamental frequency searching means is included in the peaks of the power spectrum. The overtone removing means removes the peak determined to be an overtone from the power spectrum when it is determined that one of the peaks of the power spectrum is an overtone of another peak.
【0006】[0006]
【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。図1は本発明による自動採譜装置の
ブロック図である。本装置は、音楽信号が入力されるオ
ーディオ・アンプ1と、ローパス・フィルター2と、A
/D変換装置3と、I/Oポート4と、基本周波数候補
を抽出処理するCPU5と、RAM6と、ROM7と、
抽出した結果を表示するデイスプレイ8とから構成され
ている。DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment embodying the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram of an automatic score transcription apparatus according to the present invention. This device includes an audio amplifier 1 to which a music signal is input, a low-pass filter 2, and an A
/D conversion device 3, I/O port 4, CPU 5 for extracting fundamental frequency candidates, RAM 6, ROM 7,
It is composed of a display 8 that displays the extracted results.
【0007】次に、上記図1に図2、図3を加えて、本
自動採譜装置により行われる基本周波数抽出処理のため
の機能構成を説明する。本装置は、機能構成要素として
、信号取り込み部21と高速フーリエ変換(FFT)処
理部22と基本周波数候補抽出部23とからなる。信号
取り込み部21は、オーディオ・アンプ1、ローパス・
フィルタ2、A/D変換装置3、I/Oポート4、CP
U5等により構成される。入力された音楽信号はオーデ
ィオ・アンプ1により増幅され、この増幅された信号は
、ローパス・フィルタ2に入力され、例えば、5.5k
Hz以下の周波数成分のみが通過し、標本化時の折返し
歪みを抑えている。この出力信号は、A/D変換装置3
により12kHz、16bitで標本化される。標本化
されたデータは、I/Oポート4を介し、CPU5に取
り込まれ、RAM6に記憶される。Next, by adding FIGS. 2 and 3 to FIG. 1 above, the functional configuration for fundamental frequency extraction processing performed by the automatic score transcription apparatus will be explained. This device includes a signal acquisition section 21, a fast Fourier transform (FFT) processing section 22, and a fundamental frequency candidate extraction section 23 as functional components. The signal acquisition unit 21 includes an audio amplifier 1, a low-pass
Filter 2, A/D converter 3, I/O port 4, CP
Consists of U5 etc. The input music signal is amplified by the audio amplifier 1, and this amplified signal is input to the low-pass filter 2, for example, 5.5k.
Only frequency components below Hz pass through, suppressing aliasing distortion during sampling. This output signal is transmitted to the A/D converter 3
The signal is sampled at 12 kHz and 16 bits. The sampled data is taken into the CPU 5 via the I/O port 4 and stored in the RAM 6.
【0008】FFT処理部22は、CPU5、RAM6
等でなり、CPU5はRAM6より標本化されたデータ
を読み出し、25msec毎を1フレームとし、1フレ
ーム毎に85.3msecハミング窓を掛けた後、FF
T分析により対数パワー・スペクトルが算出される。次
に、CPU5は、算出された対数パワー・スペクトルか
ら放射線内挿処理によりピーク周波数を求める。図5は
以上のようにして求めたピーク・スペクトルを、時間軸
を横軸に、ピーク周波数を鍵盤番号に変換して縦軸にと
り、強度を濃淡で示したものである。同図は倍音除去前
のデータである。基本周波数候補抽出部23は、CPU
5でなり、図3のようにパワーのしきい値計算手段31
と、基本周波数らしさ判定手段32と、基本周波数検索
手段33と、倍音系列含有度計算手段34と、倍音除去
手段35とから構成されている。[0008] The FFT processing section 22 includes a CPU 5 and a RAM 6.
etc., the CPU 5 reads the sampled data from the RAM 6, takes every 25 msec as one frame, multiplies an 85.3 msec Hamming window for each frame, and then reads the sampled data from the FF
A logarithmic power spectrum is calculated by T analysis. Next, the CPU 5 determines the peak frequency from the calculated logarithmic power spectrum by radiation interpolation processing. FIG. 5 shows the peak spectrum obtained as described above, with the time axis on the horizontal axis and the peak frequency converted into a keyboard number on the vertical axis, and the intensity shown in shading. The figure shows data before overtone removal. The fundamental frequency candidate extracting unit 23 uses the CPU
5, and the power threshold calculation means 31 as shown in FIG.
, a fundamental frequency likelihood determining means 32 , a fundamental frequency searching means 33 , an overtone series content calculating means 34 , and an overtone removing means 35 .
【0009】基本周波数候補抽出部23では、FFT処
理部22の各フレーム毎に処理を進める。いま、あるフ
レームに対して、FFT処理部22で求めたスペクトル
のピークがN個あるとし、以下、図4のフローチャート
に従って説明する。図4は、基本周波数候補抽出部23
での処理を、ある1フレーム分について示したものであ
る。N個のピークについては、各々周波数Fとパワーの
値Pが周波数によってソートされてRAM6に記憶され
ている。このN個のピークのパワーの値から、パワーに
よるしきい値Spを計算する(ステップ#1)。N個の
ピークについては、周波数の高い方から低い方へ、順に
処理を進める。N個のピークの、周波数の高い方からn
番目のピークの周波数をF(n)、パワーをP(n)と
する。F(n)が基本周波数であるかどうかを、F(n
)よりも高い周波数F(m)およびパワーP(m)(1
≦m<n)から判定する(#2,#3)。この判定は以
下のようにして行う。まず、F(m)の中にF(n)の
第X次倍音(X≧2)となっているF(x)があるかど
うか探す。F(x)が見つかった場合、F(n)とF(
x)の関係は、F(n)が基本周波数で、F(x)が第
X次倍音となっている場合(これをケース1とする)と
、F(n)、F(x)がより低い、両者の公約数となっ
ている周波数の、それぞれれL次(L≧2)、L×X次
倍音となっている場合(これをケース2とする)とがあ
り得る。[0009] The fundamental frequency candidate extracting section 23 advances the processing for each frame of the FFT processing section 22. Now, it is assumed that there are N peaks in the spectrum obtained by the FFT processing unit 22 for a certain frame, and the following description will be made according to the flowchart of FIG. FIG. 4 shows the fundamental frequency candidate extraction unit 23
This figure shows the processing for one frame. Regarding the N peaks, the frequency F and power value P are sorted by frequency and stored in the RAM 6. A power threshold Sp is calculated from the power values of these N peaks (step #1). Regarding the N peaks, processing is performed in order from the highest frequency to the lowest frequency. Of N peaks, n from the highest frequency
Let the frequency of the th peak be F(n) and the power be P(n). Check whether F(n) is the fundamental frequency by F(n
) higher frequency F(m) and power P(m)(1
Judgment is made from ≦m<n) (#2, #3). This determination is made as follows. First, a search is made to see if there is an F(x) in F(m) that is the X-th harmonic (X≧2) of F(n). If F(x) is found, then F(n) and F(
x) relationship is when F(n) is the fundamental frequency and F(x) is the There may be a case (this is referred to as case 2) where the low frequency is an L-order (L≧2) or L×X-order overtone of a frequency that is a common divisor of both.
【0010】このどちらの場合であるかを判断するため
に、F(x)とF(n)の間に存在する周波数F(y)
、およびパワーP(y)(x<y<n)について、以下
のような処理をする。P(y)>(P(x)+P(n)
)/2であれば、F(y)とF(x)、F(n)の周波
数差を計算する。いま、Fxy=F(x)−F(y)、
Fyn=F(y)−F(n)とする。FxyとFynの
小さい方をF0とする。F0がF(n)、F(x)を両
方とも倍音とする場合は、前述のケース2である可能性
が高いので、F(n)は基本周波数でないと判断する。
また、F(x)が見つからなかった場合もF(n)は基
本周波数でないと判断する。これ以外の場合、すなわち
F(m)の中に存在するF(n)の第X次倍音(X≧2
)となっている全てのF(x)について、F(x)とF
(n)の間に存在するF(y)から計算された全てのF
0の中に、F(n)、F(x)を両方とも倍音とするも
のがひとつもない場合、F(n)は基本周波数であると
判断される。In order to determine which of these cases is the case, the frequency F(y) that exists between F(x) and F(n) is
, and power P(y) (x<y<n), the following processing is performed. P(y)>(P(x)+P(n)
)/2, calculate the frequency difference between F(y), F(x), and F(n). Now, Fxy=F(x)-F(y),
Let Fyn=F(y)−F(n). The smaller of Fxy and Fyn is set as F0. If F0 has both F(n) and F(x) as overtones, the above-mentioned case 2 is likely, and therefore F(n) is determined not to be the fundamental frequency. Also, if F(x) is not found, it is determined that F(n) is not the fundamental frequency. In other cases, that is, the Xth harmonic of F(n) existing in F(m) (X≧2
) for all F(x), F(x) and F
All F calculated from F(y) existing between (n)
If there is no one in which both F(n) and F(x) are overtones, F(n) is determined to be the fundamental frequency.
【0011】以上により、P(n)>SpかつF(n)
が基本周波数であると判断された場合は(#4,#5で
YES)、そのピークは基本周波数であるとして次のピ
ークに処理を移す(#6,#7)。そうでない場合は、
F(n)よりも低い周波数F(p)(n<p≦N)の中
に、F(n)を第Z次倍音(Z≧2)とするF(z)が
あるか探す(#8,#9)。F(z)が見つかった場合
には、F(z)のZ次までの倍音系列をF(q)(z≦
q≦n)の中で探す。F(q)の中にZ個含まれるはず
のF(z)の倍音系列のうち、実際にF(q)の中で見
つかった個数をW個とし、倍音系列含有度W/Zを計算
する(#10)。W/Zがあるしきい値以上の場合には
(#11でYES)、F(n)はF(z)の倍音である
として除去する(#12)。条件を満たすF(z)が見
つからなかった場合には、F(n)を除去しない。なお
、F(n)を除去した場合でも以降の処理に支障をきた
すことのないように、F(n)にピークが存在したとい
う情報は残しておく。以上の処理をN個のピーク全てに
ついて行ったら、次のフレームに処理を移す。FFT処
理部22でパワー・スペクトルを算出した全てのフレー
ムについて以上の処理を終了した時、基本周波数候補抽
出部23の処理が終了する。From the above, P(n)>Sp and F(n)
If it is determined that is the fundamental frequency (YES in #4, #5), that peak is determined to be the fundamental frequency, and processing is shifted to the next peak (#6, #7). If not,
Search for F(z) with F(n) as the Z-th harmonic (Z≧2) among the frequencies F(p) (n<p≦N) lower than F(n) (#8 , #9). If F(z) is found, the overtone series up to the Zth order of F(z) is expressed as F(q)(z≦
Search within q≦n). Of the Z overtone series of F(z) that should be included in F(q), let W be the number actually found in F(q), and calculate the overtone series content W/Z. (#10). If W/Z is above a certain threshold (YES in #11), F(n) is considered to be an overtone of F(z) and is removed (#12). If F(z) that satisfies the conditions is not found, F(n) is not removed. Note that even if F(n) is removed, the information that a peak exists in F(n) is left so as not to interfere with subsequent processing. After the above processing is performed for all N peaks, processing is moved to the next frame. When the FFT processing section 22 completes the above processing for all frames for which power spectra have been calculated, the processing of the fundamental frequency candidate extraction section 23 ends.
【0012】図6は、図5のデータに基本周波数候補抽
出部23による倍音除去の処理を施した後のデータであ
る。図6では、図5に比べて、倍音除去により不要なデ
ータが除去されていることが分かる。本発明は上記の実
施例に限定するものではなく、その趣旨を逸脱しない範
囲において種々の変更を加えることができる。例えば、
本実施例においては、FFT処理部22のフレーム毎に
基本周波数候補抽出部23の処理を行ったが、予め近接
するフレーム間でパワー・スペクトルの安定部が続く区
間を一つの分析区間として設定し、その分析区間毎に以
降の処理を行うことも可能である。FIG. 6 shows the data after the data shown in FIG. 5 has been subjected to overtone removal processing by the fundamental frequency candidate extraction section 23. In FIG. 6, compared to FIG. 5, it can be seen that unnecessary data has been removed by overtone removal. The present invention is not limited to the above embodiments, and various changes can be made without departing from the spirit thereof. for example,
In this embodiment, the fundamental frequency candidate extracting section 23 processes each frame of the FFT processing section 22, but the section in which the stable part of the power spectrum continues between adjacent frames is set in advance as one analysis section. , it is also possible to perform subsequent processing for each analysis section.
【0013】[0013]
【発明の効果】以上のように本発明によれば、A/D変
換して取り込んだ音楽信号を周波数解析し、その結果か
ら倍音を除去することによって、実際に鳴っている音の
基本周波数のみを取り出すようにしているので、楽器の
種類や楽器数に制約を受けずに基本周波数を抽出するこ
とができ、採譜することが容易となる。As described above, according to the present invention, by frequency-analyzing the A/D-converted music signal and removing overtones from the result, only the fundamental frequency of the sound actually being played can be obtained. , the fundamental frequency can be extracted without being restricted by the type of instrument or the number of instruments, making it easy to transcribe.
【図1】 本発明の一実施例による自動採譜装置のブ
ロック図である。FIG. 1 is a block diagram of an automatic score transcription apparatus according to an embodiment of the present invention.
【図2】 自動採譜装置の基本周波数抽出までの機能
構成図である。FIG. 2 is a functional configuration diagram of the automatic score transcription device up to fundamental frequency extraction.
【図3】 基本周波数候補抽出部23の構成図である
。FIG. 3 is a configuration diagram of a fundamental frequency candidate extraction unit 23.
【図4】 基本周波数候補抽出部23における処理を
示すフローチャートである。FIG. 4 is a flowchart showing processing in the fundamental frequency candidate extracting unit 23.
【図5】 FFT処理部22により算出された、倍音
除去処理前のパワー・スペクトルの説明図である。FIG. 5 is an explanatory diagram of a power spectrum calculated by the FFT processing unit 22 before overtone removal processing.
【図6】 図5に基本周波数候補抽出部2による倍音
除去処理を施した後のパワー・スペクトルの説明図であ
る。6 is an explanatory diagram of the power spectrum after the overtone removal process is performed by the fundamental frequency candidate extraction unit 2 in FIG. 5. FIG.
3 A/D変換装置 5 CPU 6 RAM 21 信号取り込み部 22 FFT処理部 23 基本周波数候補抽出部 31 パワーのしきい値計算手段 32 基本周波数らしさ判定手段 33 基本周波数検索手段 34 倍音系列含有度計算手段 35 倍音除去手段 3 A/D conversion device 5 CPU 6 RAM 21 Signal acquisition section 22 FFT processing section 23 Fundamental frequency candidate extraction unit 31 Power threshold calculation means 32 Fundamental frequency likeness determination means 33 Fundamental frequency search means 34 Overtone series content calculation means 35 Overtone removal means
Claims (2)
る符号に変換する採譜装置において、音楽信号を取り込
みA/D変換する信号取り込み部と、前記信号取り込み
部で取り込んだデータに対して、一定時間毎に周波数解
析を行うことにより、一定時間内での周波数方向のパワ
ー・スペクトルを計算する周波数解析処理部と、前記パ
ワー・スペクトルより基本周波数候補を抽出する基本周
波数候補抽出部とを備えたことを特徴とする自動採譜装
置。Claim 1. A score transcription device that converts a music signal into a musical score or a code corresponding to the musical score, which includes a signal acquisition section that takes in the music signal and performs A/D conversion, and a signal acquisition section that converts the music signal into an A/D converter, and a signal acquisition section that converts the music signal into a musical score or a code corresponding to the musical score. a frequency analysis processing unit that calculates a power spectrum in the frequency direction within a certain period of time by performing frequency analysis at each time; and a fundamental frequency candidate extraction unit that extracts fundamental frequency candidates from the power spectrum. An automatic music transcription device featuring:
ペクトルのピークからパワーのしきい値を計算するパワ
ーのしきい値計算手段と、前記パワー・スペクトルのピ
ークのうちの一つが演奏音の基本周波数かどうかを、そ
れより高い周波数の他のピークのなかで元のピークの倍
音となっているピークと、元のピークと、両者の間にあ
るピークの周波数とパワーに基づいて判定する基本周波
数らしさ判定手段と、前記パワー・スペクトルのピーク
のうちの一つがそれより低い周波数の他のピークの中の
どれかの倍音となっているかを検索する基本周波数検索
手段と、前記基本周波数検索手段で検索されたピークの
倍音系列が、パワー・スペクトルのピークの中にどの程
度含まれているかどうかを算出する倍音系列含有度計算
手段と、前記パワー・スペクトルのピークのうちの一つ
が他のピークの倍音であると判断された時に、倍音とさ
れた方のピークをパワー・スペクトルから除去する倍音
除去手段とからなることを特徴とする請求項1記載の自
動採譜装置。2. The fundamental frequency candidate extraction section includes a power threshold calculation means for calculating a power threshold from a peak of a power spectrum, and one of the peaks of the power spectrum is a fundamental frequency candidate of a performance sound. The fundamental frequency, which is determined based on the frequency and power of the peak that is a harmonic of the original peak among other peaks at higher frequencies, the original peak, and the peaks between them. similarity determining means, fundamental frequency searching means for searching whether one of the peaks of the power spectrum is a harmonic of any of the other peaks having a lower frequency, and the fundamental frequency searching means a harmonic series content calculating means for calculating to what extent the harmonic series of the searched peak is included in the peaks of the power spectrum; 2. The automatic score transcription apparatus according to claim 1, further comprising an overtone removing means for removing the peak determined to be an overtone from the power spectrum when the peak is determined to be an overtone.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1143291A JP2871120B2 (en) | 1991-01-07 | 1991-01-07 | Automatic transcription device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1143291A JP2871120B2 (en) | 1991-01-07 | 1991-01-07 | Automatic transcription device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04261591A true JPH04261591A (en) | 1992-09-17 |
JP2871120B2 JP2871120B2 (en) | 1999-03-17 |
Family
ID=11777922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1143291A Expired - Fee Related JP2871120B2 (en) | 1991-01-07 | 1991-01-07 | Automatic transcription device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2871120B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003015690A (en) * | 2001-06-29 | 2003-01-17 | Dainippon Printing Co Ltd | Encoding method for acoustic signal |
WO2007010638A1 (en) * | 2005-07-22 | 2007-01-25 | Kabushiki Kaisha Kawai Gakki Seisakusho | Automatic music transcriptor and program |
JP2008209550A (en) * | 2007-02-26 | 2008-09-11 | National Institute Of Advanced Industrial & Technology | Chord discrimination device, chord discrimination method, and program |
JP2015043014A (en) * | 2013-08-26 | 2015-03-05 | カシオ計算機株式会社 | Fundamental tone visualization device, fundamental tone visualization method, and program |
JP2019060976A (en) * | 2017-09-25 | 2019-04-18 | 富士通株式会社 | Voice processing program, voice processing method and voice processing device |
WO2019092791A1 (en) * | 2017-11-07 | 2019-05-16 | ヤマハ株式会社 | Data generation device and program |
-
1991
- 1991-01-07 JP JP1143291A patent/JP2871120B2/en not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003015690A (en) * | 2001-06-29 | 2003-01-17 | Dainippon Printing Co Ltd | Encoding method for acoustic signal |
JP4697919B2 (en) * | 2001-06-29 | 2011-06-08 | 大日本印刷株式会社 | Method for encoding an acoustic signal |
WO2007010638A1 (en) * | 2005-07-22 | 2007-01-25 | Kabushiki Kaisha Kawai Gakki Seisakusho | Automatic music transcriptor and program |
JP2007033479A (en) * | 2005-07-22 | 2007-02-08 | Kawai Musical Instr Mfg Co Ltd | Automatic music transcription apparatus and program therefor |
US7507899B2 (en) | 2005-07-22 | 2009-03-24 | Kabushiki Kaisha Kawai Gakki Seisakusho | Automatic music transcription apparatus and program |
JP2008209550A (en) * | 2007-02-26 | 2008-09-11 | National Institute Of Advanced Industrial & Technology | Chord discrimination device, chord discrimination method, and program |
JP2015043014A (en) * | 2013-08-26 | 2015-03-05 | カシオ計算機株式会社 | Fundamental tone visualization device, fundamental tone visualization method, and program |
JP2019060976A (en) * | 2017-09-25 | 2019-04-18 | 富士通株式会社 | Voice processing program, voice processing method and voice processing device |
WO2019092791A1 (en) * | 2017-11-07 | 2019-05-16 | ヤマハ株式会社 | Data generation device and program |
JPWO2019092791A1 (en) * | 2017-11-07 | 2020-07-16 | ヤマハ株式会社 | Data generator and program |
US11430417B2 (en) | 2017-11-07 | 2022-08-30 | Yamaha Corporation | Data generation device and non-transitory computer-readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2871120B2 (en) | 1999-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9313593B2 (en) | Ranking representative segments in media data | |
CN110599987A (en) | Piano note recognition algorithm based on convolutional neural network | |
CN113012720B (en) | Depression detection method by multi-voice feature fusion under spectral subtraction noise reduction | |
US20160027421A1 (en) | Audio signal analysis | |
RU2427909C2 (en) | Method to generate print for sound signal | |
CN114582354A (en) | Voice control method, device and equipment based on voiceprint recognition and storage medium | |
CN108847251B (en) | Voice duplicate removal method, device, server and storage medium | |
CN113271386B (en) | Howling detection method and device, storage medium and electronic equipment | |
JP2871120B2 (en) | Automatic transcription device | |
EP1531457B1 (en) | Apparatus and method for segmentation of audio data into meta patterns | |
JP4799333B2 (en) | Music classification method, music classification apparatus, and computer program | |
JP2876861B2 (en) | Automatic transcription device | |
Gurunath Reddy et al. | Predominant melody extraction from vocal polyphonic music signal by time-domain adaptive filtering-based method | |
KR100766170B1 (en) | Music summarization apparatus and method using multi-level vector quantization | |
Chandra | Keyword spotting system for Tamil isolated words using Multidimensional MFCC and DTW algorithm | |
CN113066512B (en) | Buddhism music identification method, device, equipment and storage medium | |
JP2006195384A (en) | Musical piece tonality calculating device and music selecting device | |
JP2004102023A (en) | Specific sound signal detection method, signal detection device, signal detection program, and recording medium | |
JP3102089B2 (en) | Automatic transcription device | |
JP2806048B2 (en) | Automatic transcription device | |
JP3232112B2 (en) | Measure boundary time extraction device | |
Nava et al. | A convolutional-kernel based approach for note onset detection in piano-solo audio signals | |
JP3423233B2 (en) | Audio signal processing method and apparatus | |
JP3012994B2 (en) | Phoneme identification method | |
JPH0451840B2 (en) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19981208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080108 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090108 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090108 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100108 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |