JP5330720B2 - Chord identification method, chord identification device, and learning device - Google Patents

Chord identification method, chord identification device, and learning device Download PDF

Info

Publication number
JP5330720B2
JP5330720B2 JP2008076851A JP2008076851A JP5330720B2 JP 5330720 B2 JP5330720 B2 JP 5330720B2 JP 2008076851 A JP2008076851 A JP 2008076851A JP 2008076851 A JP2008076851 A JP 2008076851A JP 5330720 B2 JP5330720 B2 JP 5330720B2
Authority
JP
Japan
Prior art keywords
chord
musical
musical tone
hyperplane
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008076851A
Other languages
Japanese (ja)
Other versions
JP2009229940A (en
Inventor
義久 石田
大 藤枝
桂 川上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MEIJI UNIVERSITY LEGAL PERSON
MTI Ltd
Original Assignee
MEIJI UNIVERSITY LEGAL PERSON
MTI Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MEIJI UNIVERSITY LEGAL PERSON, MTI Ltd filed Critical MEIJI UNIVERSITY LEGAL PERSON
Priority to JP2008076851A priority Critical patent/JP5330720B2/en
Publication of JP2009229940A publication Critical patent/JP2009229940A/en
Application granted granted Critical
Publication of JP5330720B2 publication Critical patent/JP5330720B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide technology for identifying a chord with high accuracy, without performing complicated operation. <P>SOLUTION: A vector storage section 101 stores a learning vector 100 for expressing a feature of one musical tone which is input by grouping it. A hyper-plane calculation device 102 calculates a hyper-plane for each group by using the learning vector 100 belonging to the group. A parameter for expressing the hyper-plane is stored in one of corresponding storage devices 111 to 114. Evaluation devices 121 to 124 refer to the parameter of the corresponding storage devices 111 to 114, and calculates a determination object vector 150 for expressing the chord and a distance including positive/negative between the vector and the corresponding hyper-plane, as an evaluation value. A determination device 130 determines a group to which a musical tone constituting the chord expressed by the determination object vector 150 belongs, from the evaluation value. <P>COPYRIGHT: (C)2010,JPO&amp;INPIT

Description

本発明は、複数の楽音から構成される和音を同定するための技術に関する。  The present invention relates to a technique for identifying a chord composed of a plurality of musical sounds.

図6は、従来の和音同定装置の構成を示す図である。その図6を参照して、従来の和音同定装置について具体的に説明する。その同定装置は、図6に示すように、判定対象ベクトル600が入力されるセレクタ601、複数のフィルター621〜624、比較選択器630、レジスタ632、及び記憶装置640を備えた構成となっている。   FIG. 6 is a diagram showing a configuration of a conventional chord identification device. With reference to FIG. 6, a conventional chord identification device will be specifically described. As shown in FIG. 6, the identification device includes a selector 601 to which a determination target vector 600 is input, a plurality of filters 621 to 624, a comparison selector 630, a register 632, and a storage device 640. .

判定対象ベクトル600は、例えば和音の波形信号をサンプリングして得られた波形データである。セレクタ601は、その判定対象ベクトル600と、レジスタ632から出力されるベクトル634とを入力し、そのうちの一つを各フィルター621〜624に出力する。   The determination target vector 600 is waveform data obtained by sampling a chord waveform signal, for example. The selector 601 inputs the determination target vector 600 and the vector 634 output from the register 632, and outputs one of them to the filters 621 to 624.

セレクタ601が選択するベクトルの切り換えや、ベクトル634の更新により、この和音同定装置はサイクル的な動作を行うようになっている。そのサイクル的な動作を通して、和音を構成する楽音(周波数)は順次、判定される。和音同定の開始時、つまり第1サイクルは、セレクタ601により判定対象ベクトル600を選択させる。   The chord identification apparatus performs a cyclic operation by switching the vector selected by the selector 601 or updating the vector 634. Through the cyclic operation, the musical tones (frequency) constituting the chord are sequentially determined. At the start of chord identification, that is, in the first cycle, the determination target vector 600 is selected by the selector 601.

各フィルター621〜624は、それぞれ特定の周波数F1〜F12に対応するものである。即ち、たとえばフィルター621は、セレクタ621から入力したベクトルのうち、周波数F1、及びその高調波となる周波数(=F1×k:ただしkは2以上の整数)に対応する信号成分のみを除去するように機能する。従ってフィルター621から出力される信号は、入力したベクトルから周波数F1及びその高調波となる周波数の信号成分を除去したパワー・スペクトラムとなる。フィルターとしては、図6には計4個のフィルター621〜624のみ示しているが、実際にはより多く搭載されている。   The filters 621 to 624 correspond to specific frequencies F1 to F12, respectively. That is, for example, the filter 621 removes only the signal component corresponding to the frequency F1 and the harmonic frequency thereof (= F1 × k: k is an integer of 2 or more) from the vector input from the selector 621. To work. Therefore, the signal output from the filter 621 becomes a power spectrum obtained by removing the frequency F1 and the signal component of the frequency that is a harmonic thereof from the input vector. FIG. 6 shows only a total of four filters 621 to 624 as filters, but more filters are actually mounted.

比較選択器630は、各フィルター621〜624から入力した信号(パワー・スペクトラム)のなかで最小のものを選択し、それをベクトル631としてレジスタ632に出力する。それにより、たとえば最小の信号がフィルター621から入力したものであった場合、ベクトル631としては入力ベクトル(和音同定の開始時は判定対象ベクトル600)から周波数F1の信号成分が除去されたものが選択・出力されることになる。また、比較選択器630は、信号を選択したフィルター、つまり最も信号成分が大きい周波数の情報(周波数情報)を信号635として記憶装置640に出力する。それにより、記憶装置640はその信号635を保存する。以降、信号635は「周波数情報」と呼ぶことにする。   The comparison selector 630 selects the minimum signal (power spectrum) input from each of the filters 621 to 624 and outputs it as a vector 631 to the register 632. Thus, for example, when the minimum signal is input from the filter 621, the vector 631 is selected from the input vector (the determination target vector 600 at the start of chord identification) from which the signal component of the frequency F1 has been removed. -It will be output. Further, the comparison / selection device 630 outputs the filter that has selected the signal, that is, information on the frequency having the largest signal component (frequency information) to the storage device 640 as the signal 635. Thereby, the storage device 640 stores the signal 635. Hereinafter, the signal 635 will be referred to as “frequency information”.

周波数情報635の保存により、際1サイクルの動作が終了する。次の第2サイクルでは、セレクタ601にベクトル634を選択させて、同様の処理が行われる。   Saving the frequency information 635 completes the operation of one cycle. In the next second cycle, the selector 601 selects the vector 634 and the same processing is performed.

この第2サイクルで選択されるベクトル634、つまりレジスタ632が保存しているベクトル631は、最大の周波数成分が除去された判定対象ベクトル600である。このため比較選択器630は、最大の周波数成分に加えて、2番目に大きい周波数成分を除去した判定対象ベクトル600をベクトル631としてレジスタ632に出力することになる。周波数情報635としては、2番目に信号成分の大きい周波数を示す周波数情報を出力することになる。   The vector 634 selected in the second cycle, that is, the vector 631 stored in the register 632 is the determination target vector 600 from which the maximum frequency component has been removed. Therefore, the comparison selector 630 outputs the determination target vector 600 from which the second largest frequency component is removed in addition to the maximum frequency component to the register 632 as the vector 631. As the frequency information 635, frequency information indicating a frequency having the second largest signal component is output.

このようにして、信号成分の大きい方から順次、周波数(楽音)を判定していくことにより、和音を同定する。その判定は、比較選択器630が選択した信号のレベルが閾値として定めた値以下となるまで行う。そのような判定を行うことにより、和音を構成する楽音数が特定される。
特開2004−341026号公報
In this way, chords are identified by sequentially determining frequencies (musical tones) in descending order of signal components. The determination is performed until the level of the signal selected by the comparison selector 630 is equal to or less than the value set as the threshold value. By making such a determination, the number of musical tones constituting the chord is specified.
JP 2004-341026 A

図6に示す従来の和音同定装置では、上述したように、和音を構成する楽音毎にその周波数を判定する形で和音を同定するようになっている。しかし、そのような方法では、同定の精度が低いのが実状である。その理由は、楽音には高調波が存在し、或る楽音の高調波が別の楽音の基本波と重なることがあるからである。特に和音では、それを構成する楽音が協和音程の関係になっていることが多いことから、そのような重なりが発生する場合が多い。   In the conventional chord identification apparatus shown in FIG. 6, as described above, the chord is identified in such a manner that the frequency is determined for each musical tone constituting the chord. However, in such a method, the actual situation is that the accuracy of identification is low. The reason is that there are harmonics in a musical tone, and the harmonics of one musical tone may overlap with the fundamental wave of another musical tone. In particular, in the case of chords, there are many cases in which such overlapping occurs because the musical tones that form the chords are often in a relationship of consonant pitches.

図7は、楽音を構成する周波数成分の例を説明する図である。横軸は周波数、縦軸はパワーをそれぞれ示している。701は基本波(基本周波数)の信号成分、702は二次高調波(基本周波数の2倍の周波数)の信号成分、703は三次高調波(基本周波数の3倍の周波数)の信号成分をそれぞれ表している。また、711は701より基本周波数が3倍高い基本波の信号成分を表している。それにより701の基本波が「ド」の音高であれば、711の基本波は「ソ」の音高に相当する。 FIG. 7 is a diagram for explaining an example of frequency components constituting a musical sound. The horizontal axis represents frequency and the vertical axis represents power. 701 is the signal component of the fundamental wave (fundamental frequency), 702 is the signal component of the second harmonic (frequency twice the fundamental frequency), and 703 is the signal component of the third harmonic (frequency of 3 times the fundamental frequency). Represents. Reference numeral 711 denotes a signal component of a fundamental wave whose fundamental frequency is three times higher than that of 701. Accordingly, if the fundamental wave of 701 is a pitch of “do”, the fundamental wave of 711 corresponds to the pitch of “so”.

図7に示すように、楽音には高調波が存在する。各高調波をそれぞれ1楽音として判定しないために、図6に示す各フィルター621〜624では高調波に相当する信号成分を併せて除去するようにしている。しかし、そのように高調波に相当する信号成分を除去する場合、図7に示す例では、基本波の信号成分701と共に、別の基本波の信号成分711も除去してしまい、別の基本波の信号成分711は存在しなかったことになる。その結果、判定すべき楽音を判定できなくなって、和音を同定する精度の低下をまねくことになる。図8は、従来の和音同定装置による和音の同定結果を示す図である。図中の最下部に誤判定結果を示し、その上部には櫛形フィルターによる楽音の判定結果を示している。   As shown in FIG. 7, the musical tone includes harmonics. In order not to determine each harmonic as one musical tone, each filter 621 to 624 shown in FIG. 6 also removes signal components corresponding to the harmonics. However, when the signal component corresponding to the harmonic is removed in this way, in the example shown in FIG. 7, the signal component 711 of another fundamental wave is removed together with the signal component 701 of the fundamental wave, and another fundamental wave is removed. That is, the signal component 711 of FIG. As a result, it becomes impossible to determine a musical tone to be determined, which leads to a decrease in accuracy of identifying a chord. FIG. 8 is a diagram illustrating a chord identification result obtained by a conventional chord identification apparatus. The lower half of the figure shows the erroneous judgment result, and the upper part shows the musical tone judgment result by the comb filter.

和音の同定は、それを構成する楽音を個別に判定しない形でも行うことができる。つまり学習により同定させることもできる。しかし、数個の楽音から構成される和音は音高の組み合わせ、つまり根音の音高まで考えればその数は非常に多い。このため、学習には煩雑な作業を行わなければならず、非常に長い時間が必要となっている。このことを考慮すれば、煩雑な作業を回避しつつ、和音の同定精度を向上させることが重要と考えられる。   Chords can be identified in a form that does not individually determine the musical sounds that make up the chords. In other words, it can be identified by learning. However, the number of chords composed of several musical tones is very large considering the combination of pitches, that is, the root pitch. For this reason, complicated work must be performed for learning, and a very long time is required. Considering this, it is considered important to improve chord identification accuracy while avoiding complicated work.

本発明は、煩雑な作業を行うことなく、和音をより高精度に同定するための技術を提供することを目的とする。   An object of the present invention is to provide a technique for identifying chords with higher accuracy without performing complicated operations.

本発明の和音同定方法は、複数の楽音から構成される和音をコンピュータにより同定するための方法であって、和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を計算する学習工程と、超平面毎に、同定対象となる和音のパワー・スペクトラムを表す和音特徴情報を用いて該和音との距離を計算し、該計算結果を用いて該和音を構成する楽音を判定する判定工程と、を有する。 The chord identification method of the present invention is a method for identifying a chord composed of a plurality of musical tones by a computer, and for each musical tone that can constitute a chord , a specific musical tone using musical tone characteristic information representing the musical tone. A learning process for calculating a hyperplane that is an index for distinguishing the tone from other musical tones, and distance to the chord using chord feature information representing the power spectrum of the chord to be identified for each hyperplane And determining a musical tone constituting the chord using the calculation result.

ここで「和音を構成可能な楽音別」とは、同じ和音を構成する楽音が同じ超平面に2個以上、重ならないようにする、という意味である。言い換えれば、同じ和音を構成する楽音は互いに異なる超平面が対応する、という意味である。このことから、超平面に対応する楽音は複数個であっても良い。   Here, “by tone that can compose a chord” means that two or more tones that make up the same chord do not overlap on the same hyperplane. In other words, the musical tones that make up the same chord correspond to different hyperplanes. Therefore, there may be a plurality of musical sounds corresponding to the hyperplane.

本発明の和音同定装置は、複数の楽音から構成される和音を同定することを前提とし、和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて計算された、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を表すパラメータである超平面情報を記憶した情報記憶手段と、同定対象となる和音のパワー・スペクトラムを表す和音特徴情報を入力する情報入力手段と、情報記憶手段に記憶されている超平面情報を用いて、超平面毎に、和音特徴情報が表す和音との距離を計算する評価手段と、評価手段が超平面毎に計算した距離から、和音を構成する楽音を判定する楽音判定手段と、を具備し、超平面情報は、楽音特徴情報を分ける各グループに対応し、該楽音特徴情報を分けるグルーピングは、同一の和音で2個以上の楽音が同じグループに属することがないようにする。 The chord identification device of the present invention is based on the premise that a chord composed of a plurality of musical tones is identified, and for each musical tone that can constitute a chord , a specific musical tone calculated using musical tone characteristic information representing the musical tone, Information storage means for storing hyperplane information, which is a parameter representing the hyperplane that is an index for distinguishing other musical tones, and information input for inputting chord feature information representing the power spectrum of the chord to be identified Using the hyperplane information stored in the information storage means, for each hyperplane, an evaluation means for calculating the distance between the chords represented by the chord feature information, and the distance calculated by the evaluation means for each hyperplane , comprising a tone determining means for determining a tone constituting the chord, the hyperplane information corresponds to each group to divide the tone characteristic information, grouping dividing the musical sound feature information, two or more of the same chords Musical tone to so that it does not belong to the same group.

本発明の学習装置は、複数の楽音から構成される和音を同定するための同定用情報を学習により生成することを前提とし、和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を入力する情報入力手段と、情報入力手段が入力した楽音特徴情報が表す楽音別に、該楽音特徴情報を用いて、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を同定用情報として計算する超平面計算手段と、を具備する。 The learning device according to the present invention is based on the premise that information for identification for identifying a chord composed of a plurality of musical sounds is generated by learning, and input musical feature characteristic information representing the musical sound for each musical sound that can constitute the chord. For identifying a hyperplane that is an index for distinguishing a specific musical sound from other musical sounds by using the musical sound characteristic information for each musical sound represented by the musical sound characteristic information input by the information input means and the musical sound characteristic information input by the information input means Hyperplane calculating means for calculating as information.

本発明では、和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて計算された超平面を和音同定に用いる。超平面毎に、同定対象となる和音を表す和音特徴情報を用いてその和音との距離を計算し、その計算結果を用いてその和音を構成する楽音を判定する。   In the present invention, for each tone that can compose a chord, a hyperplane calculated using tone characteristic information representing the tone is used for chord identification. For each hyperplane, the distance from the chord is calculated using the chord feature information representing the chord to be identified, and the musical tone constituting the chord is determined using the calculation result.

楽音特徴情報を用いて計算される超平面は、特定の楽音とそれ以外の楽音とを区別するための指標となる。和音の同定では、和音を構成する楽音により、超平面との距離や向き(正負)に特有の再現性のある傾向が実験により確認された。このため、超平面を和音同定に用いることにより、その同定をより高精度に行うことができる。超平面の計算のために和音(の特徴情報)を用いる必要はないため、和音による学習を行う場合と比較して、その学習はより容易、且つ迅速に行うことができる。   The hyperplane calculated using the musical tone characteristic information is an index for distinguishing a specific musical tone from other musical tones. In the identification of chords, the reproducible tendency peculiar to the distance to the hyperplane and the direction (positive / negative) was confirmed by experiments, based on the musical tones that make up the chord. For this reason, by using a hyperplane for chord identification, the identification can be performed with higher accuracy. Since it is not necessary to use chords (feature information) for the calculation of the hyperplane, the learning can be performed more easily and quickly than in the case of learning by chords.

以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。  Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本実施形態による和音同定装置の構成を示す図である。   FIG. 1 is a diagram showing a configuration of a chord identification device according to the present embodiment.

その和音同定装置は、1楽音の特徴を表す学習ベクトル100を用いて学習を行い、和音を同定するものである。図1に示すように、学習ベクトル100を記憶するベクトル記憶装置101、学習ベクトル100を分けるグループ毎に超平面を計算する超平面計算装置102と、グループ毎に用意された、対応する超平面を表すパラメータを記憶する記憶装置111〜114と、グループ毎に用意された、対応する超平面と判定対象ベクトル150との距離を評価値として計算する評価装置121〜124と、各評価装置121〜124から評価値を入力し、和音の同定を行う判定装置130と、を備えている。   The chord identification device performs learning using the learning vector 100 representing the characteristics of one musical tone, and identifies the chord. As shown in FIG. 1, a vector storage device 101 that stores a learning vector 100, a hyperplane calculation device 102 that calculates a hyperplane for each group into which the learning vector 100 is divided, and a corresponding hyperplane prepared for each group. Storage devices 111 to 114 that store parameters to be expressed, evaluation devices 121 to 124 that are prepared for each group and that calculate the distance between the corresponding hyperplane and the determination target vector 150 as an evaluation value, and the evaluation devices 121 to 124. And a determination device 130 that inputs an evaluation value and identifies a chord.

上記したように本実施形態では、和音の同定に1楽音の特徴を表す学習ベクトル100を用いる。その学習ベクトル100は、図2に示すように、グループ別にベクトル記憶装置101に記憶される。そのように記憶させるために、例えば学習ベクトル100はそれが属するグループを示すグループ情報と共にベクトル記憶装置101に出力される。   As described above, in this embodiment, the learning vector 100 representing the characteristics of one musical tone is used for identifying chords. The learning vector 100 is stored in the vector storage device 101 for each group as shown in FIG. In order to store such information, for example, the learning vector 100 is output to the vector storage device 101 together with group information indicating a group to which the learning vector 100 belongs.

本実施形態では、和音を構成する楽音が属するグループの特定により、和音を構成する楽音を判定するようにしている。このことからグルーピングは、同一の和音で2個以上の楽音が同じグループに属することがないように行われる。言い換えれば、或る和音を構成する楽音は互いに異なるグループに属するように行われる。それにより図2中の「A1」「B1」及び「C1」は互いに異なる音程(音高)の楽音(の学習ベクトル100)を表している。グループを表す学習ベクトル100については以降、例えば「<J,A1>」「<J,A2>」「<K,B1>」のようにグループ情報と学習ベクトル100の種類を示す情報(楽音情報)を用いた表記法を採用する。   In the present embodiment, the musical tone constituting the chord is determined by specifying the group to which the musical tone constituting the chord belongs. For this reason, the grouping is performed so that two or more musical tones do not belong to the same group with the same chord. In other words, the musical tones constituting a certain chord are performed so as to belong to different groups. Accordingly, “A1”, “B1”, and “C1” in FIG. 2 represent musical sounds (learning vectors 100) having different pitches (pitches). For the learning vector 100 representing a group, for example, information indicating the type of the group information and the learning vector 100 (musical sound information) such as “<J, A1>”, “<J, A2>”, “<K, B1>” The notation using is adopted.

学習ベクトル100は、判定対象ベクトル150と同じ多次元のベクトルである。具体的には例えば周波数別に信号成分の大きさ(パワー)を示すパワー・スペクトラムである。しかしここでは理解を容易とするために、各ベクトル100及び150は2次元を想定する。2次元では、超平面は直線となる。学習ベクトル100や判定対象ベクトル150の生成自体は周知の技術を用いて行われる。   The learning vector 100 is the same multidimensional vector as the determination target vector 150. Specifically, for example, a power spectrum indicating the magnitude (power) of a signal component for each frequency. However, for ease of understanding here, each vector 100 and 150 assumes two dimensions. In two dimensions, the hyperplane is a straight line. The generation of the learning vector 100 and the determination target vector 150 is performed using a known technique.

同じグループに属する楽音数は、考えられる和音の数(種類の他に根音の音高を考慮した数)と比べて非常に少ない。例えば5個の楽音のなかから3個の楽音で構成される和音のみに着目してもその数は10個(種類)である。このことから、学習ベクトル100として1楽音のものを採用することにより、学習工程における手間は大幅に軽減し、必要な時間もより短くなる。   The number of musical tones belonging to the same group is very small compared to the number of possible chords (number considering the pitch of the root tone in addition to the type). For example, even if attention is paid only to a chord composed of 3 musical tones out of 5 musical tones, the number is 10 (kinds). Therefore, by adopting one musical tone as the learning vector 100, the labor in the learning process is greatly reduced and the required time is also shortened.

グループAに対応する超平面の計算は式(1)のDAを最大にするPとQを求めることによってできる。   The hyperplane corresponding to group A can be calculated by finding P and Q that maximize DA in equation (1).

ただし、AiはグループAに属するベクトル、ZiはグループAに属さないすべてのベクトルである。またPはAiと同次元のベクトル、Qはスカラーである。   However, Ai is a vector belonging to group A, and Zi is all vectors not belonging to group A. P is a vector of the same dimension as Ai, and Q is a scalar.

他のグループでも同様に超平面が計算される。各グループに対応する超平面を表すパラメータは記憶装置111〜114のなかでそのグループに対応するものに記憶させる。記憶装置111〜114に全てパラメータを記憶させることにより、学習過程(工程)が終了する。上述したようなグルーピングにより、超平面は和音を構成可能な楽音別に計算されることになる。本実施形態による学習装置は、そのような楽音別に超平面を計算するものである。このため、例えばベクトル記憶装置101及び超平面計算装置102により実現されている。本実施形態による和音同定装置は、その学習装置を搭載したものであり、和音同定装置自体の機能は、ベクトル記憶装置101及び超平面計算装置102を除く部分により実現される。   The hyperplane is calculated in the same way for the other groups. Parameters representing the hyperplane corresponding to each group are stored in the storage devices 111 to 114 corresponding to the group. By storing all the parameters in the storage devices 111 to 114, the learning process (step) is completed. By the grouping as described above, the hyperplane is calculated for each tone that can compose a chord. The learning device according to the present embodiment calculates a hyperplane for each musical tone. For this reason, for example, it is realized by the vector storage device 101 and the hyperplane calculation device 102. The chord identification device according to the present embodiment is equipped with the learning device, and the function of the chord identification device itself is realized by a portion excluding the vector storage device 101 and the hyperplane calculation device 102.

図3は、学習ベクトル100を用いて計算される超平面を説明する図である。その図3に示す超平面300は、学習ベクトル100がxy平面で表現される2次元であった場合に計算されるものである。その場合、超平面は以下の式により表される直線となる。なお、図5中の311〜313、及び321〜323はそれぞれ、グループJ及びKに属する3個の学習ベクトル100を表している。
ax+by+c=0 ・・・ (2)
FIG. 3 is a diagram for explaining a hyperplane calculated using the learning vector 100. The hyperplane 300 shown in FIG. 3 is calculated when the learning vector 100 is two-dimensionally expressed in the xy plane. In that case, the hyperplane is a straight line represented by the following equation. Note that 311 to 313 and 321 to 323 in FIG. 5 represent three learning vectors 100 belonging to groups J and K, respectively.
ax + by + c = 0 (2)

式(2)のように表すことが可能な超平面では、式(2)中のa、b、及びcがパラメータとして各記憶装置111〜114に記憶されることになる。   In the hyperplane that can be expressed as in Expression (2), a, b, and c in Expression (2) are stored in the respective storage devices 111 to 114 as parameters.

各評価装置121〜124はそれぞれ、記憶装置111〜114のなかで対応する記憶装置に保存されているパラメータを用いて、そのパラメータが表す超平面と判定対象ベクトル150との距離を計算し、その計算結果を評価値として出力する。その評価値は、図3に示す例では、グループJに属する学習ベクトル311〜313では正となり、グループKに属する学習ベクトル321〜323では負となる。それにより、評価値の正負はグループの特定に重要な意味を有している。   Each of the evaluation devices 121 to 124 calculates the distance between the hyperplane represented by the parameter and the determination target vector 150 using the parameter stored in the corresponding storage device among the storage devices 111 to 114, and The calculation result is output as an evaluation value. In the example shown in FIG. 3, the evaluation value is positive for the learning vectors 311 to 313 belonging to the group J and negative for the learning vectors 321 to 323 belonging to the group K. Thereby, the positive / negative of the evaluation value has an important meaning for specifying the group.

判定装置130は、各評価装置111〜114から評価値(ここでは計n(nは5以上の整数)個の評価値)を入力し、その大きさ、及び正負から判定対象ベクトル150が表す和音を構成する楽音毎にその楽音が属するグループを判定する。和音の同定は、判定したグループ毎に、そのグループに属する楽音を判定して行う。グループに属する楽音は、信号成分が最大となる周波数、つまり根音の基本周波数から正確に特定、或いは推測することができる。   The determination device 130 inputs evaluation values (here, a total of n (n is an integer of 5 or more) evaluation values) from each of the evaluation devices 111 to 114, and the chord represented by the determination target vector 150 based on the magnitude and positive / negative. The group to which the musical sound belongs is determined for each musical sound that constitutes. The chord is identified by determining the musical sound belonging to the group for each determined group. Musical sounds belonging to a group can be accurately identified or estimated from the frequency at which the signal component is maximum, that is, the fundamental frequency of the root tone.

図4は、学習過程で計算される超平面、及びその超平面を用いた和音の同定方法を説明する図である。ここで図4を参照して、学習過程で計算される超平面を用いて行われる和音の同定方法について具体的に説明する。その図4において、直線401は学習ベクトル411〜413が属するグループ(ここでは図2からグループJとする)で計算された超平面、つまりグループJを1グループ、及びそれ以外のグループをもう一つのグループとして計算された超平面、直線402は学習ベクトル421〜423が属するグループ(同様に図2からグループKとする)で計算された超平面、つまりグループKを1グループ、及びそれ以外のグループをもう一つのグループとして計算された超平面、直線403は学習ベクトル431〜433が属するグループ(同様に図2からグループLとする)で計算された超平面、つまりグループLを1グループ、及びそれ以外のグループをもう一つのグループとして計算された超平面を示している。   FIG. 4 is a diagram for explaining a hyperplane calculated in the learning process and a chord identification method using the hyperplane. Here, with reference to FIG. 4, the chord identification method performed using the hyperplane calculated in the learning process will be described in detail. In FIG. 4, a straight line 401 is a hyperplane calculated by the group to which the learning vectors 411 to 413 belong (here, from FIG. 2 to group J), that is, the group J is one group, and the other group is another group. The hyperplane calculated as a group, the straight line 402 is the hyperplane calculated in the group to which the learning vectors 421 to 423 belong (also referred to as group K from FIG. 2), that is, the group K is one group, and the other groups The hyperplane calculated as another group, the straight line 403 is the hyperplane calculated in the group to which the learning vectors 431 to 433 belong (also referred to as group L from FIG. 2), that is, the group L is one group, and the others The hyperplane calculated with one group as another group is shown.

それら3グループの超平面を示していることから、図4では楽音はA、B及びCの3個のみとし、そのうちの2個の楽音から構成される和音を同定する場合を想定している。その場合、和音はA+B、B+C、及びC+Aの3種類となる。図4中の600は、和音A+Bの判定対象ベクトル150として入力されたベクトルを表している。e1〜e3はそれぞれ、直線601〜603と判定対象ベクトル600との間の距離を示している。距離e1は負で絶対値が小さな距離、距離e2は正で絶対値が小さな距離、距離e3は負で絶対値が大きな距離となっている。絶対値での大小関係は、e3>e2>e1である。   Since these three groups of hyperplanes are shown, it is assumed in FIG. 4 that there are only three musical sounds A, B, and C, and a chord composed of two musical sounds is identified. In that case, there are three types of chords: A + B, B + C, and C + A. 4 in FIG. 4 represents a vector input as the determination target vector 150 of the chord A + B. e1 to e3 indicate distances between the straight lines 601 to 603 and the determination target vector 600, respectively. The distance e1 is negative and has a small absolute value, the distance e2 is positive and has a small absolute value, and the distance e3 is negative and has a large absolute value. The magnitude relationship in absolute value is e3> e2> e1.

評価装置とグループの対応関係は1対1となっている。このことから、和音を構成する楽音の属するグループの判定は、入力した距離のなかから、絶対値が大きいほうから和音の構成音数分の距離を抽出することで行われる。それにより図4に示す例では、距離e3及びe2が抽出される。各距離e3及びe2はそれぞれ直線603及び602に対応していることから、判定対象ベクトル600が表す和音を構成する2個の楽音はそれぞれグループL及びKに属していると判定されることになる。   The correspondence between the evaluation device and the group is one-to-one. Therefore, the group to which the musical sound constituting the chord belongs is determined by extracting the distance corresponding to the number of constituent sounds of the chord from the input distance having the larger absolute value. Thereby, in the example shown in FIG. 4, distances e3 and e2 are extracted. Since the distances e3 and e2 correspond to the straight lines 603 and 602, respectively, the two musical sounds constituting the chord represented by the determination target vector 600 are determined to belong to the groups L and K, respectively. .

図5は、本実施形態による和音同定装置の和音の同定結果を示す図である。図8と同様に、図中の最下部に誤判定結果を示し、その上部には櫛形フィルターによる楽音の判定結果を示している。その図8と比較して、和音の同定はより高精度に行われていることが分かる。このことは、他の実験からも確認できている。   FIG. 5 is a diagram showing a chord identification result of the chord identification device according to the present embodiment. As in FIG. 8, an erroneous determination result is shown at the bottom of the figure, and a musical sound determination result by the comb filter is shown at the top. Compared with FIG. 8, it can be seen that the chords are identified with higher accuracy. This has been confirmed from other experiments.

なお、本実施形態では、和音同定装置に学習装置を搭載しているが、和音同定装置、及び学習装置はそれぞれ別の装置に搭載、或いは別の装置として実現させても良い。また、それらの装置は何れも、上述したような機能を実現させるプログラムをコンピュータに実行させることで実現可能である。このことから、そのようなプログラムは可搬性のフラッシュメモリ等に記録して配布しても良く、通信ネットワークを介して受信可能としても良い。   In this embodiment, the learning device is mounted on the chord identification device. However, the chord identification device and the learning device may be mounted on different devices or realized as different devices. In addition, any of these devices can be realized by causing a computer to execute a program that realizes the functions described above. For this reason, such a program may be recorded and distributed in a portable flash memory or the like, or may be received via a communication network.

本実施形態による和音同定装置の構成を示す図である。It is a figure which shows the structure of the chord identification apparatus by this embodiment. ベクトル記憶装置に記憶される学習ベクトルを説明する図である。It is a figure explaining the learning vector memorize | stored in a vector memory | storage device. 学習ベクトル100を用いて計算される超平面を説明する図である。It is a figure explaining the hyperplane calculated using the learning vector. 学習過程で計算される超平面、及びその超平面を用いた和音の同定方法を説明する図である。It is a figure explaining the identification method of the chord using the hyperplane calculated in a learning process, and the hyperplane. 本実施形態による和音同定装置の和音の同定結果を示す図である。It is a figure which shows the identification result of the chord of the chord identification apparatus by this embodiment. 従来の和音同定装置の構成を示す図である。It is a figure which shows the structure of the conventional chord identification apparatus. 楽音を構成する周波数成分の例を説明する図である。It is a figure explaining the example of the frequency component which comprises a musical tone. 従来の和音同定装置による和音の同定結果を示す図である。It is a figure which shows the identification result of the chord by the conventional chord identification apparatus.

符号の説明Explanation of symbols

100、311〜313、321〜322、411〜413、421〜423、431〜433 学習ベクトル
101 ベクトル記憶装置
102 超平面計算装置
111〜114 記憶装置
121〜124 評価装置
130 判定装置
150 判定対象ベクトル
100, 311 to 313, 321 to 322, 411 to 413, 421 to 423, 431 to 433 Learning vector 101 Vector storage device 102 Hyperplane calculation device 111 to 114 Storage device 121 to 124 Evaluation device 130 Determination device 150 Determination target vector

Claims (6)

複数の楽音から構成される和音をコンピュータにより同定するための方法であって、
前記和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を計算する学習工程と、
前記超平面毎に、同定対象となる和音のパワー・スペクトラムを表す和音特徴情報を用いて該和音との距離を計算し、該計算結果を用いて該和音を構成する楽音を判定する判定工程と、
を有することを特徴とする和音同定方法。
A method for identifying a chord composed of a plurality of musical sounds by a computer,
A learning step of calculating a hyperplane that is an index for distinguishing a specific musical tone from other musical tones using musical tone characteristic information representing the musical tone for each musical tone that can compose the chord;
A determination step of calculating a distance to the chord using chord feature information representing a power spectrum of a chord to be identified for each hyperplane, and determining a musical tone constituting the chord using the calculation result; ,
A chord identification method characterized by comprising:
複数の楽音から構成される和音を同定する和音同定装置において、
前記和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて計算された、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を表すパラメータである超平面情報を記憶した情報記憶手段と、
同定対象となる和音のパワー・スペクトラムを表す和音特徴情報を入力する情報入力手段と、
前記情報記憶手段に記憶されている超平面情報を用いて、前記超平面毎に、前記和音特徴情報が表す和音との距離を計算する評価手段と、
前記評価手段が前記超平面毎に計算した距離から、前記和音を構成する楽音を判定する楽音判定手段と、
を具備し、前記超平面情報は、前記楽音特徴情報を分ける各グループに対応し、該楽音特徴情報を分けるグルーピングは、同一の和音で2個以上の楽音が同じグループに属することがないようにすることを特徴とする和音同定装置。
In a chord identification device that identifies a chord composed of multiple musical tones,
Hyperplane information that is a parameter representing a hyperplane that is an index for distinguishing a specific musical tone from other musical tones calculated using musical tone characteristic information representing the musical tone for each musical tone that can compose the chord. Information storage means for storing
Information input means for inputting chord feature information representing the power spectrum of the chord to be identified;
Using the hyperplane information stored in the information storage means, for each hyperplane, evaluation means for calculating the distance from the chord represented by the chord feature information;
From the distance calculated by the evaluation means for each hyperplane, a musical sound determination means for determining a musical sound constituting the chord;
The hyperplane information corresponds to each group that divides the musical tone characteristic information, and the grouping that divides the musical tone characteristic information is such that two or more musical sounds with the same chord do not belong to the same group. A chord identification device characterized by:
複数の楽音から構成される和音を同定するための同定用情報を学習により生成する学習装置において、
前記和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を入力する情報入力手段と、
前記情報入力手段が入力した楽音特徴情報が表す楽音別に、該楽音特徴情報を用いて、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を前記同定用情報として計算する超平面計算手段と、
を具備することを特徴とする学習装置。
In a learning device that generates identification information for identifying a chord composed of a plurality of musical sounds,
Information input means for inputting musical tone characteristic information representing the musical tone for each musical tone that can compose the chord,
For each musical tone represented by the musical tone characteristic information input by the information input means , a hyperplane, which is an index for distinguishing a specific musical tone from other musical tones, is calculated as the identification information using the musical tone characteristic information. Hyperplane calculation means;
A learning apparatus comprising:
複数の楽音から構成される和音をコンピュータにより同定するための処理を該コンピュータに行わせるプログラムであって、
該コンピュータに、
前記和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を計算する学習処理と、
前記超平面毎に、同定対象となる和音のパワー・スペクトラムを表す和音特徴情報を用いて該和音との距離を計算し、該計算結果を用いて該和音を構成する楽音を判定する判定処理と、
を行なわせるプログラム。
A program for causing a computer to perform processing for identifying a chord composed of a plurality of musical sounds by a computer,
To the computer,
A learning process for calculating a hyperplane that is an index for distinguishing a specific musical tone from other musical tones using musical tone characteristic information representing the musical tone for each musical tone that can constitute the chord;
A determination process for calculating a distance from the chord using chord feature information representing a power spectrum of the chord to be identified for each hyperplane, and determining a musical tone constituting the chord using the calculation result; ,
The line wa cell program.
複数の楽音から構成される和音を同定する和音同定装置に使用され、
該和音同定装置に、
前記和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を用いて計算された、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を表すパラメータである超平面情報を記憶した情報記憶処理と、
同定対象となる和音のパワー・スペクトラムを表す和音特徴情報を入力する情報入力処理と、
前記情報記憶処理によって記憶されている超平面情報を用いて、前記超平面毎に、前記和音特徴情報が表す和音との距離を計算する評価処理と、
前記評価処理によって前記超平面毎に計算された距離から、前記和音を構成する楽音を判定する楽音判定処理と、
を行なわせ、前記超平面情報は、前記楽音特徴情報を分ける各グループに対応し、該楽音特徴情報を分けるグルーピングは、同一の和音で2個以上の楽音が同じグループに属することがないようにするプログラム。
Used in a chord identification device that identifies chords composed of multiple musical tones,
In the chord identification device,
Hyperplane information that is a parameter representing a hyperplane that is an index for distinguishing a specific musical tone from other musical tones calculated using musical tone characteristic information representing the musical tone for each musical tone that can compose the chord. Information storage processing that stores
An information input process for inputting chord feature information representing the power spectrum of the chord to be identified;
Using the hyperplane information stored by the information storage process, for each hyperplane, an evaluation process for calculating a distance from the chord represented by the chord feature information;
A musical tone determination process for determining a musical tone constituting the chord from the distance calculated for each hyperplane by the evaluation process ;
Rows of Align, the hyperplane information corresponds to each group to divide the tone characteristic information, grouping dividing the musical sound feature information, as more than one tone in the same chord is not to belong to the same group Program to make .
複数の楽音から構成される和音を同定するための同定用情報を学習により生成する学習装置に使用され、
該学習装置に、
前記和音を構成可能な楽音別に、該楽音を表す楽音特徴情報を入力する情報入力処理と、
前記情報入力処理によって入力された楽音特徴情報が表す楽音別に、該楽音特徴情報を用いて、特定の楽音とそれ以外の楽音とを区別するための指標である超平面を前記同定用情報として計算する超平面計算処理と、
を行なわせるプログラム。
Used in learning devices that generate identification information for learning to identify chords composed of multiple musical sounds,
In the learning device,
For each tone that can compose the chord, an information input process for inputting tone characteristic information representing the tone;
For each musical tone represented by the musical tone characteristic information input by the information input process , a hyperplane that is an index for distinguishing a specific musical tone from other musical tones is calculated as the identification information using the musical tone characteristic information. Hyperplane calculation processing,
The line wa cell program.
JP2008076851A 2008-03-24 2008-03-24 Chord identification method, chord identification device, and learning device Expired - Fee Related JP5330720B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008076851A JP5330720B2 (en) 2008-03-24 2008-03-24 Chord identification method, chord identification device, and learning device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008076851A JP5330720B2 (en) 2008-03-24 2008-03-24 Chord identification method, chord identification device, and learning device

Publications (2)

Publication Number Publication Date
JP2009229940A JP2009229940A (en) 2009-10-08
JP5330720B2 true JP5330720B2 (en) 2013-10-30

Family

ID=41245387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008076851A Expired - Fee Related JP5330720B2 (en) 2008-03-24 2008-03-24 Chord identification method, chord identification device, and learning device

Country Status (1)

Country Link
JP (1) JP5330720B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847248B (en) * 2017-01-05 2021-01-01 天津大学 Chord identification method based on robust scale contour features and vector machine

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6192360B1 (en) * 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
JP3827600B2 (en) * 2001-04-17 2006-09-27 松下電器産業株式会社 Personal authentication method and apparatus
JP2005084436A (en) * 2003-09-09 2005-03-31 Advanced Telecommunication Research Institute International Speech recognition apparatus and computer program
JP2005234304A (en) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd Performance sound decision apparatus and performance sound decision program
DE102004028693B4 (en) * 2004-06-14 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a chord type underlying a test signal
JP4672613B2 (en) * 2006-08-09 2011-04-20 株式会社河合楽器製作所 Tempo detection device and computer program for tempo detection

Also Published As

Publication number Publication date
JP2009229940A (en) 2009-10-08

Similar Documents

Publication Publication Date Title
US9620092B2 (en) Composition using correlation between melody and lyrics
CN101740025A (en) Singing score evaluation method and karaoke apparatus using the same
CN111681631B (en) Collocation harmony method, collocation harmony device, electronic equipment and computer readable medium
KR100978913B1 (en) A query by humming system using plural matching algorithm based on svm
JP7144676B2 (en) Information processing device, quality-related expression generation method, and quality-related expression generation program
CN111477200B (en) Music score file generation method, device, computer equipment and storage medium
Bej et al. A multi-schematic classifier-independent oversampling approach for imbalanced datasets
CN110136678B (en) Music editing method and device and electronic equipment
US20210012247A1 (en) Information processing apparatus, information processing method, and program
EP2431865B1 (en) Semiconductor integrated circuit and index calculation method
JP5330720B2 (en) Chord identification method, chord identification device, and learning device
Chordia Automatic raag classification of pitch-tracked performances using pitch-class and pitch-class dyad distributions
US20190189100A1 (en) Method and apparatus for analyzing characteristics of music information
JP2020139914A (en) Substance structure analysis device, method and program
JP2016100002A (en) Event sequence construction of event drive software through combination calculation
CN112133264B (en) Music score recognition method and device
Emmert-Streib Exploratory analysis of spatiotemporal patterns of cellular automata by clustering compressibility
JP2021197164A (en) Information processing device, information processing method, and computer readable storage media
WO2020017037A1 (en) Log analysis device, log analysis method, and program
Maršík harmony-analyser. org-Java Library and Tools for Chordal Analysis
US20240005160A1 (en) Methods and systems for optimizing a peak memory usage of an artificial neural network graph
JP7468650B2 (en) Information processing device, information processing method, and program
EP4105849A1 (en) Device of handling domain-agnostic meta-learning
JPWO2009075128A1 (en) Integrated abnormality detection system, integrated abnormality detection device, integrated abnormality detection method and program
JP4870732B2 (en) Information processing apparatus, name identification method, and program

Legal Events

Date Code Title Description
RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20110114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121130

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20121130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130726

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees