WO2006062064A1 - 楽曲処理装置 - Google Patents

楽曲処理装置 Download PDF

Info

Publication number
WO2006062064A1
WO2006062064A1 PCT/JP2005/022303 JP2005022303W WO2006062064A1 WO 2006062064 A1 WO2006062064 A1 WO 2006062064A1 JP 2005022303 W JP2005022303 W JP 2005022303W WO 2006062064 A1 WO2006062064 A1 WO 2006062064A1
Authority
WO
WIPO (PCT)
Prior art keywords
music
appearance probability
load
template
information
Prior art date
Application number
PCT/JP2005/022303
Other languages
English (en)
French (fr)
Inventor
Hiroaki Yamane
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to JP2006546679A priority Critical patent/JP4698606B2/ja
Priority to EP05811790.4A priority patent/EP1816639B1/en
Priority to US11/791,523 priority patent/US7470853B2/en
Publication of WO2006062064A1 publication Critical patent/WO2006062064A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G1/00Means for the representation of music
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/081Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for automatic key or tonality recognition, e.g. using musical rules or a knowledge base
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/395Special musical scales, i.e. other than the 12- interval equally tempered scale; Special input devices therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set

Definitions

  • the present invention relates to a music processing device, and more specifically to a music processing device that detects music tone information from musical scale information and searches for music using it.
  • the music tone information is information indicating elements (for example, key) that determine the image of the music.
  • the appearance probability of each pitch name included in the scale information is calculated based on information related to the musical scale (hereinafter referred to as scale information), and the appearance probability for each pitch name is calculated.
  • scale information information related to the musical scale
  • an appearance probability distribution see Fig. 3 described later.
  • ideal appearance probability distributions created in advance are prepared as templates for each of a plurality of types of keys.
  • the appearance probability distribution of the music for which the key is to be detected is calculated, and the appearance probability distribution for the music and the templates are individually verified one by one.
  • the key indicated by the template whose appearance probability distribution is most similar to the music is determined as the key of the music.
  • Patent Document 1 Japanese Patent No. 2715816
  • actual music includes music composed of a plurality of types of keys including modulation.
  • the appearance probability distribution of a song including such a modulation is a distribution in which the appearance probability distributions of multiple types of keys are combined, and as a result, differs from any of the appearance probability distributions of each key included in the song. It may be a distribution.
  • the appearance probability distribution of the music and the appearance probability distribution of the template are checked one-to-one, so if the music appearance probability distribution is a composite distribution of multiple keys, the template that most closely approximates the composite distribution is used.
  • the key indicated by is determined as the key of the song. In other words, in this case, a key different from any of the keys included in the music is determined as the key of the music. Therefore, in the first method, there is a possibility that a key is erroneously detected for music composed of a plurality of types of keys including modulation.
  • musical scale information is divided into a plurality of sections, and a key is detected for each section. Then, a part to be modulated is detected by a change in the tone of each detected section.
  • the target whose key is to be detected is not the entire scale information that is input, but the section in which the scale information is divided into short sections.
  • the scale information in order to detect the modulation, must be divided into units of at least several measures (for example, about four measures).
  • the scale information is divided into sections, the number of sounds included in the key detection target is reduced.
  • an object of the present invention is to provide a music processing apparatus capable of accurately detecting the music tone information of a music even when the music includes a modulation.
  • a first aspect is a music processing device that detects music tone information indicating the music tone of a predetermined music piece, and distributes the appearance probability for each pitch name for at least a part of the predetermined music piece.
  • a load degree calculation unit for calculating a load degree indicating a ratio of the template in the distribution of appearance probabilities of each pitch name acquired by the appearance probability acquisition unit, and a load degree calculation.
  • a music tone information detection unit for detecting, as music information, a set of load degrees that also has a load power calculated for each template by the unit.
  • the template stored in the template storage unit indicates the key of the music, and the template is different for each key of the music.
  • the section further detects at least one of the key, tonality, tonality occupancy, and scale of the predetermined music as the music tone information based on the set of load degrees.
  • the music tone information detection unit has a maximum load degree calculated by the load degree calculation unit among the templates stored in the template storage unit.
  • the key indicated by the template is detected as the key of a predetermined music piece.
  • the music tone information detection unit performs, for each tonality, a process of calculating the sum of the load degrees for a plurality of templates having the same tonality. Then, the tonality having the larger calculated sum is detected as the tonality of a predetermined music piece.
  • the music tone information detection unit performs a process for calculating the sum of the load degrees for a plurality of templates indicating the same scale in each scale. The calculated sum is the largest, and the scale is detected as the scale of the predetermined music.
  • a music data storage unit that stores data of a plurality of pieces of music for which the appearance probability acquisition unit acquires a distribution of appearance probabilities, and a music tone information detection unit
  • a music tone information At least one of the load degree set detected by the information and the information calculated from the set is associated with the music corresponding to the information of the music data stored in the music data storage unit.
  • the seventh aspect further includes a music selection rule storage unit that stores a music selection rule that associates music selection information to be input by the user with a condition related to music tone information in the sixth aspect, and the search unit includes: When the music selection information is input by the user, the music that satisfies the conditions associated with the input music selection information is output as a search result among the music whose data is stored in the music data storage unit.
  • An eighth aspect is a method used in a music processing device for detecting music tone information indicating the music tone of a music for a predetermined music
  • the music processing device includes a method for each type of music.
  • Different templates that indicate the distribution of appearance probabilities for each pitch name are stored in advance for each of a plurality of types, and the appearance probability for obtaining the distribution of the appearance probabilities for each pitch name for at least a part of a predetermined song
  • the degree of load indicating the ratio of the template in the distribution of the appearance probability of each pitch name acquired in the appearance probability acquisition step is calculated.
  • the load degree calculating step and the load degree calculating step include a tone information detecting step of detecting, as tone information, a set of load degrees corresponding to the load strength calculated for each template.
  • the music processing apparatus further stores in advance data of a plurality of pieces of music from which appearance probability distributions are acquired in the appearance probability acquisition step.
  • the music tone information detection step at least one of the set of load degrees detected and the information calculated from the set is stored in the music processing device. It further includes a music tone information storage step that is stored in the music processing device as music tone information in association with the music corresponding to the information, and a search step that searches the music data stored in the music processing device using the music tone information.
  • a tenth aspect is a program for causing a computer of a music processing apparatus to detect music tone information indicating the music tone of a music piece for a predetermined music piece.
  • Different templates that show the distribution of the appearance probability for each pitch name are stored in advance for each of a plurality of types, and the distribution of the appearance probability for each pitch name is determined for at least a part of a predetermined song.
  • Appearance probability acquisition step to be acquired and the load for calculating the degree of load indicating the ratio of the template to the distribution of the appearance probability of each pitch name acquired in the appearance probability acquisition step for each of the stored templates In the step of calculating the degree of load and the step of calculating the degree of load! And causing the computer to execute a music tone information detecting step.
  • An eleventh aspect is a computer-readable recording medium in which the program according to the tenth aspect is recorded.
  • a twelfth aspect is a collection for detecting music tone information indicating the music tone of a music piece for a predetermined music piece.
  • Appearance probability acquisition unit that obtains the distribution of appearance probability for each pitch name for at least a part of a predetermined song, and the distribution of the appearance probability for each pitch name, which is a different template for each type of music
  • a load degree calculation unit that calculates a load degree indicating a ratio of the template to the distribution of appearance probability of each pitch name acquired by the appearance probability acquisition unit, and each template by the load degree calculation unit
  • a music tone information detection unit that detects a set of load degrees as the music tone information.
  • a set of load degrees of each template that is not selected from the plurality of templates that most closely match is detected. Accordingly, it is possible to know the ratio of each template that occupies the distribution of appearance probabilities in a predetermined music piece (a music piece for which music tone information is detected). That is, it is possible to detect the “ratio of each type in a given song” rather than determining one type of song corresponding to the template, and to express the tone of the given song as a percentage for each type. Can do. Therefore, for example, when a predetermined musical piece includes two tones, the load degree of the template of the two tones is calculated to be large. In other words, according to the first invention, it is possible to accurately detect the tune information of a tune even if the tune includes a modulation.
  • the most dominant tone, the most dominant tonality, the most dominant tonality occupancy, and the most dominant scale can be accurately calculated by using a set of load degrees. Can be detected.
  • the key of the music can be accurately detected by detecting the key indicated by the template having the maximum load.
  • the sum of the load degrees is calculated for each of the plurality of templates showing the same tonality, and the tone having the larger sum is detected, whereby the tone of the music is detected. Sex can be detected accurately.
  • the sum of the load degrees is calculated for a plurality of templates having the same scale, and the scale of the music is determined by detecting the scale having the largest sum. It can be detected accurately.
  • music can be searched using a set of load levels or information (key, tonality, scale, etc.) obtained therefrom. Therefore, it is possible to accurately perform a search using music tone information.
  • the user can easily search for music related to the input music selection condition.
  • FIG. 1 is a block diagram showing a music tone detection device 1 according to a first embodiment of the present invention.
  • FIG. 2 is a diagram showing an example of musical scale information input to the musical scale information input unit 11.
  • FIG. 3 is a diagram conceptually showing a distribution of appearance probabilities for each pitch name.
  • FIG. 4 is a diagram showing an example of a calculation result of a load degree for 24 types of templates and the respective templates.
  • FIG. 5 is a flowchart showing a process flow of the music tone detection apparatus 1 according to the first embodiment.
  • FIG. 6 is a diagram showing an example of the relationship of tones formed on the same scale.
  • FIG. 7 is a block diagram showing a configuration example in which the music tone detection device 1 is realized by a computer system 100.
  • FIG. 8 is a block diagram showing a music search device 2 according to the second embodiment of the present invention.
  • FIG. 9 is a diagram showing a flow chart showing a processing flow of the music search device 2 according to the second embodiment.
  • FIG. 10 is a diagram showing an example of data stored in the music data storage unit 23.
  • FIG. 11 is a diagram showing an example of an input screen of the music selection information input unit 25.
  • FIG. 12 is a diagram showing an example of a music selection rule.
  • tone means 24 types (C: C major, Am: A minor, etc.) composed of tonality and scale.
  • a music tone detection apparatus that detects the music tone information will be described as a first embodiment.
  • a music search apparatus that searches for music using the above-described music tone information will be described as a second embodiment.
  • FIG. 1 is a block diagram showing a music tone detection apparatus 1 according to the first embodiment of the present invention.
  • the music tone detection device 1 includes a scale information input unit 11, an appearance probability calculation unit 12, a template storage unit 13, a load degree calculation unit 14, and a music tone information detection unit 15.
  • the scale information input unit 11 receives input of musical scale information from outside or inside the tune detection device 1.
  • the musical scale information input to the musical scale information input unit 11 is data including at least information on the pitch (note number) and the length (duration) of the sound.
  • FIG. 2 is a diagram illustrating an example of musical scale information input to the musical scale information input unit 11.
  • the musical scale information is expressed by the time indicated by the number of measures, Z beats, and the number of ticks, the mouth city that indicates the strength of the sound, and the note number.
  • the time indicates the time when each note number is sounded or muted.
  • the velocity is expressed as an integer in the range of 0 to 127, and the volume increases as the velocity value increases. Note that a velocity value of “0” indicates mute.
  • the value of the note number is set to “60”, which indicates the height of the middle of the piano keyboard.
  • the duration is expressed in terms of time and mouth city. For example, when the time is “ ⁇ ”, the note number is “60” and the mouth city is “90 (pronunciation)”. In addition, when the time is “000 ⁇ 0 ⁇ 432”, the note number is “60” and the mouth city is “0 (silence)”. Therefore, the scale information for the time interval from “000 ⁇ 0 ⁇ 000” to “000 ⁇ 0 ⁇ 432” has a note number of “60”, a velocity of “90”, and a duration of 32 ticks.
  • the time is indicated by “number of bars, number of beats, number of ticks”, for example, “time, minutes, seconds, frame, subframe”. It may be done.
  • the mouth city may be expressed as a power expressed as an integer in the range of 0 to 127. For example, it may be expressed as a binary value of “1” for sound generation and “0” for mute.
  • the musical scale information shown in FIG. 2 includes information on the pitch (note number) and the length (duration) of the sound. Note that the musical scale information is simply no It may be expressed by a method having a one-to-one duration with respect to the number. In addition to the note number and duration, the musical scale information may be expressed by a method that further includes pitch bend information indicating a continuous change in the note number. At this time, the note number varies depending on the pitch bend value.
  • the appearance probability calculation unit 12 calculates the appearance probability of each pitch name included in the musical scale information input to the musical scale information input unit 11.
  • Fig. 3 is a diagram conceptually showing the distribution of appearance probabilities (appearance probability distribution) for each pitch name.
  • a pitch name having a pitch name number i may be referred to as “pitch name i”.
  • the template storage unit 13 stores 24 types of templates corresponding to 24 types of keys.
  • the 24 templates represent different types of music.
  • the template shows an ideal appearance probability distribution of the corresponding key.
  • Each of these templates is created in advance and stored in the template storage unit 13.
  • FIG. 4 is a diagram illustrating an example of 24 types of templates and calculation results of the load degree for each template.
  • a key whose key number is j may be described as “key”.
  • the calculation result of the load degree for each template will be described later.
  • the degree-of-load calculation unit 14 calculates the degree of load for each template based on the appearance probability distribution of the music calculated by the appearance probability calculation unit 12 and each template stored in the template storage unit 13. Calculate (see Figure 4;).
  • the load degree calculation unit 14 calculates 24 load degrees so as to correspond to 24 types of templates one by one.
  • the degree of load indicates the ratio (occupancy) of the appearance probability distribution of the template in the appearance probability distribution of music.
  • the degree of load of a template is a value indicating the percentage that the appearance probability distribution of the template contributes when the music appearance probability distribution is expressed using 24 types of templates.
  • a template with a large value of load degree is a template with a large proportion of the appearance probability distribution of music. Therefore, the value of load degree is large.
  • the key corresponding to the template is the key that accounts for a large proportion of the music!
  • the music tone information detection unit 15 detects the music tone information of the music based on the 24 load degrees calculated by the load degree calculation unit 14.
  • the tune information is information (a set of load degrees) indicating 24 load degrees as one set or various information calculated from the set of load degrees.
  • the various types of information are, for example, information indicating the above-described tone, tonality occupancy, tonality and scale.
  • the music tone information detection unit 15 detects a set of load degrees as music tone information. Then, the tone, tonality occupancy, tonality and scale calculated from the set of load degrees are detected as music tone information.
  • FIG. 5 is a diagram showing a flow chart showing the flow of processing of the music tone detection device 1 according to the first embodiment.
  • the scale information input unit 11 accepts input of musical scale information from outside or inside the music tone detection device 1 (step Sl). For example, scale data indicating scale information such as SMF (Standard MIDI File) is input. Note that the scale data to be input may be data obtained by converting voice data such as PCM data. Here, scale information as shown in Fig. 2 is input. In the present invention, since it is not necessary to divide the input music into sections such as measures, the scale information used in the present invention does not need to include information indicating the position of the measure. In the present invention, it is possible to accurately detect the key included in the music without dividing the music including the modulation into sections such as measures.
  • the appearance probability calculation unit 12 calculates the appearance probability of each pitch name included in the musical scale information input in step S1 (step S2).
  • P (i) be the probability of appearance of pitch name i.
  • the appearance probability distribution of each pitch name of the music is calculated by the appearance probability calculation unit 12.
  • the appearance probability calculation unit 12 determines that the data in step S2. May be obtained. In this case, the process of calculating the appearance probability distribution in step S2 can be omitted.
  • the load degree calculation unit 14 calculates the load degree for each template (step S3).
  • the degree of load is calculated using the appearance probability (actual appearance probability of the music) calculated in step S2 and the appearance probabilities indicated by the 24 types of templates stored in the template storage unit 13. Is done. In the following, the method for calculating the degree of load will be described in detail.
  • the music tone information detection unit 15 further detects the key, the tonality occupancy, the tonality, and the scale as the music tone information of the music. The following describes the tone, tonality occupancy, tonality, and scale detection methods.
  • the music tone information detection unit 15 obtains the key of key number j corresponding to the template having the maximum load degree W (j), and detects that key as the most dominant key. To do.
  • the music tone information detection unit 15 detects Rmaj and Rmin calculated by the equations (7) and (8) as tonality occupancy rates.
  • the tune information detecting unit 15 detects whether the major or minor is dominant as the tonality. That is, the music tone information detection unit 15 performs the above equation (7) and The Rmaj value calculated in Eq. (8) is compared with the Rmin value, and the tonality is detected as a major if the Rmaj value is large and as a minor if the Rmin value is large.
  • FIG. 6 is a diagram showing an example of the relationship of the keys formed on the same scale.
  • FIG. 6 there are a total of 12 scales because two of the 24 tones have the same scale.
  • Rs (s) is calculated as follows.
  • the music tone information detection unit 15 obtains the scale of the scale number s that maximizes the scale occupation ratio Rs (s), and detects the scale as the most dominant scale.
  • the music tone detection device 1 has a music appearance probability distribution that does not match the music appearance probability distribution with the template appearance probability distribution on a one-to-one basis. Calculate the percentage of each key template (loading degree). As a result, even if the music for detecting a plurality of tones included in the music is composed of a plurality of types of tones including the modulation, the music tone information of the music can be accurately detected.
  • the user can grasp the ratio of a plurality of keys included in the music by the set of load degrees in the music tone information of the music detected by the music tone detection apparatus 1 according to the present embodiment.
  • the load value of one key is large, and the load value of the other key is small.
  • the user can grasp that the music is a monotonous music.
  • the value of the load degree approximates in many keys
  • the user can grasp that the music is a music composed of many keys. Therefore, the user can grasp the image of the music without actually listening to the music.
  • the user can grasp the image of the song without actually listening to the song, as in the case of the above set of load degrees. be able to.
  • the template storage unit 13 stores only one template for each of the 24 types of keys. However, a plurality of templates may be stored for one type of key. For one type of key, for example, a template is prepared for each genre such as pop, jazz, and classic, and is stored in the template storage unit 13. Then, by calculating the degree of load for all templates stored in the template storage unit 13, the tune detection device 1 can accurately detect tune information that matches the genre of the tune. Moreover, since the load level of each template includes genre information, it is possible to detect the genre of music.
  • a template may be prepared for each specific part such as a melody and bass, and stored in the template storage unit 13. Then, by calculating the degree of load on the template stored in the template storage unit 13 for the input music part, the music tone detection device 1 matches the input music part. Musical tone information can be accurately detected.
  • an appearance probability distribution corresponding to a scale or a chord may be used instead of 24 types of keys. Then, by calculating the degree of load for each template, it is possible to detect music tone information relating to the scale or chord.
  • the scale information that is accepted by the scale information input unit 11 may be any scale information that includes at least one performance part such as a melody or bass.
  • the scale information is composed of a plurality of parts.
  • the performance time of the music constituting the scale information may be for the entire performance time or for a part of the performance time.
  • the part of the performance time may be, for example, the performance time of the first half of the music excluding the prelude. This is because the performance time is generally composed of major keys.
  • tune detection The device 1 can detect music tone information with higher accuracy. In addition, the processing burden of the music tone detection device 1 can be reduced.
  • FIG. 7 is a block diagram showing a configuration example in which the music tone detection device 1 is realized by the computer system 100.
  • the scale information input unit 11, the appearance probability calculation unit 12, the template storage unit 13, the load degree calculation unit 14, and the music tone information detection unit 15 have the same reference numerals as the respective components shown in FIG. 1. The functions are the same as those in FIG.
  • a computer system 100 includes an arithmetic processing unit 110, a storage unit 120, and a disk drive device 130.
  • the arithmetic processing unit 110 is composed of a CPU or a memory, and is the same as the scale information input unit 11, the appearance probability calculation unit 12, the load degree calculation unit 14, and the music tone information detection unit 15 by executing a music tone information detection program. Realize the function.
  • the storage unit 120 is configured by a recording medium such as a hard disk, and realizes the same function as the template storage unit 13 by executing a music tone information detection program.
  • the disk drive device 130 reads the music tone information detection program from the recording medium 140 in which the music tone information detection program for causing the computer system 100 to function as the music tone detection device 1 is stored.
  • the recording medium 140 is a recording medium in a format readable by the disk drive device 130 such as a flexible disk or an optical disk.
  • the music tone information detection program may be installed in the computer system 100 in advance.
  • the music tone information detection program may be provided by a telecommunication line such as the power Internet provided by the recording medium 140. Further, the processing in the music tone information detection may be a form in which all or a part is processed by hardware.
  • FIG. 8 is a block diagram showing a music search device 2 according to the second embodiment of the present invention.
  • the music search device 2 includes a music input unit 21, a scale data conversion unit 22, an appearance probability calculation unit 12, a music data storage unit 23, a template storage unit 13, a load degree calculation unit 14, a music tone information detection unit 15, A music selection rule storage unit 24, a music selection information input unit 25, and a search unit 26 are provided.
  • the appearance probability calculation unit 12, the template storage unit 13, the load degree calculation unit 14, and the music tone information detection unit 15 are the same as the respective components of the music tone detection device 1 described in the first embodiment. The functions are the same, and the description is omitted.
  • FIG. 9 is a diagram showing a flowchart showing the flow of processing of the music search device 2 according to the second embodiment.
  • steps S1 to S4 are denoted by the same reference numerals as steps S1 to S4 of the process of the tone detection device 1 described in the first embodiment (see FIG. 5), respectively.
  • the processing is omitted.
  • the processing flow of the music search apparatus 2 will be described with reference to FIG.
  • the music input unit 21 determines whether or not the input of music data is accepted from outside or inside the music search device 2 (step Sl 1). If it is determined in step SI 1 that no music data has been input, the process of step S 15 is performed. On the other hand, if it is determined that the music data is input as a result of the determination in step S11, the process in step S12 is performed. That is, the music input unit 21 stores the input music data in the music data storage unit 23 (step S12).
  • the music data may be audio data or scale data.
  • the scale data is, for example, PCM format audio data, MP3 and AAC compression format audio data, and the like.
  • the scale data is scale data indicating scale information such as SMF (standard MIDI file).
  • SMF standard MIDI file
  • the input music data may be data composed of a plurality of parts as long as it includes at least one performance part such as melody or bass.
  • the performance time of the music data may be for the entire performance time or a part of the performance time.
  • the scale data conversion unit 22 determines that if the music data stored in step S12 is audio data (for example, PCM format audio data), the audio data is stored. Is converted into scale data indicating the scale information (step S13).
  • the scale data converter 22 converts voice data into scale data by a method disclosed in, for example, Japanese Patent Laid-Open No. 58-181090.
  • the audio data is compressed data such as MP3 and AAC
  • the scale data conversion unit 22 converts the sound data into sound data in the PCM format and then converts it into scale data. Note that the method of converting to scale data is not limited to the above method, and other methods may be used.
  • the music data stored in step S12 is scale data such as SMF
  • the processes in steps S1 to S4 are performed without performing the process in step S13.
  • step S13 In steps S1 to S4 (see Fig. 5), tune information is detected based on the scale data stored in step S12 or the scale data converted in step S13. Then, the music tone information detection unit 15 stores the music tone information in the music data storage unit 23 (step S14).
  • the music data storage unit 23 stores the music data stored in step S12 and the music tone information of the music data detected in step S4 in association with each other.
  • FIG. 10 is a diagram illustrating an example of data stored in the music data storage unit 23.
  • the music data storage unit 23 stores the most dominant key (K), tonality (T), the most dominant scale (S), and major occupancy (Rmaj) as the music tone information in addition to the music data. Is done.
  • the scale (S) of the music data is indicated by the scale number s.
  • the music data stored in the music data storage unit 23 is managed by the music number, and the music data and the music tone information associated therewith can be deleted or added as appropriate.
  • the music data storage unit 23 stores at least one of the music tone information such as the set of load degrees, key, tonality occupancy, tonality, and scale detected in step S4. .
  • the search unit 26 determines whether or not the music selection information is input from the music selection information input unit 25 (step S15).
  • the user uses the music selection information input unit 25 to input music selection information of a desired music piece.
  • FIG. 11 is a diagram showing an example of the input screen of the music search device 2.
  • a music selection information list 251 and a search button 252 are displayed on the input screen.
  • the user uses the music selection information input unit 25 to select the music selection information list 251. After selecting the desired music selection information, press the search button 252 to input the music selection information.
  • step S15 If the result of determination in step S15 is that music selection information has not been input, processing returns to step S11. On the other hand, if the music selection information is input as a result of the determination in step S15, the process in step S16 is performed.
  • the search unit 26 specifies a search condition corresponding to the input music selection information (step S16).
  • a method of specifying the search condition corresponding to the input music selection information there is a method of specifying based on the music selection rule stored in the music selection rule storage unit 24.
  • FIG. 12 is a diagram illustrating an example of a music selection rule.
  • the music selection rule storage unit 24 stores music selection rules for searching for music.
  • the music selection information displayed in the music selection information list 251 and the search conditions corresponding to the music selection information are preset as music selection rules.
  • the search condition is music data that is tonal
  • the search condition is that the major occupancy rate Rmaj is 0.
  • the music data is set to 6 to 0.8.
  • the music selection information stored in the music selection rule storage unit 24 is, for example, “fun, sad” without classifying “fun”, “slightly fun”, “normal”, “slightly sad”, and “sad” into five levels. It may be a degree.
  • the music selection information is set to sx, for example, the degree of “fun (1.0) sad” (0.0).
  • the search condition is set, for example, as music data in which the major occupation ratio Rmaj is within an error 0.1 with the degree sx. Then, the user inputs music selection information as a music selection information input unit 25 using a bar such as a slider.
  • step S16 the search unit 26 searches for music based on the conditions specified in step S16 from the music data stored in the music data storage unit 23 in step S12.
  • the song names that match the conditions are displayed (step S17).
  • step S17 the process of playing back the title of the displayed song may be further performed.
  • the user specifies the search condition used for the search by inputting the music selection information.
  • the user may specify the search condition by directly inputting the search condition.
  • the music selection information input unit 25 The user inputs “key c” and “major”, and other conditions or a combination of these conditions.
  • the search unit 26 uses the music tone information stored in the music data storage unit 23 to search for music that matches the search condition entered by the user, and displays the song name of the music that matches the search condition. .
  • the user can search for music by freely inputting search conditions other than the search conditions based on the preset music selection rules.
  • step S17 the user selects whether or not the user has the power to finish the process of the music search device 2 (step S18). If the process is not terminated, the process returns to step SI1. The above processing is performed for each input music data.
  • the music search device 2 allows the user to search for music based on the music tone information of the music.
  • the music processing devices may be configured by an integrated circuit.
  • the appearance probability calculation unit 12, the load degree calculation unit 14, and the music tone information detection unit 15 may be configured by an integrated circuit.
  • the integrated circuit includes an input terminal for inputting the music and the template stored in the template storage unit 13 and an output terminal for outputting the music tone information detected by the music tone information detection unit 15.
  • the appearance probability calculating unit 12, the load degree calculating unit 14, the music tone information detecting unit 15, the scale data converting unit 22, and the searching unit 26 may be configured by an integrated circuit.
  • the integrated circuit receives the music, the template stored in the template storage unit 13, the music selection rule, the music selection information, the music data stored in the music data storage unit 23, and the music tone information stored in the music data storage unit 23.
  • An input terminal for inputting is provided.
  • the integrated circuit also includes an output terminal for outputting the music tone information detected by the music tone information detection unit 15 and the search result obtained by the search unit 26.
  • a configuration unit (such as the template storage unit 13) that stores data or the like is appropriately stored in the storage unit and configured as a part of the integrated circuit if it is an integrated circuit including the storage unit. Hey.
  • the music processing device can also be applied to uses such as a music search device, a jukebox, and an audio player that search for music using the detected music tone information.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

音階情報入力部(11)は、楽曲の音階情報の入力を受け付ける。出現確率算出部(12)は、音階情報入力部(11)に入力された楽曲の音階情報に基づいて当該音階情報に含まれる各音名の出現確率をそれぞれ算出する。テンプレート記憶部(13)には、予め作成された24種類の調に対応する24種類のテンプレートが記憶される。荷重度算出部(14)は、出現確率算出部(12)で算出される楽曲の出現確率分布とテンプレート記憶部(13)に記憶されている各テンプレートとに基づいて、各テンプレートについての荷重度を算出する。曲調情報検出部(15)は、荷重度算出部(14)によって算出される各荷重度を組として示す情報または当該荷重度の組から算出される情報を楽曲の曲調情報として検出する。

Description

明 細 書
楽曲処理装置
技術分野
[0001] 本発明は、楽曲処理装置に関し、より特定的には、楽曲の音階情報から曲調情報 を検出したり、それを用いて楽曲の検索を行ったりする楽曲処理装置に関する。 背景技術
[0002] 従来から、楽曲の曲調情報を検出する方法が知られている。曲調情報とは、楽曲の イメージを決める要素 (例えば調など)を示す情報である。例えば楽曲の調を検出す る方法として、楽曲の音階に関する情報 (以下、音階情報という)に基づいて当該音 階情報に含まれる各音名の出現確率を算出し、各音名に関する当該出現確率の分 布(出現確率分布と呼ぶ。後述する図 3参照。)を用いて楽曲の調を検出する方法( 第 1の方法)がある。この方法では、複数種類の調それぞれについて、予め作成され た理想的な出現確率分布をテンプレートとしてそれぞれ用意しておく。そして、調を 検出する対象となる楽曲の出現確率分布を算出し、当該楽曲についての出現確率 分布と当該各テンプレートとを 1つずつ個別に照合する。その結果、出現確率分布が 当該楽曲と最も近似するテンプレートにより示される調を楽曲の調として決定する。
[0003] また、従来においては、入力される音階情報を所定の区間に区切り、区間毎に調を 検出する方法もある(例えば、特許文献 1参照。 ) oこの方法では、例えば楽曲の 1小 節目から 4小節目までを 1つの区間、 2小節目から 5小節目までを次の区間と 、うよう に、楽曲の音階情報を複数の区間に区切る。そして、区間毎にその区間の調を検出 する。
特許文献 1 :特許第 2715816号公報
発明の開示
発明が解決しょうとする課題
[0004] ここで、実際の楽曲には、転調を含むような複数種類の調で構成される楽曲がある 。このような転調を含む楽曲の出現確率分布は、複数種類の調の出現確率分布が合 成された分布となる結果、楽曲に含まれる各調の出現確率分布のいずれとも異なる 分布となる場合がある。第 1の方法では、楽曲の出現確率分布とテンプレートの出現 確率分布とを 1対 1で照合するので、楽曲の出現確率分布が複数の調の合成分布と なる場合、合成分布に最も近似するテンプレートにより示される調が楽曲の調に決定 される。つまり、この場合、楽曲に含まれる調のいずれとも異なる調が楽曲の調として 決定されること〖こなる。したがって、上記第 1の方法では、転調を含むような複数種類 の調で構成される楽曲につ ヽては調を誤検出してしまう可能性がある。
[0005] また、特許文献 1に開示された方法では、楽曲の音階情報を複数の区間に区切り、 その区間毎に調が検出される。そして、検出された各区間の調の変化によって、転調 する箇所が検出される。ここで、調を検出する対象は、入力された音階情報の全体で はなく、当該音階情報を短く区切った区間である。具体的には、特許文献 1の方法で は、転調を検出するためには、少なくとも数小節程度 (例えば 4小節程度)の単位に 音階情報を区切らなければならない。ここで、音階情報を区間に区切ると、調を検出 する対象に含まれる音の数が少なくなる。つまり、音階情報を区間に区切ることによつ て、調を検出する対象に含まれる情報数が少なくなるので、調を検出する精度が必 然的に低下してしまう。以上より、特許文献 1の方法では、音階情報を区切らなけれ ばならないことが理由で、各区間における調を検出する精度が低下してしまう。
[0006] それ故、本発明は、楽曲が転調を含む場合であっても楽曲の曲調情報を正確に検 出することが可能な楽曲処理装置を提供することを目的とする。
課題を解決するための手段
[0007] 第 1の局面は、所定の楽曲について、楽曲の曲調を示す曲調情報を検出する楽曲 処理装置であって、所定の楽曲の少なくとも一部について、音名毎の出現確率の分 布を取得する出現確率取得部と、楽曲のタイプ毎に異なるテンプレートであって音名 毎の出現確率の分布を示すテンプレートを複数のタイプにっ ヽてそれぞれ記憶する テンプレート記憶部と、テンプレート記憶部に記憶されている複数の各テンプレート につ 、て、出現確率取得部によって取得された各音名の出現確率の分布に占める そのテンプレートの割合を示す荷重度を算出する荷重度算出部と、荷重度算出部に よって各テンプレートについてそれぞれ算出された荷重度力もなる荷重度の組を曲 調情報として検出する曲調情報検出部とを備える。 [0008] 第 2の局面は、上記第 1の局面において、テンプレート記憶部に記憶されているテ ンプレートは、楽曲の調を示し、楽曲の調毎に異なるテンプレートであって、曲調情 報検出部は、荷重度の組に基づいて、所定の楽曲の調、調性、調性占有率、および スケールのうち少なくとも 1つを曲調情報としてさらに検出する。
[0009] 第 3の局面は、上記第 2の局面において、曲調情報検出部は、テンプレート記憶部 に記憶されている各テンプレートのうち、荷重度算出部によって算出された荷重度が 最大値となるテンプレートにより示される調を所定の楽曲の調として検出する。
[0010] 第 4の局面は、上記第 2の局面において、曲調情報検出部は、調性が同じである調 を示す複数のテンプレートについて荷重度の総和を算出する処理を各調性につい て行い、算出された総和が大きい方の調性を所定の楽曲の調性として検出する。
[0011] 第 5の局面は、上記第 2の局面において、曲調情報検出部は、スケールが同じであ る調を示す複数のテンプレートについて荷重度の総和を算出する処理を各スケール につ 、て行 、、算出された総和が最も大き 、スケールを所定の楽曲のスケールとし て検出する。
[0012] 第 6の局面は、上記第 1の局面において、出現確率取得部が出現確率の分布を取 得する対象となる複数の楽曲のデータを記憶する楽曲データ記憶部と、曲調情報検 出部によって検出された荷重度の組および当該組から算出される情報の少なくとも 一方の情報を、楽曲データ記憶部にデータが記憶されている楽曲のうちの当該情報 に対応する楽曲に関連付けて曲調情報として楽曲データ記憶部に記憶させる曲調 情報記憶部と、楽曲データ記憶部にデータが記憶されている楽曲を、曲調情報を用 いて検索する検索部とをさらに備える。
[0013] 第 7の局面は、上記第 6の局面において、ユーザによって入力されるべき選曲情報 と曲調情報に関する条件とを関連付けた選曲ルールを記憶する選曲ルール記憶部 をさらに備え、検索部は、ユーザによって選曲情報が入力された場合、楽曲データ記 憶部にデータが記憶されている楽曲のうち、当該入力された選曲情報に関連付けら れた条件を満たす楽曲を検索結果として出力する。
[0014] 第 8の局面は、所定の楽曲について、楽曲の曲調を示す曲調情報を検出する楽曲 処理装置において用いられる方法であって、楽曲処理装置には、楽曲のタイプ毎に 異なるテンプレートであって音名毎の出現確率の分布を示すテンプレートが複数の タイプについてそれぞれ予め記憶されており、所定の楽曲の少なくとも一部について 、音名毎の出現確率の分布を取得する出現確率取得ステップと、記憶されている複 数の各テンプレートにつ 、て、出現確率取得ステップにお 、て取得された各音名の 出現確率の分布に占めるそのテンプレートの割合を示す荷重度を算出する荷重度 算出ステップと、荷重度算出ステップにお 、て各テンプレートにつ 、てそれぞれ算出 された荷重度力 なる荷重度の組を曲調情報として検出する曲調情報検出ステップ とを含む。
[0015] 第 9の局面は、上記第 8の局面において、楽曲処理装置には、出現確率取得ステツ プにおいて出現確率の分布が取得される対象となる複数の楽曲のデータがさらに予 め記憶されており、曲調情報検出ステップにお!/、て検出された荷重度の組および当 該組から算出される情報の少なくとも一方の情報を、楽曲処理装置にデータが記憶 されている楽曲のうちの当該情報に対応する楽曲に関連付けて曲調情報として楽曲 処理装置に記憶させる曲調情報記憶ステップと、楽曲処理装置にデータが記憶され ている楽曲を、曲調情報を用いて検索する検索ステップとをさらに含む。
[0016] 第 10の局面は、所定の楽曲について、楽曲の曲調を示す曲調情報を検出する楽 曲処理装置のコンピュータに実行させるためのプログラムであって、楽曲処理装置に は、楽曲のタイプ毎に異なるテンプレートであって音名毎の出現確率の分布を示す テンプレートが複数のタイプについてそれぞれ予め記憶されており、所定の楽曲の 少なくとも一部につ 、て、音名毎の出現確率の分布を取得する出現確率取得ステツ プと、記憶されている複数の各テンプレートについて、出現確率取得ステップにおい て取得された各音名の出現確率の分布に占めるそのテンプレートの割合を示す荷重 度を算出する荷重度算出ステップと、荷重度算出ステップにお!/、て各テンプレートに ついてそれぞれ算出された荷重度力 なる荷重度の組を曲調情報として検出する曲 調情報検出ステップとを、コンピュータに実行させる。
[0017] 第 11の局面は、上記第 10の局面において、上記プログラムを記録した、コンビユー タで読み取り可能な記録媒体である。
[0018] 第 12の局面は、所定の楽曲について、楽曲の曲調を示す曲調情報を検出する集 積回路であって、所定の楽曲の少なくとも一部について、音名毎の出現確率の分布 を取得する出現確率取得部と、楽曲のタイプ毎に異なるテンプレートであって音名毎 の出現確率の分布を示す複数の各テンプレートについて、出現確率取得部によって 取得された各音名の出現確率の分布に占めるそのテンプレートの割合を示す荷重 度を算出する荷重度算出部と、荷重度算出部によって各テンプレートについてそれ ぞれ算出された荷重度力 なる荷重度の組を曲調情報として検出する曲調情報検 出部とを備える。
発明の効果
[0019] 上記第 1の局面によれば、複数のテンプレートの中から最も一致するテンプレートを 1つ選択するのではなぐ各テンプレートの荷重度の組が検出される。これによつて、 所定の楽曲(曲調情報を検出する対象となる楽曲)における出現確率の分布に占め る各テンプレートの割合を知ることができる。すなわち、テンプレートに対応する楽曲 のタイプを 1つ決定するのではなぐ「所定の楽曲に占める各タイプの割合」を検出す ることができ、所定の楽曲の曲調を各タイプ毎の割合として表すことができる。したが つて、例えば所定の楽曲が 2つの調を含む場合には、その 2つの調のテンプレートの 荷重度が大きく算出される。つまり、第 1の発明によれば、楽曲が転調を含む場合で あっても楽曲の曲調情報を正確に検出することが可能となる。
[0020] 上記第 2の局面によれば、荷重度の組を用いて算出することで、最も優勢な調、最 も優勢な調性、最も優勢な調性占有率および最も優勢なスケールを正確に検出する ことができる。
[0021] 上記第 3の局面によれば、荷重度が最大値となるテンプレートにより示される調を検 出することで、楽曲の調を正確に検出することができる。
[0022] 上記第 4の局面によれば、調性が同じである調を示す複数のテンプレートについて 荷重度の総和をそれぞれ算出し、総和が大きい方の調性を検出することで、楽曲の 調性を正確に検出することができる。
[0023] 上記第 5の局面によれば、スケールが同じである調を示す複数のテンプレートにつ いて荷重度の総和を算出し、総和が最も大きいスケールを検出することで、楽曲のス ケールを正確に検出することができる。 [0024] 上記第 6の局面によれば、荷重度の組、または、それから得られる情報 (調、調性、 スケール等)を用いて楽曲の検索を行うことができる。したがって、曲調情報を用いた 検索を正確に行うことができる。
[0025] 上記第 7の局面によれば、ユーザは、入力した選曲条件に関連する楽曲を容易に 検索することができる。
[0026] 本発明のこれらおよび他の目的、特徴、局面、効果は、添付図面と照合して、以下 の詳細な説明から一層明らかになるであろう。
図面の簡単な説明
[0027] [図 1]図 1は、本発明の第 1の実施形態に係る曲調検出装置 1を示すブロック図であ る。
[図 2]図 2は、音階情報入力部 11に入力される楽曲の音階情報の一例を示す図であ る。
[図 3]図 3は、各音名に関する出現確率の分布を概念的に示す図である。
[図 4]図 4は、 24種類のテンプレートと当該各テンプレートについての荷重度の算出 結果の一例を示す図である。
[図 5]図 5は、第 1の実施形態に係る曲調検出装置 1の処理の流れを表すフローチヤ ートを示す図である。
[図 6]図 6は、同一スケールで形成される調の関係の一例を示す図である。
[図 7]図 7は、曲調検出装置 1がコンピュータシステム 100によって実現される構成例 を示すブロック図である。
[図 8]図 8は、本発明の第 2の実施形態に係る楽曲検索装置 2を示すブロック図であ る。
[図 9]図 9は、第 2の実施形態に係る楽曲検索装置 2の処理の流れを表すフローチヤ ートを示す図である。
[図 10]図 10は、楽曲データ記憶部 23に記憶されるデータの一例を示す図である。
[図 11]図 11は、選曲情報入力部 25の入力画面の一例を示す図である。
[図 12]図 12は、選曲ルールの一例を示す図である。
符号の説明 [0028] 1 曲調検出装置
11 音階情報入力部
12 出現確率算出部
13 テンプレート記憶部
14 荷重度算出部
15 曲調情報検出部
100 コンピュータシステム
110 演算処理部
120 記憶部
130 ディスクドライブ装置
140 記録媒体
2 楽曲検索装置
21 楽曲入力部
22 音階データ変換部
23 楽曲データ記憶部
24 選曲ルール記憶部
25 選曲情報入力部
26 検索部
発明を実施するための最良の形態
[0029] 以下に、本発明の実施形態について図面を参照しながら説明する。なお、以下の 説明において、「調性」とはメジャーおよびマイナーを意味し、「調性占有率」とは楽曲 内におけるメジャー(またはマイナー)の占有率を意味する。また、「スケール」とは、 調号が同一となるメジャーおよびマイナーの 12種類の組み合わせを意味する。また 、「調」とは調性とスケールとで構成される 24種類 (C ;Cメジャー、 Am; Aマイナー、 等)を意味する。これらの調、調性、調性占有率、およびスケールは、楽曲の曲調を 示す指標であり、曲調情報の 1つである。なお、後述する荷重度を組として示す情報 (荷重度の組)も曲調情報の 1つである。また、本発明における楽曲処理装置の一例 として、上記曲調情報を検出する曲調検出装置を第 1の実施形態として説明する。ま た、本発明における楽曲処理装置の他の例として、上記曲調情報を用いて楽曲を検 索する楽曲検索装置を第 2の実施形態として説明する。
[0030] (第 1の実施形態)
まず、本発明の第 1の実施形態に係る曲調検出装置 1について、図 1を用いて説明 する。図 1は、本発明の第 1の実施形態に係る曲調検出装置 1を示すブロック図であ る。図 1において、曲調検出装置 1は、音階情報入力部 11、出現確率算出部 12、テ ンプレート記憶部 13、荷重度算出部 14および曲調情報検出部 15を備える。
[0031] 音階情報入力部 11は、曲調検出装置 1の外部または内部から、楽曲の音階情報 の入力を受け付ける。音階情報入力部 11に入力される楽曲の音階情報は、少なくと も音の高さ (ノートナンバー)および音の長さ(デュレーシヨン)の情報を含むデータと する。図 2は、音階情報入力部 11に入力される楽曲の音階情報の一例を示す図で ある。図 2において、楽曲の音階情報は、「小節数 Z拍数 Zティック数」で示された時 間と、音の強さを表すべ口シティと、ノートナンバーとで表現される。ここで、上記時間 は、各ノートナンバーが発音または消音となる時間を示す。ベロシティは 0〜127の範 囲の整数で表現され、ベロシティの値が大きいほど音量が大きい。なお、ベロシティ の値が「0」であることは消音を示す。ノートナンバーの値は、ピアノの鍵盤中央のじの 高さを示す値を「60」として設定される。また図 2においては、デュレーシヨンは時間 およびべ口シティによって表される。例えば時間が「οοοΖ〇Ζοοο」のとき、ノートナ ンバーが「60」でべ口シティは「90 (発音)」となる。また、時間が「000Ζ0Ζ432」のと き、ノートナンバーが「60」でべ口シティは「0 (消音)」となる。したがって、「000Ζ〇Ζ 000」から「000Ζ0Ζ432」までの時間区間の音階情報は、ノートナンバーが「60」、 ベロシティが「90」で、デュレーシヨン力 32ティックとなる。
[0032] なお、図 2に示す楽曲の音階情報の一例では、時間は「小節数 Ζ拍数 Ζティック数 」で示されたが、例えば「時間 Ζ分 Ζ秒 Ζフレーム Ζサブフレーム」で示されてもよ ヽ 。またべ口シティは、 0〜 127の範囲の整数で表現した力 例えば、発音を表す「1」お よび消音を表す「0」の 2値で表現されてもよい。
[0033] 以上のように、図 2に示す楽曲の音階情報には、音の高さ(ノートナンバー)および 音の長さ(デュレーシヨン)の情報が含まれる。なお、楽曲の音階情報は、単純にノー トナンバーに対してデュレーシヨンを 1対 1で持つ方法で表現されてもよい。また楽曲 の音階情報は、ノートナンバーおよびデュレーシヨンの他に、ノートナンバーの連続 的な変化を表すピッチベンドの情報をさらに含む方法で表現されてもよい。このときノ ートナンバーはピッチベンドの値に応じて変動する。
[0034] 出現確率算出部 12は、音階情報入力部 11に入力された楽曲の音階情報に含ま れる各音名の出現確率をそれぞれ算出する。図 3は、各音名に関する出現確率の分 布(出現確率分布)を概念的に示す図である。図 3においては、 C ;i=0、 C# ;i= l、 〜、 B;i= l lのように、 12種類の音名には 0から 11までの音名ナンバー iがそれぞれ 付されている。なお、以下の説明では、音名ナンバーが iである音名のことを「音名 i」 と記載することがある。
[0035] テンプレート記憶部 13は、 24種類の調に対応する 24種類のテンプレートを記憶す る。 24種類のテンプレートは、楽曲の異なるタイプをそれぞれ表したものとなる。また テンプレートは、それに対応する調の理想的な出現確率分布を示す。これらの各テ ンプレートは、予め作成されてテンプレート記憶部 13に記憶される。図 4は、 24種類 のテンプレートと各テンプレートについての荷重度の算出結果との一例を示す図であ る。図 4においては、各テンプレートにより示される 24種類の調には、メジャーの調 =0〜11、マイナーの調を j = 12〜23とした調ナンバー jが付されている。なお、以下 の説明では、調ナンバーが jである調のことを「調 と記載することがある。また、各テ ンプレートについての荷重度の算出結果については後述にて説明する。
[0036] 荷重度算出部 14は、出現確率算出部 12で算出される楽曲の出現確率分布とテン プレート記憶部 13に記憶される各テンプレートとに基づいて、各テンプレートについ ての荷重度をそれぞれ算出する(図 4参照。;)。荷重度算出部 14は、 24種類のテン プレートに 1つずつ対応するように 24個の荷重度を算出する。ここで、荷重度とは、 楽曲の出現確率分布においてテンプレートの出現確率分布が占める割合(占有率) を示す。換言すれば、テンプレートの荷重度とは、 24種類のテンプレートを用いて楽 曲の出現確率分布を表す場合に、そのテンプレートの出現確率分布が寄与する割 合を示す値である。例えば、荷重度の値が大きいテンプレートは、楽曲の出現確率 分布において占める割合が大きいテンプレートである。したがって、荷重度の値が大 、テンプレートに対応する調は、当該楽曲にお 、て占める割合が大き!/、調である。
[0037] 曲調情報検出部 15は、荷重度算出部 14で算出された 24個の荷重度に基づいて 楽曲の曲調情報を検出する。曲調情報とは、 24個の荷重度を 1つの組として示す情 報 (荷重度の組)または当該荷重度の組から算出される各種情報を示す。ここで各種 情報とは、例えば、上述した調、調性占有率、調性およびスケールなどを示す情報で ある。曲調情報検出部 15は、荷重度の組を曲調情報として検出する。そして、当該 荷重度の組から算出される調、調性占有率、調性およびスケールなどを曲調情報と して検出する。
[0038] 次に、第 1の実施形態に係る曲調検出装置 1の処理の流れについて図 5を用いて 説明する。図 5は、第 1の実施形態に係る曲調検出装置 1の処理の流れを表すフロ 一チャートを示す図である。
[0039] 音階情報入力部 11は、曲調検出装置 1の外部または内部から、楽曲の音階情報 の入力を受け付ける(ステップ Sl)。例えば、 SMF (スタンダード MIDIファイル)など の、音階情報を示す音階データが入力される。なお、入力される音階データは、 PC Mデータ等の音声データを変換したものであってもよい。ここでは、図 2に示したよう な音階情報が入力されるものとする。なお、本発明では、入力された楽曲を小節等の 区間に区切る必要がないので、本発明において用いる音階情報には、小節の位置 を示す情報が含まれている必要はない。本発明では、転調を含む楽曲を小節等の 区間に区切ることなぐ楽曲に含まれている調を正確に検出することができる。
[0040] ステップ S1の次に、出現確率算出部 12は、ステップ S1で入力された楽曲の音階 情報に含まれる各音名の出現確率をそれぞれ算出する (ステップ S2)。ここで音名 i の出現確率を P (i)とする。出現確率 P (i)は、音階情報に含まれる音名 iが持つデュレ ーシヨンの総和を全ての音名(i=0〜l l)が持つデュレーシヨンの総和で除算するこ とにより算出される。なお、各音名の出現確率の総和∑P (i)は、以下の式(1)のよう に示される。
∑P (i) = l (i=0〜: L l "(l)
[0041] 上記ステップ S2において示したように、本実施形態では、楽曲の各音名の出現確 率分布は出現確率算出部 12によって算出されるものとした。ここで、楽曲の各音名 の出現確率分布が予め分力つている場合、すなわち、楽曲の各音名の出現確率分 布を示すデータが得られている場合には、出現確率算出部 12は、ステップ S2にお いて当該データを取得するようにしてもよい。この場合、ステップ S2で出現確率分布 を算出する処理を省略することができる。
[0042] ステップ S2の次に、荷重度算出部 14は、各テンプレートについての荷重度をそれ ぞれ算出する (ステップ S3)。荷重度は、ステップ S2で算出された各音名の出現確 率 (楽曲の実際の出現確率)と、テンプレート記憶部 13に記憶された 24種類のテン プレートにより示される出現確率とを用いて算出される。以下、荷重度を算出する方 法を詳細に説明する。
[0043] まず、曲調情報を検出する対象となる楽曲の出現確率分布を、 24種類の調 (j = 0 〜23)に対応する 24種類のテンプレートの出現確率分布を用いて表現することを考 える。ここで、対象となる楽曲の出現確率分布において調 jのテンプレートの出現確率 分布が占める割合を示す荷重度を W(j)とする。そして、調 jのテンプレートに含まれ る音名 iの出現確率を Pt (j, i)とする。このとき、次の式(2)および式(3)の関係が成り 立つ。
∑W(j) = l (j = 0〜23) "' (2)
∑Pt (j, i) = l (i=0〜: L Iト - (3)
ここで、各テンプレートを用いて (すなわち、 W(j)および Pt (j, i)を用いて)、対象とな る楽曲の音階情報に含まれる音名 iの出現確率 Pf (i)を表現した場合、当該出現確 率 Pf (i)は次の式 (4)のように示される。
Pf (i) =∑(W(j) * Pt (j, i) ) (j = 0〜23ト - (4)
したがって、ステップ S2で算出された楽曲の実際の出現確率 P (i)と Pf (i)とが全音名 (i=0〜l l)について一致するように各テンプレートの荷重度 W(j) (j = 0〜23)を算 出する。つまり、式(2)〜(4)の関係を満たし、 i = 0〜: L 1につ 、て P (i) = Pf (i)となる ような W(j)を求めればよい。具体的には、ここでは、各音名の出現確率の誤差 (P (i) — Pf (i) )を 2乗した和を最小化させることによって各テンプレートの荷重度 W (j) (j = 0〜23)を求める。より具体的には、音名 iの出現確率の誤差を E (i)とし、その誤差 E ( i)を 2乗した和を 'Eとすると、 E (i)および 'Eはそれぞれ式 (5)および式(6)のように 示される。
E (i) =P (i) - Pf (iト - (5)
Έ= Σ (E (i) ) 2 (i=0〜: L l "(6)
この式 (6)を用いて、 'Eが最小となる各テンプレートの荷重度 W(j) (j = 0〜23)を算 出する。なお、各テンプレートの荷重度 W(j) (j = 0〜23)は、例えば進化戦略 (Evol utionary Strategy)を用いて算出することができる力 W(j)を算出するァルゴリズ ムはどのようなものであってもよい。以上のように、ステップ S3では、各テンプレートの 荷重度 W(j) (j = 0〜23)が算出される。各テンプレートの荷重度 W(j) (j = 0〜23) は、例えば図 4に示すような算出結果となる。
[0044] ステップ S3の次に、曲調情報検出部 15は、ステップ S3で算出された各テンプレー トの荷重度 W(j) (j = 0〜23)を 1つの組として示す情報 (荷重度の組)を楽曲の曲調 情報として検出する (ステップ S4)。また、本実施形態では、ステップ S4において曲 調情報検出部 15は、調、調性占有率、調性およびスケールを楽曲の曲調情報として さらに検出する。以下に、調、調性占有率、調性およびスケールの検出方法につい て説明する。
[0045] まず調については、曲調情報検出部 15は、荷重度 W(j)の値が最大となるテンプレ ートに対応する調ナンバー jの調を求め、当該調を最も優勢な調として検出する。次 に調性占有率については、曲調情報検出部 15は、楽曲内におけるメジャーの占有 率およびマイナーの占有率を調性占有率として次の方法で検出する。メジャーの占 有率を Rmaj、マイナーの占有率を Rminとすると、図 4において調ナンバー j = 0〜l 1がメジャーの調、 j = 12〜23がマイナーの調としているので、 Rmajおよび Rminは それぞれ以下の式で算出される。
Rmaj =∑W(j) (j = 0〜: ί ! ·· (7)
Rmin=∑W(j) (j = 12〜23)…(8)
したがって、曲調情報検出部 15は、式(7)および式 (8)で算出した Rmajと Rminを 調性占有率として検出する。
[0046] 次に調性については、曲調情報検出部 15は、メジャーまたはマイナーどちらが優 勢であるかを調性として検出する。すなわち、曲調情報検出部 15は、上記式 (7)およ び式(8)で算出された Rmajの値と Rminの値とを比較して Rmajの値が大きければメ ジャー、 Rminの値が大きければマイナーとして調性を検出する。
[0047] 次にスケールの検出方法について図 6を用いて説明する。図 6は、同一スケールで 形成される調の関係の一例を示す図である。図 6において、 24種類の調のうちそれ ぞれ 2種類の調が同一スケールとなるので、スケールは計 12種類存在する。また、各 スケールについて、図 6に示すようにスケールナンバー s(s = 0〜 11)が付される。例 えば図 6に示すように、同一スケールとなる C (j = 0)および Am (j = 12)の 2種類の調 は、スケールナンバー sが s = 0である。ここで、楽曲内における各スケールの占有率 をスケール占有率 Rs(s) (s = 0〜ll)とすると、 Rs(s)は以下のようにそれぞれ算出さ れる。
Rs(0)=W(0)+W(12)
Rs(l)=W(l)+W(13)
Rs(2)=W(2)+W(14)
Rs(ll)=W(ll)+W(23)
したがって、曲調情報検出部 15は、スケール占有率 Rs(s)の値が最大となるスケー ルナンバー sのスケールを求め、当該スケールを最も優勢なスケールとして検出する
[0048] 以上のように、本実施形態に係る曲調検出装置 1は、楽曲の出現確率分布とテン プレートの出現確率分布とを 1対 1で照合するのではなぐ楽曲の出現確率分布にお いて各調のテンプレートが占める割合 (荷重度)を算出する。その結果、楽曲に含ま れる複数の調を検出する楽曲が転調を含むような複数種類の調で構成される場合で あっても、楽曲の曲調情報を正確に検出することが可能となる。
[0049] また、本実施形態に係る曲調検出装置 1で検出された楽曲の曲調情報のうち荷重 度の組によって、ユーザは、当該楽曲に含まれる複数の調の割合を把握することが できる。すなわち、 1つの調の荷重度の値が大きぐそれ以外の調の荷重度の値が小 さい場合には、ユーザは当該楽曲が単調の曲であることを把握できる。また、多数の 調で荷重度の値が近似する場合には、ユーザは当該楽曲が多数の調で構成されて いる楽曲であることを把握できる。したがって、ユーザは実際に楽曲を聞かなくても当 該楽曲のイメージを把握することができる。また、検出された調、調性占有率、調性お よびスケールなどの曲調情報によっても、上記荷重度の組と同様、ユーザは実際に 楽曲を聞力なくても当該楽曲のイメージを把握することができる。
[0050] また以上の説明では、テンプレート記憶部 13には 24種類の調についてそれぞれ 1 つずつのテンプレートしか記憶されていない。しかし、 1種類の調について複数のテ ンプレートが記憶されてもよい。 1種類の調について、例えばポップス、ジャズ、クラシ ックなどのジャンル毎にテンプレートを用意して、テンプレート記憶部 13に記憶させる 。そして、テンプレート記憶部 13に記憶される全てのテンプレートについての荷重度 を算出することで、曲調検出装置 1は楽曲のジャンルに合わせた曲調情報を正確に 検出することができる。また、各テンプレートの荷重度には、それぞれジャンルの情報 が含まれるので、楽曲のジャンルも検出することが可能となる。
[0051] また、 1種類の調について、例えばメロディおよびベースなどの特定のパート専用毎 にテンプレートが用意され、テンプレート記憶部 13に記憶されてもよい。そして、テン プレート記憶部 13に記憶されるテンプレートのうち、入力される楽曲のパートに合わ せたテンプレートについての荷重度を算出することで、曲調検出装置 1は入力される 楽曲のパートに合わせた曲調情報を正確に検出することができる。
[0052] また、テンプレートとして、 24種類の調ではなくスケールまたはコードなどに対応す る出現確率分布を用いてもよい。そして、当該各テンプレートについての荷重度を算 出することで、スケールまたはコードに関する曲調情報を検出することができる。
[0053] また、音階情報入力部 11で入力を受け付ける音階情報は、メロディやベースなど の演奏のパートを少なくとも 1つ含むものであれば良ぐ例えば複数のパートで構成さ れる音階情報であってもよい。また、音階情報を構成する楽曲の演奏時間は、全演 奏時間分であってもよいし、一部の演奏時間分であってもよい。ここで、一部の演奏 時間分は、例えば前奏を除く楽曲の前半部分の演奏時間分としてもよい。当該演奏 時間は、主要な調で構成されることが一般的に多いからである。その結果、曲調検出 装置 1は、より精度の高い曲調情報を検出することができる。また、曲調検出装置 1の 処理負担ち軽減させることができる。
[0054] なお、本実施形態に係る曲調検出装置 1は、一般的なコンピュータシステム 100に 曲調情報検出プログラムを実行させることによって実現されてもよい。図 7は、曲調検 出装置 1がコンピュータシステム 100によって実現される構成例を示すブロック図であ る。なお、図 7において、音階情報入力部 11、出現確率算出部 12、テンプレート記 憶部 13、荷重度算出部 14および曲調情報検出部 15は、図 1に示される各構成部と それぞれ同一の符号を付し、かつ同一の機能とし、説明を省略する。
[0055] 図 7において、コンピュータシステム 100は、演算処理部 110、記憶部 120および ディスクドライブ装置 130を備える。演算処理部 110は、 CPUまたはメモリなどで構成 され、曲調情報検出プログラムを実行させることによって、音階情報入力部 11、出現 確率算出部 12、荷重度算出部 14および曲調情報検出部 15と同一の機能を実現す る。また記憶部 120は、ハードディスクなどの記録媒体で構成され、曲調情報検出プ ログラムを実行させることによって、テンプレート記憶部 13と同一の機能を実現する。 ディスクドライブ装置 130は、コンピュータシステム 100を曲調検出装置 1として機能さ せるための曲調情報検出プログラムが記憶された記録媒体 140から、当該曲調情報 検出プログラムを読み出す。当該曲調情報検出プログラムが任意のコンピュータシス テム 100にインストールされることにより、当該コンピュータシステム 100を上述した曲 調検出装置として機能させることができる。なお、記録媒体 140は、例えばフレキシブ ルディスクや光ディスクなどのディスクドライブ装置 130によって読み取り可能な形式 の記録媒体である。また、曲調情報検出プログラムは、予めコンピュータシステム 100 にインストールされて ヽてもかまわな 、。
[0056] なお、以上の説明では、上記曲調情報検出プログラムは記録媒体 140によって提 供されるとした力 インターネットなどの電気通信回線によって提供されてもよい。また 、曲調情報検出における処理は、全部または一部をハードウェアによって処理される 形態であってもよい。
[0057] (第 2の実施形態)
次に、本発明の第 2の実施形態に係る楽曲検索装置 2について、図 8および図 9を 用いて説明する。図 8は、本発明の第 2の実施形態に係る楽曲検索装置 2を示すブ ロック図である。図 8において、楽曲検索装置 2は、楽曲入力部 21、音階データ変換 部 22、出現確率算出部 12、楽曲データ記憶部 23、テンプレート記憶部 13、荷重度 算出部 14、曲調情報検出部 15、選曲ルール記憶部 24、選曲情報入力部 25および 検索部 26を備える。なお、図 8において、出現確率算出部 12、テンプレート記憶部 1 3、荷重度算出部 14および曲調情報検出部 15は、第 1の実施形態で説明した曲調 検出装置 1の各構成部とそれぞれ同一の符号を付し、かつ同一の機能とし、説明を 省略する。
[0058] 図 9は、第 2の実施形態に係る楽曲検索装置 2の処理の流れを表すフローチャート を示す図である。なお、図 9において、ステップ S1〜S4は、第 1の実施形態で説明し た曲調検出装置 1の処理(図 5参照。)のステップ S1〜S4とそれぞれ同一の符号を 付し、かつ同一の処理とし、説明を省略する。以下に、図 9を用いて楽曲検索装置 2 の処理の流れにっ 、て説明する。
[0059] 楽曲入力部 21は、楽曲検索装置 2の外部または内部から、楽曲データの入力が受 け付けられた力否かを判定する (ステップ Sl l)。ステップ SI 1の判定の結果、楽曲デ ータが入力されていないと判定された場合、ステップ S 15の処理が行われる。一方、 ステップ S11の判定の結果、楽曲データが入力されたと判定された場合、ステップ S 12の処理が行われる。すなわち、楽曲入力部 21は、入力された楽曲データを楽曲 データ記憶部 23に記憶する (ステップ S 12)。
[0060] ここで楽曲データは、音声データであってもよいし、音階データであってもよい。音 階データとは、例えば PCM形式の音声データ、 MP3および AACなどの圧縮形式の 音声データなどである。音階データとは、 SMF (スタンダード MIDIファイル)などの 音階情報を示す音階データなどである。なお、入力される楽曲データは、例えばメロ ディまたはベースなどの演奏のパートを少なくとも 1つ含むものであればよぐ例えば 複数のパートで構成されるデータであってもよい。また、楽曲データの演奏時間は、 全演奏時間分であってもよ 、し、一部の演奏時間分であってもよ 、。
[0061] ステップ S12の次に、音階データ変換部 22は、ステップ S12で記憶された楽曲デ ータが音声データ (例えば PCM形式の音声データ)である場合には、当該音声デー タを音階情報を示す音階データに変換する (ステップ S13)。音階データ変換部 22 は、例えば特開昭 58— 181090号公報に開示された方法で音声データを音階デー タに変換する。また、音階データ変換部 22は、音声データが MP3および AACなど の圧縮形式の音声データである場合には、ー且 PCM形式の音声データに変換した 後、音階データに変換する。なお、音階データに変換する方法は上記方法に限らず 、他の方法を用いてもよい。また、ステップ S12で記憶された楽曲データが SMFなど の音階データである場合には、上記ステップ S13の処理は行わずにステップ S1〜S 4の処理が行われる。
[0062] ステップ S 13の次に、ステップ S1〜S4 (図 5参照。 )において、ステップ S 12で記憶 された音階データまたはステップ S13で変換された音階データに基づいて曲調情報 が検出される。そして、曲調情報検出部 15は、楽曲データ記憶部 23に曲調情報を 記憶する(ステップ S14)。ここで楽曲データ記憶部 23には、ステップ S12で記憶され た楽曲データと、ステップ S4で検出された楽曲データの曲調情報とがそれぞれ関連 づけられて記憶される。図 10は、楽曲データ記憶部 23に記憶されるデータの一例を 示す図である。図 10では、楽曲データ記憶部 23には、楽曲データ以外に曲調情報 として最も優勢な調 (K)、調性 (T)、最も優勢なスケール (S)およびメジャーの占有 率 (Rmaj)が記憶される。また、図 10において、楽曲データのスケール(S)はスケー ルナンバー sで示される。また、楽曲データ記憶部 23に記憶される楽曲データは、楽 曲番号で管理されており、楽曲データとそれに関連づけられた曲調情報は、適宜削 除または追加されることが可能である。
[0063] なお、ステップ S14において楽曲データ記憶部 23には、ステップ S4において検出 された荷重度の組、調、調性占有率、調性およびスケールなど曲調情報のうち少なく とも 1つが記憶される。
[0064] ステップ S14の次に、検索部 26は、選曲情報入力部 25から選曲情報が入力され た力否かを判定する (ステップ S 15)。ユーザは、選曲情報入力部 25を用いて所望す る楽曲の選曲情報を入力する。図 11は、楽曲検索装置 2がもつ入力画面の一例を 示す図である。図 11において、入力画面には、選曲情報リスト 251と検索ボタン 252 とが表示される。そして、ユーザは、選曲情報入力部 25を用いて選曲情報リスト 251 にある選曲情報の中力 所望する選曲情報を選択した後、検索ボタン 252を押すこ とによって選曲情報を入力する。
[0065] ステップ S15の判定の結果、選曲情報が入力されていない場合、ステップ S11の処 理に戻る。一方、ステップ S 15の判定の結果、選曲情報が入力された場合、ステップ S 16の処理が行われる。
[0066] ステップ S15の次に、検索部 26は、入力された選曲情報に対応する検索条件を特 定する (ステップ S16)。ここで、入力された選曲情報に対応する検索条件を特定する 方法としては、選曲ルール記憶部 24に記憶される選曲ルールに基づ 、て特定する 方法がある。図 12は、選曲ルールの一例を示す図である。選曲ルール記憶部 24に は、楽曲の検索を行うための選曲ルールが記憶される。図 12では、選曲ルールとし て、選曲情報リスト 251に表示された選曲情報と当該選曲情報に対応した検索条件 とが予め設定される。すなわち図 12において、例えば「明るい」という選曲情報に対し て検索条件は調性カ^ジャ一である楽曲データ、「やや楽しい」という選曲情報に対 して検索条件はメジャーの占有率 Rmajが 0. 6〜0. 8である楽曲データなどと設定さ れている。
[0067] なお、選曲ルール記憶部 24に記憶される選曲情報は、例えば「楽しい」「やや楽し い」「普通」「やや悲しい」「悲しい」を 5段階に分類せずに「楽しい 悲しい」の度合い としてもよい。このとき、選曲情報は、例えば「楽しい(1. 0) 悲しい(0. 0)」の度合 い sxと設定される。また、検索条件は、例えばメジャー占有率 Rmajが度合い sxと誤 差 0. 1以内である楽曲データと設定される。そして、ユーザは選曲情報入力部 25と してスライダーなどのバーを用いて選曲情報を入力する。
[0068] ステップ S16の次に、検索部 26は、ステップ S12で楽曲データ記憶部 23に記憶さ れた楽曲データの中から、ステップ S16で特定された条件に基づいて楽曲の検索を 行い、その条件に合致する楽曲の曲名を表示する (ステップ S 17)。なお、ステップ S 17にお 、て、表示された楽曲の曲名を再生する処理をさらに行ってもよ!、。
[0069] なお、以上の説明では、ユーザは、選曲情報を入力することによって、検索に用い る検索条件を特定した。ここで、他の実施形態においては、ユーザは、検索条件を直 接入力することによって特定してもよい。例えば、選曲情報入力部 25においてユー ザは、「調が c」や「メジャー」と 、う条件またはこれらの条件を複数組み合わせた条件 を入力する。このとき、検索部 26は、楽曲データ記憶部 23に記憶された曲調情報を 用いて、ユーザが入力した検索条件に合致する楽曲の検索を行い、検索条件に合 致する楽曲の曲名を表示する。その結果、ユーザは予め設定された選曲ルールによ る検索条件ではなぐ検索条件を自由に入力して楽曲の検索を行うことができる。
[0070] ステップ S17の次に、ユーザが楽曲検索装置 2の処理を終了する力否かを選択す る (ステップ S18)。当該処理を終了しない場合は、ステップ SI 1に戻る。以上の処理 を入力される楽曲データ毎に行う。
[0071] 以上のように、本実施形態に係る楽曲検索装置 2によって、ユーザは楽曲の曲調 情報に基づいて楽曲を検索することが可能となる。
[0072] なお、第 1および第 2の実施形態で説明した楽曲処理装置(曲調検出装置 1および 楽曲検索装置 2)は集積回路で構成されてもよい。例えば、第 1の実施形態において は、出現確率算出部 12、荷重度算出部 14、および曲調情報検出部 15が集積回路 で構成されてもよい。このとき集積回路は、楽曲およびテンプレート記憶部 13に記憶 されているテンプレートを入力する入力端子と、曲調情報検出部 15で検出した曲調 情報を出力する出力端子とを備える。また、第 2の実施形態においては、出現確率算 出部 12、荷重度算出部 14、曲調情報検出部 15、音階データ変換部 22、および検 索部 26が集積回路で構成されてもよい。このとき集積回路は、楽曲、テンプレート記 憶部 13に記憶されているテンプレート、選曲ルール、選曲情報、楽曲データ記憶部 23に記憶された楽曲データ、および楽曲データ記憶部 23に記憶された曲調情報を 入力する入力端子を備える。また、集積回路は、曲調情報検出部 15で検出した曲調 情報および検索部 26で検索した結果を出力する出力端子とを備える。なお、データ などを記憶する構成部(例えばテンプレート記憶部 13など)については、記憶部を備 える集積回路であれば、当該記憶部に適宜記憶させ、集積回路の一部として構成す るようにしてちょい。
[0073] 以上、本発明を詳細に説明してきたが、前述の説明はあらゆる点において本発明 の例示にすぎず、その範囲を限定しょうとするものではない。本発明の範囲を逸脱す ることなく種々の改良や変形を行うことができることは言うまでもな 、。 産業上の利用可能性
本発明に係る楽曲処理装置は、検出された曲調情報を用いて楽曲の検索を行う楽 曲検索装置、ジュークボックスおよびオーディオプレーヤーなどの用途にも適用でき る。

Claims

請求の範囲
[1] 所定の楽曲について、楽曲の曲調を示す曲調情報を検出する楽曲処理装置であ つて、
前記所定の楽曲の少なくとも一部について、音名毎の出現確率の分布を取得する 出現確率取得部と、
楽曲のタイプ毎に異なるテンプレートであって音名毎の出現確率の分布を示すテ ンプレートを複数のタイプについてそれぞれ記憶するテンプレート記憶部と、 前記テンプレート記憶部に記憶されている複数の各テンプレートについて、前記出 現確率取得部によって取得された各音名の出現確率の分布に占めるそのテンプレ ートの割合を示す荷重度を算出する荷重度算出部と、
前記荷重度算出部によって各テンプレートについてそれぞれ算出された荷重度か らなる荷重度の組を前記曲調情報として検出する曲調情報検出部とを備える、楽曲 処理装置。
[2] 前記テンプレート記憶部に記憶されているテンプレートは、楽曲の調を示し、楽曲 の調毎に異なるテンプレートであって、
前記曲調情報検出部は、前記荷重度の組に基づいて、前記所定の楽曲の調、調 性、調性占有率、およびスケールのうち少なくとも 1つを前記曲調情報としてさらに検 出する、請求項 1に記載の楽曲処理装置。
[3] 前記曲調情報検出部は、前記テンプレート記憶部に記憶されている各テンプレート のうち、前記荷重度算出部によって算出された荷重度が最大値となるテンプレートに より示される調を前記所定の楽曲の調として検出する、請求項 2に記載の楽曲処理 装置。
[4] 前記曲調情報検出部は、調性が同じである調を示す複数のテンプレートについて 荷重度の総和を算出する処理を各調性にっ 、て行 、、算出された総和が大き!、方 の調性を前記所定の楽曲の調性として検出する、請求項 2に記載の楽曲処理装置。
[5] 前記曲調情報検出部は、スケールが同じである調を示す複数のテンプレートにつ V、て荷重度の総和を算出する処理を各スケールにつ 、て行 、、算出された総和が 最も大き 、スケールを前記所定の楽曲のスケールとして検出する、請求項 2に記載 の楽曲処理装置。
[6] 前記出現確率取得部が前記出現確率の分布を取得する対象となる複数の楽曲の データを記憶する楽曲データ記憶部と、
前記曲調情報検出部によって検出された荷重度の組および当該組から算出される 情報の少なくとも一方の情報を、前記楽曲データ記憶部にデータが記憶されて 、る 楽曲のうちの当該情報に対応する楽曲に関連付けて曲調情報として前記楽曲デー タ記憶部に記憶させる曲調情報記憶部と、
前記楽曲データ記憶部にデータが記憶されて 、る楽曲を、前記曲調情報を用 、て 検索する検索部とをさらに備える、請求項 1に記載の楽曲処理装置。
[7] ユーザによって入力されるべき選曲情報と前記曲調情報に関する条件とを関連付 けた選曲ルールを記憶する選曲ルール記憶部をさらに備え、
前記検索部は、ユーザによって選曲情報が入力された場合、前記楽曲データ記憶 部にデータが記憶されている楽曲のうち、当該入力された選曲情報に関連付けられ た条件を満たす楽曲を検索結果として出力する、請求項 6に記載の楽曲処理装置。
[8] 所定の楽曲について、楽曲の曲調を示す曲調情報を検出する楽曲処理装置にお V、て用いられる方法であって、
前記楽曲処理装置には、楽曲のタイプ毎に異なるテンプレートであって音名毎の 出現確率の分布を示すテンプレートが複数のタイプについてそれぞれ予め記憶され ており、
前記所定の楽曲の少なくとも一部について、音名毎の出現確率の分布を取得する 出現確率取得ステップと、
前記記憶されている複数の各テンプレートについて、前記出現確率取得ステップに おいて取得された各音名の出現確率の分布に占めるそのテンプレートの割合を示す 荷重度を算出する荷重度算出ステップと、
前記荷重度算出ステップにお 、て各テンプレートにつ 、てそれぞれ算出された荷 重度力 なる荷重度の組を前記曲調情報として検出する曲調情報検出ステップとを 含む、楽曲処理方法。
[9] 前記楽曲処理装置には、前記出現確率取得ステップにおいて前記出現確率の分 布が取得される対象となる複数の楽曲のデータがさらに予め記憶されており、 前記曲調情報検出ステップにお 、て検出された荷重度の組および当該組から算出 される情報の少なくとも一方の情報を、前記楽曲処理装置にデータが記憶されてい る楽曲のうちの当該情報に対応する楽曲に関連付けて曲調情報として前記楽曲処 理装置に記憶させる曲調情報記憶ステップと、
前記楽曲処理装置にデータが記憶されている楽曲を、前記曲調情報を用いて検索 する検索ステップとをさらに含む、請求項 8に記載の楽曲処理方法。
[10] 所定の楽曲について、楽曲の曲調を示す曲調情報を検出する楽曲処理装置のコ ンピュータに実行させるためのプログラムであって、
前記楽曲処理装置には、楽曲のタイプ毎に異なるテンプレートであって音名毎の 出現確率の分布を示すテンプレートが複数のタイプについてそれぞれ予め記憶され ており、
前記所定の楽曲の少なくとも一部について、音名毎の出現確率の分布を取得する 出現確率取得ステップと、
前記記憶されている複数の各テンプレートについて、前記出現確率取得ステップに おいて取得された各音名の出現確率の分布に占めるそのテンプレートの割合を示す 荷重度を算出する荷重度算出ステップと、
前記荷重度算出ステップにお 、て各テンプレートにつ 、てそれぞれ算出された荷 重度力 なる荷重度の組を前記曲調情報として検出する曲調情報検出ステップとを 、前記コンピュータに実行させるプログラム。
[11] 請求項 10に記載のプログラムを記録した、コンピュータに読み取り可能な記録媒体
[12] 所定の楽曲について、楽曲の曲調を示す曲調情報を検出する集積回路であって、 前記所定の楽曲の少なくとも一部について、音名毎の出現確率の分布を取得する 出現確率取得部と、
楽曲のタイプ毎に異なるテンプレートであって音名毎の出現確率の分布を示す複 数の各テンプレートにつ 、て、前記出現確率取得部によって取得された各音名の出 現確率の分布に占めるそのテンプレートの割合を示す荷重度を算出する荷重度算 出部と、
前記荷重度算出部によって各テンプレートについてそれぞれ算出された荷重度か らなる荷重度の組を前記曲調情報として検出する曲調情報検出部とを備える、集積 回路。
PCT/JP2005/022303 2004-12-10 2005-12-05 楽曲処理装置 WO2006062064A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006546679A JP4698606B2 (ja) 2004-12-10 2005-12-05 楽曲処理装置
EP05811790.4A EP1816639B1 (en) 2004-12-10 2005-12-05 Musical composition processing device
US11/791,523 US7470853B2 (en) 2004-12-10 2005-12-05 Musical composition processing device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004359151 2004-12-10
JP2004-359151 2004-12-10

Publications (1)

Publication Number Publication Date
WO2006062064A1 true WO2006062064A1 (ja) 2006-06-15

Family

ID=36577891

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/022303 WO2006062064A1 (ja) 2004-12-10 2005-12-05 楽曲処理装置

Country Status (4)

Country Link
US (1) US7470853B2 (ja)
EP (1) EP1816639B1 (ja)
JP (1) JP4698606B2 (ja)
WO (1) WO2006062064A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011069845A (ja) * 2009-09-24 2011-04-07 Nippon Telegr & Teleph Corp <Ntt> 音声検索方法,音声検索装置および音声検索プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100107095A1 (en) * 2008-10-24 2010-04-29 Microsoft Corporation Template-based calculator application
US20120234158A1 (en) * 2011-03-15 2012-09-20 Agency For Science, Technology And Research Auto-synchronous vocal harmonizer
EP2772904B1 (en) * 2013-02-27 2017-03-29 Yamaha Corporation Apparatus and method for detecting music chords and generation of accompaniment.

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01219634A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH05108073A (ja) * 1991-10-16 1993-04-30 Casio Comput Co Ltd スケール判別装置
JPH10105169A (ja) * 1996-09-26 1998-04-24 Yamaha Corp ハーモニーデータ生成装置およびカラオケ装置
JP2004233965A (ja) * 2002-10-24 2004-08-19 National Institute Of Advanced Industrial & Technology 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2939077A1 (de) * 1979-09-27 1981-04-09 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal
US5038658A (en) * 1988-02-29 1991-08-13 Nec Home Electronics Ltd. Method for automatically transcribing music and apparatus therefore
KR970009939B1 (ko) 1988-02-29 1997-06-19 닛뽄 덴기 호움 엘렉트로닉스 가부시기가이샤 자동채보(採譜) 방법 및 그 장치
JP2715816B2 (ja) 1992-06-15 1998-02-18 ヤマハ株式会社 調検出装置および自動編曲装置
US5753843A (en) * 1995-02-06 1998-05-19 Microsoft Corporation System and process for composing musical sections
US6057502A (en) * 1999-03-30 2000-05-02 Yamaha Corporation Apparatus and method for recognizing musical chords
DE10109648C2 (de) * 2001-02-28 2003-01-30 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
AU2002346116A1 (en) * 2001-07-20 2003-03-03 Gracenote, Inc. Automatic identification of sound recordings
KR100836574B1 (ko) 2002-10-24 2008-06-10 도꾸리쯔교세이호진 상교기쥬쯔 소고겡뀨죠 악곡재생방법, 장치 및 음악음향데이터 중의 대표 모티프구간 검출방법
EP1615204B1 (en) * 2004-07-09 2007-10-24 Sony Deutschland GmbH Method for classifying music

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01219634A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH05108073A (ja) * 1991-10-16 1993-04-30 Casio Comput Co Ltd スケール判別装置
JPH10105169A (ja) * 1996-09-26 1998-04-24 Yamaha Corp ハーモニーデータ生成装置およびカラオケ装置
JP2004233965A (ja) * 2002-10-24 2004-08-19 National Institute Of Advanced Industrial & Technology 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011069845A (ja) * 2009-09-24 2011-04-07 Nippon Telegr & Teleph Corp <Ntt> 音声検索方法,音声検索装置および音声検索プログラム

Also Published As

Publication number Publication date
US7470853B2 (en) 2008-12-30
JP4698606B2 (ja) 2011-06-08
US20080011148A1 (en) 2008-01-17
JPWO2006062064A1 (ja) 2008-06-12
EP1816639A1 (en) 2007-08-08
EP1816639A4 (en) 2012-08-29
EP1816639B1 (en) 2013-09-25

Similar Documents

Publication Publication Date Title
JP4672613B2 (ja) テンポ検出装置及びテンポ検出用コンピュータプログラム
WO2007010637A1 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP2008537180A (ja) 音楽作曲装置の運用方法
WO2017058387A1 (en) Automatic composer
KR101361056B1 (ko) 가라오케 호스트 장치 및 프로그램
JPWO2009104269A1 (ja) 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体
US20190355338A1 (en) Automatic performance device and automatic performance method
JP4698606B2 (ja) 楽曲処理装置
JP3996565B2 (ja) カラオケ装置
JP2009282464A (ja) コード検出装置およびコード検出プログラム
JP6288197B2 (ja) 評価装置及びプログラム
JP6102076B2 (ja) 評価装置
JP2007156187A (ja) 楽曲処理装置
JP3599686B2 (ja) カラオケ歌唱時に声域の限界ピッチを検出するカラオケ装置
JP2019101148A (ja) 通信カラオケシステム
JPH11237890A (ja) 歌唱採点機能付きカラオケ装置における歌唱採点方法
JP4180548B2 (ja) 声域告知機能付きカラオケ装置
JP6604307B2 (ja) コード検出装置、コード検出プログラムおよびコード検出方法
JP5585320B2 (ja) 歌唱音声評価装置
JP2623955B2 (ja) 電子楽器
JP7176114B2 (ja) 楽曲解析装置、プログラムおよび楽曲解析方法
JP4760348B2 (ja) 楽曲選択装置および楽曲選択用コンピュータプログラム
JP6315469B2 (ja) カラオケ装置
JP6728847B2 (ja) 自動伴奏装置、自動伴奏プログラムおよび出力伴奏データ生成方法
KR100444930B1 (ko) 음떨림 및 음감오류에 기인하는 오인식을 줄이기 위한 미디노트 도출방법 및 그 장치

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KN KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006546679

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11791523

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2005811790

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWP Wipo information: published in national office

Ref document number: 2005811790

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 11791523

Country of ref document: US