WO2004088630A1 - Method of reading music and computer-readable recording medium having music-reading program recorded therein - Google Patents
Method of reading music and computer-readable recording medium having music-reading program recorded therein Download PDFInfo
- Publication number
- WO2004088630A1 WO2004088630A1 PCT/JP1998/002806 JP9802806W WO2004088630A1 WO 2004088630 A1 WO2004088630 A1 WO 2004088630A1 JP 9802806 W JP9802806 W JP 9802806W WO 2004088630 A1 WO2004088630 A1 WO 2004088630A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- drum
- note
- stem
- score
- notehead
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10G—REPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
- G10G1/00—Means for the representation of music
Definitions
- a combination of a score reading method and a score reading program A readable recording medium.
- the present invention relates to a score reading method for reading drum scores among scores, and a computer-readable recording medium storing a program for reading scores.
- the staff should be recognized. After recognizing the paragraphs as shown in Fig. 29, the staff should be erased and various methods could be used. ),
- the notehead of a note such as the white ball w shown in FIG. 4 (b), the suffix t following the notehead shown in FIG. ) Recognizes the flag f and others that follow the suffix.
- the notation of the drum set which is the notation of the drum set, is not fixed due to historical factors of musical instruments and factors in performance.
- the user is also required to specify the notation type. You will need accurate knowledge.
- the present invention has been made in view of the above-mentioned problems of the prior art, and a first object of the present invention is to recognize notation of a drum notation described in various notations and to perform data with a small number of operations. It does not provide a configuration that can be converted to a format.
- a second object of the present invention is to provide a configuration that enables recognition of drum notes in a drum score different from a normal score and that can convert the data into a playable and / or displayable data format. It is. Disclosure of the invention
- the configuration of the invention according to claim 1 includes a symbol recognition step of recognizing all symbols of a musical score including a note, and an estimation of a drum notation in a drum part of the musical score based on information obtained in the step.
- the configuration of the recording medium according to claim 9 provides a score reading program for executing these functions as a computer-readable recording medium.
- a symbol recognition function for recognizing and recognizing all symbols in a score including notes, a notation estimation function for estimating a drum notation in a drum part of a score based on information obtained by the function,
- An instrument assignment function for assigning an actual sounding instrument to a recognized drum part symbol according to the drum notation estimated by the function;
- a score reading program for executing a data conversion function of converting to a displayable score data format is provided as a configuration recorded on the recording medium.
- drum sound drum instrument
- the drum notation is once estimated based on the information, and then the drum sound is assigned, and the performance and / or display can be performed. It is decided to convert to data format.
- the symbols in the drum part of the score recognized by the symbol recognition step (function) include a note head of a drum note, a stem, a flag relating to a flag, a drum note, and a drum score.
- the relation between the symbol related to the drum note and the drum note is also detected.
- accurate reading cannot be made until the score of the drum part has been read until all the symbols on the score have been recognized.Therefore, at least these symbols must be read before estimation. It is necessary to accurately recognize the relationship between recognition and symbols.
- drum notation estimation In this case, in addition to the accurate recognition of these symbols and their relations, the recognition of the position of the staff of the dram note is also an important judgment factor, as described later.
- the drum notation is estimated by the notation estimating step (function)
- a hi-hat open symbol for a note a hi-hat close symbol for a drum note, an accent symbol for a drum note, a suffix of a drum note, a flag attached to a drum note, a character string for specifying the drum sound of a note, the drum Determined by the flag of the note.
- the pitch is determined based on these information including another pitch determined by the type of notehead given the presence of the length of the other drum note determined by the flag.
- drum note head is a hollow diamond type ( ⁇ )
- ⁇ does it refer to a half note or whole note, or to a specific cymbal instrument? May not be immediately determined.
- the drum note head is of the (X) type, although the judgment cannot be made immediately.
- the flag indicates a note length such as an eighth note or a sixteenth note (drum note flag). Length determined by the notehead, the notehead does not refer to a half note or whole note, but to a particular drum instrument, and may also determine the duration of other drum notes ( The other note lengths determined by the flag determine the different note lengths depending on the notehead type.)
- estimation of the drum notation is performed based on information such as the above-mentioned symbols.
- the notehead is between the third staff members, and black balls and other types are detected. If it is, a black ball notehead is a snare drum, (R) or a notehead other than a black ball is a rim shot, and the notehead is between the third staff and the black ball If only note heads are detected, and if a character string representing a rim shot is detected, all black ball heads are rim shots, and other black ball heads are snares. Drum. Snare drum and rim shots will both be shown with noteheads located between the third of the staff.
- the snare dram is usually indicated by a notehead with a black dot, and the rim shot may be a separate notehead such as (R), or the rim shot may be specified as a character string with the black dot. Therefore, the above estimation holds.
- pedal hi-hat is written as a notehead (X) between the lower first. In some cases, it may be shifted downward to avoid the force drum. In consideration of the possibility of misrecognition, as described above, notes other than black balls below the first line are pedal hi-hats.
- a command for drum instruments other than cymbals can be obtained.
- the notehead is a black ball and the black ball is detected in the range indicated as a bass drum or tom, excluding the third interval, a sound with a bottom row If it is below the pitch, it is used as a bass drum, and the rest is assigned to toms of multiple pitches. If the bottom row is higher than a certain pitch, all are assigned to toms of multiple pitches.
- bass drums and toms are indicated by black dots
- bass drums are indicated by the first interval
- toms are indicated by 1 to 4 pitches from the second to fifth lines excluding the third line.
- the pitch of the bass drum changes the tom range, so the first step detects the pitch where the black ball exists, including the bass drum pitch. Specifically, as described above, the black ball is detected in the range between the first line and the fifth line below the staff except for the third line, and the black ball is detected.
- the drum note indicating the lowest pitch of the pitch where the black ball exists is the bass drum, and the pitch one level higher than it is The drum note that indicates the Low tom, the drum note that indicates the top row of the pitch is the High pitch, and the pitch between the Low tom and the High pitch except for the third interval. Let the drum note be the Mid tom. If the notehead is a black ball and the black ball is detected in the range of the second and fifth lines of the staff excluding the third interval, the drum note indicating the lowest pitch is a low tom, The drum note that indicates the top pitch is the high tom, and the drum note that indicates the pitch between the low to high and the high pitch other than the third interval is the mid tom.
- drum note head other than the black ball should be at the staff position of the fourth space or higher.
- Drum note heads are divided into cases according to one staff position and two staff positions, and the above cases are subdivided according to the type of drum note head, and the duration determined by the flag of the drum note.
- the above-mentioned case division is further subdivided in accordance with another note length determined by the notehead type due to the presence of the duration of the other drum note obtained by the flag, and a conversion table in accordance with these case divisions
- the type of drum note head, the hi-hat open symbol for the drum note, the hi-hat close symbol for the drum note, and the accent for the drum note The type of cymbal-based drum instrument to be estimated is specified in the conversion table in accordance with the character string for designating the drum sound of symbols and notes, and the drum notation is estimated based on the conversion table. Do.
- Drum notes related to cymbal-type drum instruments are indicated by drum heads other than black balls at staff positions in the fourth and higher spaces. Even in this case, there are two cases: one is indicated by one pitch (drum note head has one staff position), and the other is indicated by two pitches (drum note head has two staff positions). Exists.
- drum note heads For example, half notes and whole notes are likely to be crash cymbals due to the characteristics of musical instruments. Noteheads ( ⁇ ) have a high probability of being written as half-notes or whole notes in the history of drum staves. When whole notes are present, half notes are likely to be written with the same notehead as whole notes. Cymbal-type drum notes are not likely to be represented by three or more pitches. When two pitches are used, the lower row is the hi-hat, the upper row is the crash cymbal, and the top cymbal.
- the note head of the top cymbal is represented by (X) and the crash cymbal is written in any other way (such as changing the note head). Furthermore, if there is only one kind of sympano (other than hi-hat cymbals), it is a crash cymbal. Those with a note head ( ⁇ ) are indicated as hi-hat open, and the hi-hat without the sign (°) [or with the sign ( + )] is hi-hat closed.
- the note length is determined by the flag of the drum note, the other note length determined by the length of the other drum note determined by the flag, and another note length determined by the notehead type.
- the head may turn out to be different from the initially estimated cymbal instrument.
- a notehead ( ⁇ ) exists, and before estimation, the notehead ( ⁇ ) is treated as a whole note, and a notehead ( ⁇ ) with a stem is treated as a half note. If there is an eighth note or a sixteenth note with a stem and a flag on ( ⁇ ), then the notehead ( ⁇ ) with a stem is actually a quarter note, and therefore a notehead.
- a note with ( ⁇ ) may be recognized as a top cymbal.
- the drum staff has one staff position and two
- the above case is further divided according to the type of drum note, and the above-mentioned eighth note and sixteenth note for the note length ( ⁇ ) determined by the flag of the drum note. Etc.], and the other note lengths determined by the flag (the above eighth note, 16th note, etc.) have different note lengths [note head ( ⁇ ), etc.].
- the above cases are further subdivided according to the quarter note with a suffix at the notehead ( ⁇ ), and a conversion table is created according to these cases, and the drum notehead Depending on the line position, the type of drum note head, the hi-hat open symbol for drum notes, the hi-hat close symbol for drum notes, the accent symbol for drum notes, and the character string for specifying the drum sound of notes, Converts the estimated cymbal-type drum instrument type Keep identified in Bull. Then, the drum notation is estimated based on the conversion table.
- the actual pronunciation instrument is assigned to the symbol of the recognized drum part in accordance with the drum notation estimated by the notation estimation step (function). If the value of the conversion table specifies a half note for a drum note recognized as, these drum notes are converted to half notes. This is because the notation changes the note length of each drum note head.
- the configuration of claim 17 is a musical score for reading an image of a musical score, recognizing the musical symbol, and performing and converting the musical symbol into a displayable musical score format.
- the reading method use the stem information to erase the bits at the stem.
- erasing refers to erasing the bit plane of the image, which is distinguished from erasing, which erases the data itself on the recognition result storage data.
- note heads of drum staves are written with thin lines such as (X) and ( ⁇ ) for notes other than black and white balls, and there are various other types as well. It cannot be detected by the thick / fine separation method or ellipse detection method that is usually used for musical note recognition. Therefore, as in the case of ordinary symbol recognition, the separated and extracted labels are used as a dictionary. Recognition is performed by matching. However, because of stems, it is not possible to separate note heads as a single label. In addition, since there are consecutive hooks and chords, it is impossible to create a dictionary that includes stems because the pattern becomes enormous.
- the label of the note head is once separated, and the separated label is matched with the dictionary so that it can be recognized in the same way as ordinary symbol recognition.
- the scanhead candidates separated from the noteheads are scanned, and the drum noteheads are recognized with the labels around the notehead candidates as matching targets. Is performed.
- the above configuration is the same for a computer-readable recording medium that stores the score reading program according to claim 27.
- the configuration includes a label separation function for separating note head labels using stem information.
- the configuration includes a matching judgment function for judging the success or failure of the matching between the separation label and the dictionary. If the matching fails, the scan function is continued to scan for stem candidates, and then a label combining function for combining the detected notehead label and the separation label is executed. It further has a program, and after the label combination, causes the recognition function to perform the matching between the combined label and the dictionary again.
- the above-described configuration is the same for a computer-readable recording medium that stores the score reading program of claim 29, and the configuration includes the notehead label itself detected and used for the combining process next.
- the dictionary is matched by the recognition function, and if the matching result has a higher priority, the recognition result is given priority.
- label combining is repeatedly performed, and priorities are given to the respective recognition results recognized and matched during the combining, and the recognition results are determined in descending order of priority.
- the shape may be the same as another notehead before it becomes a recognition rectangle that includes all the noteheads that should be recognized, so if matching is performed, priority should be given to the recognition results . If the recognition result has a low priority, the ID and rectangle are saved, and the next label scan is performed. If an ID with a higher priority is not found, this is given priority. If the recognition target label formed during label combination is recognized by a different ID from the intended one, put it in the dictionary as reject travel, and if it is recognized, it will be recognized as recognition failure. You can also.
- the above configuration is the same for a computer-readable recording medium that records the score reading program according to claim 30, and the configuration is such that the note head recognition and the labenole combination are repeatedly performed.
- the above-described configuration is the same for a computer-readable recording medium that stores the score reading program of claim 31.
- the program further includes a program for executing a tie erasing function for erasing a touched tie. After the erasing, the label separating function performs label separation, and the recognition function recognizes a notehead with which the tie is in contact.
- the above configuration is the same for a computer readable recording medium that records the score reading program of claim 32.
- the configuration is such that the combined noteheads whose noteheads are in contact with each other up and down are registered in the dictionary.
- the recognition function matches the dictionary and the combined notehead to recognize the combined notehead.
- tremolo symbols as shown in Fig. 4 can be recognized by matching the dictionary while combining labels around stem candidates.
- the above configuration is the same for a computer-readable recording medium storing the musical score reading program according to claim 33.
- the configuration is such that tremolo symbols are registered in a dictionary, and the tremolo symbol is registered by the recognition function.
- the program further has a program for executing a symbol erasing function for erasing the bits of the tremolo symbol. After the erasure, another drum note displayed including the tremolo mouth symbol is recognized. did.
- note heads are rarely attached to both sides of the stem.
- Recognition of notes is done by combining noteheads and stemheads, in which the first notehead at the end of the stem is combined and then the middle notehead.
- the ball may be attached to the left and right of the stem.
- the head ball has a fixed position in the X direction (horizontal direction) (for example, if the stem is upward, the first note head is attached only to the left of the stem). Therefore, when combining the first ball, the positional relationship between the stem and the notehead in the X direction is limited to the left and right.
- the end of the stem is determined by the midpoint CC in the Y direction (vertical direction) of the stem, as shown in Fig. 6. Determined by the positional relationship of the Y coordinate of the head center CY.
- whether or not the ball is the first ball is determined by the distance between the end ST of the suffix candidate and the center CY of the notehead, or the relationship between the upper and lower ends of the notehead ellipse. .
- the stem when viewed in the X direction, the stem may be at the center of the notehead, so even in the case of the first ball, as shown in Fig. 7 (a) and (b) , Left and right are not limited (both can be combined).
- the flag on the side with the stem of the notehead is checked after combining the stemheads to prevent the overlapping of stems, but in the case of drum noteheads, the actual Check the fixed direction regardless of the position of the stem and the center of the notehead in the X direction (if the stem is upward, check the right side). Note that this check flag is stored as indicating the attribute of the data in the stored data on the notehead side in order to prevent overlapping of the stems when combining the notehead with the stem candidates.
- each notehead is provided with a flag for specifying the position of the link with the stem candidate depending on whether the stem candidate to be combined is upward or downward.
- the stems specified by the flag are not allowed to be combined at positions other than the combining position.
- the note on the right side of the figure deletes the downward note (instead of erasing the bit plane of the image as in the case of erasing, the recognition result).
- the above configuration is the same for a computer-readable recording medium that stores the score reading program according to claim 34.
- the configuration includes a note head that separates stems by the combining function and upper and lower note heads.
- a down note deletion function for deleting notes with down stems, which is executed after recognizing by the recognition function a drum note having a reverse stalk that shares the note head by performing the combination with the stem candidates. It has an execution program with a stem combining function for combining upper and lower stems, and the combined one is used as a stem candidate to be combined with the remaining noteheads by the combining function.
- the hi-hat closed (+) symbol shown in Fig. 11 and the tuplet number are mistaken for a notehead, and when this is combined as a notehead at the beginning of a stem, the stem direction is completely reversed. It will be recognized as a different note.
- these symbols ⁇ Tuplet numbers may be registered in the dictionary as reject travel, but the stem direction of drum staves is different from that of normal music, and it can be limited to some extent. Is above the staff and the lower stem is not below the staff, In other words, when the upper stem is above the fifth line and the lower stem is above the first line, the stem is effective as a countermeasure against false recognition of upward and open hats (°)].
- the above configuration is the same for a computer-readable recording medium storing the score reading program according to claim 35, wherein the upper end of the stem is above the staff and the lower end of the stem. If the stem is not below the staff, the stem is upward, and if the bottom of the stem is below the staff and the upper stem is not above the staff, the stem is downward.
- the program further includes a program for executing a stem direction determination function for determining that the first notehead and the stem candidate are combined by the combining function after the determination is performed.
- the leading note head of these drum notes is combined with a candidate for a stem to form a drum note having a note head that separates a stem.
- the stem is turned up and the other drum notes are raised if the upper stem is above the staff and the lower stem is not below the staff. If the lower end of the stem is below the staff and the upper end of the stem is not above the staff, it is determined that the stem is downward, and the candidate for stem is combined with the remaining note heads. For those that do not meet the condition of, after returning to the original stem candidates (normalization processing for stem direction), The stem candidates are combined with the remaining note heads.
- the above configuration is a combination recording a score reading program according to claim 36.
- the configuration is such that when recognizing a drum note including a note having a note head that divides a suffix, the first note head of the drum note is combined with the first note head of the drum note by the combining function.
- the above-mentioned downward note is used after recognizing a drum note of the opposite stem that shares the note head by the recognition function.
- the delete function deletes notes with lower stems, and combines the upper and lower stems with the stem combination function as a candidate for stems.
- the stem direction determination function allows the stem to be directed upward when the upper stem is above the staff and the lower stem is not below the staff.
- the lower stem is If the stem is below the line and the upper end of the stem is not above the staff, it is determined that the stem is downward, and in addition to combining the candidate stem with the remaining noteheads by the combining function, Those which do not meet these conditions further have a program for executing a note candidate return function for returning to the original stem candidate. The remaining noteheads are to be combined.
- FIG. 1 is an explanatory diagram showing a state of a notehead label separation process of a drum note
- FIG. 2 is an explanatory diagram showing a state where a notehead is divided into a plurality of portions by a stem erasing process
- FIG. Fig. 4 is an explanatory diagram showing an example of a musical score including notes with their heads touching up and down
- Fig. 4 is an explanatory diagram showing an example of a musical score including a tremolo symbol
- Fig. 5 is an explanatory diagram showing an example of an image for a tremolo symbol dictionary.
- FIG. 6 is an explanatory view showing a positional relationship determination method in the case of combining noteheads and stems
- FIG. 6 is an explanatory view showing a positional relationship determination method in the case of combining noteheads and stems
- FIG. 6 is an explanatory view showing a positional relationship determination method in the case of combining noteheads and stems
- FIG. 6 is an explanatory
- FIG. 7 is an explanatory view showing the state of connecting noteheads and stems in a drum staff
- FIG. Fig. 9 is an explanatory diagram showing the check state of the flag at the time of combining the head and stem
- Fig. 9 is an explanatory diagram showing an example in which the stem is separated by the head
- Fig. 10 is Explanatory diagram showing an example of the note recognition process for note heads to be divided
- Fig. 11 shows an example of a musical score including hi-hat closed and tuplet numeral symbols
- FIG. 12 is an explanatory diagram showing an example of a configuration in which a downward stem is connected to a common note head
- FIG. 13 is a computer-readable recording recording a score reading program according to the present invention.
- FIG. 14 is a block diagram showing the main processing of the CPU
- FIG. 15 is an explanatory diagram showing the notehead to be recognized
- FIG. 16 is a diagram showing the result of recognition.
- Fig. 17 is an explanatory diagram showing the method of specifying the note for writing the recognition result when there is a specific symbol in Fig. 17.
- Fig. 17 is an explanatory diagram showing a standard drum notation pattern.
- FIG. 19 is an explanatory diagram showing an example in which a notehead to be integrated into one notehead type crosses a staff
- FIG. 21 is an explanatory diagram showing an example in which a notehead to be integrated into one notehead type intersects a stem
- Fig. 21 is an explanatory diagram showing the form of a label to be recognized in the case of the intersection.
- Fig. 2 is a flowchart showing details of the matching process including label combining process
- Fig. 23 is the same
- FIG. 24 is a flowchart showing details of the matching process including the label combining process.
- FIG. 24 is a flowchart showing details of the matching process also including the label combining process.
- FIG. 25 is an actual flowchart of the matching process including the label combining process.
- FIG. 26 is a flowchart showing a flow of the rectangle matching process
- FIG. 26 is a flowchart showing a flow of the rectangle matching process
- FIG. 27 is an explanatory diagram showing a tie recognition process for a notehead label in contact with a tie
- Fig. 29 is an explanatory diagram of the paragraph on the score
- Fig. 30 is the black ball and white ball head of the note to be recognized. It is explanatory drawing which shows a suffix and a flag.
- FIG. 13 shows a computer-readable recording medium storing a musical score reading program according to the present invention, which is read and operated by an external storage device (or a CD-ROM drive or the like) such as a flexible disk drive FDD 5 described later.
- FIG. 1 is a block diagram showing the configuration of an embodiment of a musical score reading device. This device is obtained by adding a scanner and a MIDI interface circuit to the configuration of an electronic computer such as a personal computer.
- the CPU 1 is a central processing unit that controls the entire score reading apparatus based on a program stored in ROM 2 or RAM 3. In addition, the CPU 1 Built-in timer circuit for interrupt.
- the RAM 3 is used as an image data buffer, a work area, and the like in addition to the program area.
- the hard disk drive HDD4 and the flexible disk drive FDD5 store programs, image data, performance data, and the like.
- the CRT 6 displays video information output from the CRT interface circuit 7 based on the control of the CPU 1, and the information input from the keyboard 8 is input to the CPU 1 via the keyboard interface circuit 9. It is.
- the printer 10 prints the print information output from the printer interface circuit 11 under the control of the CPU 1.
- the scanner 12 optically scans (printed) music, for example, and converts it into binary, grayscale, or color image data.
- the scanner 12 can be any type such as a flatbed type, a handy type, or a feeder type. Types of scanners can be used.
- the image information read by the scanner 12 is taken into the RAM 3 or the HDD 4 via the scanner interface circuit 13.
- the MDI interface circuit 14 is a circuit that transmits and receives MIDI data to and from an external MIDI device such as a sound source module.
- the bus 15 connects each circuit in the musical score reader and exchanges various data, programs, addresses, and the like.
- a pointing device such as a mouse or a serial interface circuit such as RS232C may be provided.
- FIG. 14 is a flowchart showing the main processing of the CPU 1.
- step S 1 the image of the musical score is loaded into the RAM 3 by the scanner 12. Images are captured as binary image data.
- step S2 image quality smoothing processing such as graphic fusion is performed to reduce blurring and dot noise.
- step S3 an image quality check process, which will be described later, is performed to obtain resolution and density information and to obtain reference data for staff detection in a later stage. In the music score recognition process, if the resolution and density are out of the predetermined range, the recognition rate will be reduced. Therefore, in step S3, it is checked whether or not these values are within the predetermined range. Is locked. In step S4, it is determined whether or not the check result in step S3 is image quality OK.
- step S5 Perform staff recognition.
- a staff scanning start position detection process and a staff shift amount detection process are performed.
- a paragraph recognition process is performed. This process is roughly divided into paragraph recognition and bracket recognition.
- the recognition result of the paragraph is displayed, and the user is checked whether or not the paragraph recognition result is correct, and it is determined whether or not it is OK.
- step S8 the paragraph recognition result is corrected. If the staff recognition fails, subsequent processing cannot be performed, so it is necessary to change the resolution and density and import the image again. Therefore, in step S7, the staff recognition result is displayed first, and the user is judged whether or not the staff is correct. If the line is correctly recognized, the paragraph recognition result may be displayed and checked.
- step S9 the user selects a drum part of each paragraph.
- step S1 ⁇ the normal part performs normal music score recognition, and the drum part performs drum score recognition.
- the drum part in one song is scanned twice (twice noraping) in Steps Sll to 13 so that the drum notation is Estimate and assign instruments according to the notation.
- This configuration does not include a modified interface for the drum notation estimation result. This is because if the recognition result is wrong, the recognized score symbol can be corrected.
- step S14 the assigned musical instrument is converted into a playable musical score data format in which the pitch and pitch are specified.
- step S9 the user performs the drum part setting at the same time as checking the paragraph recognition or correcting the paragraph recognition result. This is done by displaying the results of the recognized staff and paragraphs and having the staff check the drum staves.
- the part information of the data that saves the paragraph recognition results Set a flag to determine if
- the recognition unit classifies normal music score recognition and drum score recognition, and in step S10, performs symbol recognition on the drum score.
- the differences between normal score recognition and drum score recognition are as follows.
- Drum notation recognition skips the recognition of symbols that do not exist in the drum notation. (However, in order to take measures against misconfiguration, misrecognition, spelling mistakes, etc., recognition itself is performed and only output may be limited.)
- drum notation recognition we add the unique symbol 'unique string recognition to the drum notation, while removing the recognition of unnecessary strings in the drum notation. Also, recognition of drumheads other than black and white balls is added.
- the probability of appearance of symbols on drum staves ⁇ Change the threshold value corresponding to the appearance form (for example, since the appearance probability of slurs is low, it is possible to speed up by making the threshold value stricter during recognition, etc.) Change the threshold for recognition of normal notes (the number of black ball chords is small, the appearance rate of white ball is small, etc.) Therefore, the threshold value of black ball should be strict, or in some cases, white ball should not be recognized. In this configuration, white balls are not recognized.)
- the recognition of the drum head is performed as follows. Black dots, which are the same as normal scores, in the note head of a drum score, are separated by thick and thin separation processing performed by erasing staff lines and the like, and ellipse detection processing for recognizing black dots is performed in the same way as normal scores. Do. In this configuration, as described above, recognition is not performed because the probability of occurrence of white balls in a drum score is low. On the other hand, note heads of drum staves other than these are drawn with thin lines such as (x, O), and there are various other types. It cannot be detected by the ellipse detection processing.
- the detected labels (rectangles of an appropriate size to recognize the target symbol) must be matched with the dictionary, just like normal symbols (for example, rests).
- Performed by Recognition of other noteheads is realized by separating the labels with the stems (provisioned as stems) and matching the dictionary with the labels around the stems.
- the recognition of the drum head will be described in detail in a section of a seventh embodiment described later.
- the noteheads to be recognized are as shown in Fig. 15. There are other drum note heads, but if this level is supported, general drum staves can be almost supported. It is also possible to change the type of notehead to be recognized depending on where the notehead is on the staff (pitch).
- note recognition exists only in the third period, and such a recognition is not performed in this configuration.
- noteheads other than black ball (white ball) the recognized notehead type is left in the symbol storage data. That is, the note head type is written in the storage area dru mN ote in the recognition symbol storage data.
- the drum notation is estimated in the next steps SI1 to S12.
- data is created in the form of a standard drum notation pattern in order to estimate the corresponding notation by the operation of fitting, display the recognition result, and perform.
- the above fit is achieved by scanning the drum part in one song twice.
- a flag representing the actual instrument is further written in drumNote.
- data is created in the format of drum standard pattern.
- drum notation There are many different notations for drum notation. Some of the notations are very special, but they are infrequent and not included. The most problematic in drum notation is the notation of sympa noles (such as hihattoshinbanore, crash-simpanore, top-symbanolle). Other musical instruments have a slightly different pitch. However, the number of pitches (pitch number) changes (in the case of two, three, or four). Cymbal notation is roughly divided into two types. In other words, there is a case where one pitch is expressed and another case where the hi-hat and the rest are divided into two (or more) pitches. In each type, the type of musical instrument can be divided into two types: one with a different notehead type, and the other with or without an accent.
- sympa noles such as hihattoshinbanore, crash-simpanore, top-symbanolle.
- Other musical instruments have a slightly different pitch. However, the number of pitches (pitch number) changes (in the case
- additional noteheads are used to represent half notes and whole notes.
- the type of instrument may be specified by a character string.
- the instrument may be specified by a character string at the beginning of the song, the area may be divided by a character string, or the character string may be specified for all notes. In some cases.
- the score reading apparatus of this configuration has a drum score standard pattern for displaying the recognized result and performing as shown in FIG.
- Supported instruments are crash cymbal (sometimes called side cymbal), top cymbal (sometimes called ride cymbal), hi-hat open, hi-hat close, snare drum, rim shot, high tom, mid tom, Low toms, bass drums and pedal no-hats.
- crash cymbal sometimes called side cymbal
- top cymbal sometimes called ride cymbal
- hi-hat open hi-hat close
- snare drum rim shot
- high tom mid tom
- bass drums Low toms
- pedal no-hats The result of symbol recognition must be applied to this standard pattern.
- instruments other than the standard patterns are supported (cowbells, chimes, gongs, etc.). It is necessary to take appropriate measures.
- Snare drums and rim shots may appear between the third lines of the staff.
- the snare drum is usually represented by a black ball, and the rim shot may be a separate note head such as (R), or the rim shot may be specified as a character string without changing the black ball. Therefore, in the first loop of S11 of the two scans, the black ball between the third is a snare drum, and the noteheads other than the black ball are rim shots. If there is a notehead other than a black ball, the logical value r i mO t h e r E X i st is set to true.
- a character string representing the rim shot is searched, and if it exists, the logical value rimSt rEXi st is set to true.
- the logical value rimStrExiSt is true and rimOthereExiSt is false, all the notes in the third are rim shots.
- pedal hi-hat is written as a notehead (X) between the lower first.
- X notehead
- Pedal hi-hat can be set in one loop.
- bass drums and toms are indicated by black dots
- bass drums are indicated by the first interval
- toms are indicated by 1 to 4 pitches from the second to fifth lines excluding the third line.
- the bass drum is written in the lower part.
- the tom range changes depending on the pitch of the bass drum, and therefore, the pitch including the pitch of the bass drum is detected in the first loop.
- pitches lower than the lower first interval are deleted as erroneous recognition.
- the pitch at which the black ball exists is two steps, the lowest (minTom) and one step above (minTom2nd), the highest pitch (max Tom) Is detected, and a black ball note with a pitch lower than the lower first interval is deleted.
- the maximum pitch of the tom is usually no more than the fifth line, but in this configuration, the detection range is extended to the second interval in consideration of the possibility of misrecognition and special notation. From this information, the pitch of the bass drum and the pitch of the tom are detected as follows.
- the pitch of the bass drum (height Bass Drum) is set to minTom, and the pitch of the low tom (height Let LoTom) be minTom2nd. Otherwise, the pitch of the bass drum is in the first interval, in this case, if minTom is in the first interval, the low tom pitch is minTom2nd, otherwise, the low tom is Low.
- Tom's pitch is min Tom.
- the pitch of the high tom (height Hi Tom) is max Tom.
- the actual settings (confirmation) of the bass drum and tom are made.
- Cymbal-type drum notes are not likely to be represented by three or more pitches.If they are represented by two pitches, the lower row is a hi-hat, the upper row is a crash cymbal, and the top It is a member. If both the cymbal and top cymbal are written in the upper row, the notehead of the top cymbal is represented by (X), and the crash cymbal is written in other ways (such as changing the notehead). Furthermore, if there is only one type of cymbal (other than the hi-hat cymbal), the crash cymbal whose d- note head is ( ⁇ ) is indicated as hi-hat open, and the symbol (°) is not related. Is associated with the sign ( + ).] A hi-hat is a hi-hat closed.
- the number of noteheads at each pitch was determined, but in the second loop preprocessing of S12, this information table was scanned from the lowest pitch, Find the pitch of the cymbal.
- the first pitch found is the first pitch
- the second one found is the second pitch
- so on if the number of notes at the first pitch is extremely small, there is a high possibility that a note is erroneously recognized. Therefore, the note may be deleted and the cymbal pitch detection result may be shifted. This process is especially effective when the pitch of the cymbal is three or more steps.
- the conversion table can write the type of instrument assigned when the note was in that state, for the two pitches, for the elements classified according to the type of note head and the relation of accent etc. So that
- CT—PEKE—NU N not involved with notehead (X)
- CT—PEKE—CLS [( + ) is concerned with notehead (X)]
- DN HH CLOSE Rose half note of a crash cymbal
- Notations are classified according to the number of pitches of the detected cymbals, and instruments are assigned to the conversion table according to each type. The classification is, for example, as shown in Table 1 below.
- hi-hat is normally closed, and if (°) is involved, hi-hat is open.
- the notehead (X) is the top cymbal.
- the whole note is a whole note of the crash cymbal
- a note with the same notehead as the whole note is a half note of the crash cymbal
- a note head different from the whole note (the other) is a crash cymbal. If a whole note is present and the same notehead as the whole note does not exist except for the whole note, or if there is no whole note, the notehead ( ⁇ ) will crash the notehead ( ⁇ ) if there is a cymbal cymbal. The other is a cymbal cymbal quarter note, and if there is no notehead ( ⁇ ), the smaller number is a cymbal cymbal quarter note and the other is a crash cymbal quarter note.
- the notehead ( ⁇ ) is a crash cymba-nore quarter note and the other is a crash cymba-nore quarter note.
- the character string of the force cymbal is "ridecym”, “sidecym”, “t.cno”, “ c. c. ", etc., the strings are similar to each other, and the risk of misidentification is high. Therefore, it is not possible to dictionary all the strings written on the drum notation and reflect all the recognition results. Therefore, it is reasonable to limit the dictionary of character strings to only those with a low probability of misrecognition and limit the effect of the character strings.
- step S14 the musical score data format that can be played and / or displayed based on the pitches and durations of the notes of the drum notation that are evident from the musical score recognition described above. Convert to
- a character string is used to support notation that changes the timbre (drum instrument) in the middle of a song.
- timbre drum instrument
- snare drum and rim shots changes to snare drum and rim shots
- crash sympanole and top cymbals changes to noise notes and top sympa.
- snare drum / rim shot
- other cases cymbals
- a snare drum a classic cymbal, a hi-hat cymbal, and the like are added to the character string to be recognized in addition to the rimshot and the top cymbal in order to realize the reflection of the character string in a time series.
- a means to recognize the range specification such as parentheses attached to the character string is added.
- the hot spot that becomes the reference for time series sorting performed later is the starting point (left end) of the parentheses.
- the parenthesized range specification is recognized by distinguishing between the case where there is a terminal as shown in Fig. 18 (a) and the case where there is no terminal as shown in Fig. 18 (b).
- a character string with a terminator another symbol data with an ID for terminating the character string with the right end of the parenthesis as a hot spot is added so that it can be used as a reference for time-series scanning. It also recognizes terminal brackets as shown in Fig. 18 (c), in case that the end of the range specification by the parentheses of the character string is described separately.
- the reference hot spot for chronological ordering is the right end of the parentheses. Furthermore, in the case of a character string without a range, the hot spot may be shifted slightly forward (left) in chronological order because the note may be shifted backward (right) from the note.
- the process of changing the tone of the snare drum rim shot is performed as follows. First, the recognition result is scanned from the top in time series. The initial value of the tone storage data snare Or Rim is DN—SNA RE. If there is a third black ball, write the value of snare Orim to dru mN ote. A string representing a snare drum or If there is a character string representing the rim shot, write DN-SNARE or DN-RIM in snare Or Rim. When the terminal ID is detected, the value is rewritten to a value opposite to the current snare_or_Rim. Then, when there is a repeated bar line end or the like, snare Or Rim may be changed.
- the process of changing the tone color of a cymbal is performed as follows. For top cymbals, crash cymbals, and hi-hats, there are cases where the clash cymbal and top cymbal are exchanged with a character string, and where the hi-hat cymbal and top cymbal are exchanged. At the same time, you must determine which instrument to change.
- the following processing is performed after the step of assigning instruments to the conversion table according to each type (for example, type 23 shown in Table 1 above) at the time of notation estimation (see the description following Table 1). Execute (however, do not process the character string representing the top cymbal). The result of this processing is referred to as “first estimation result”.
- the exchange method perform another time-series scan and change the instrument in the same way as for the snare drum and rim shot.
- the hi-hat cymbal and the top cymbal the one that was regarded as the hi-hat cymbal in the first estimation result is exchanged for the top cymbal.
- the crash cymbal determined in the first estimation result is exchanged for a top cymbal.
- drum part By letting the user specify whether or not a drum part exists, it is useless when there is no drum notation, such as recognition of the character string to the left of the staff and recognition of the drum head in normal music. Processing and risk of misrecognition It can be avoided. Also if it is specified that the drum part is present, it is also possible to simply specify the lowermost part of the paragraph and drum notation.
- the assignment of the crash cymbal and the top cymbal varies depending on the tempo of the song.
- the tone of the song is often quiet, and in such a case, it is common to use a top cymbal in a situation where a crash cymbal is normally used and to perform a soft accent. is there.
- this is rarely specified in character strings. Therefore, such a situation is estimated from the tempo.
- the tempo is slower than a certain value and the notation is assigned to the instrument, and there is no top sympanole assigned, the part that would normally be the crash cymbal is the top cymbal.
- the tempo can be determined because the tempo symbol is recognized. (Embodiment 6)
- the black ball which is the same as the normal score, is used for the thick and thin separation processing performed by erasing the staff lines and the like and the black ball portion recognition as in the normal score.
- the recognition is not performed because the detection is performed by the ellipse detection process and the probability of white balls appearing in the drum music is low.
- note heads of drum staves other than black ball 'white ball' are drawn with thin lines such as (X, O), and there are various other types.
- it cannot be detected by the thick / fine separation processing and the ellipse detection processing. Therefore, after removing the stems, the notehead labels (rectangles set to recognize the target symbol) are separated,
- noteheads may be broken into multiple labels due to stem erasure, if matching fails, further scan the stem candidates and continue with the next detected notehead label and the separation label. After performing the join processing with, matching with the dictionary is performed again.
- drum recognition and combining processes there are unique drum recognition and combining processes, which will be described later.
- note heads can also be detected by matching by label separation described above, instead of the ellipse detection processing described above.
- the notehead to be recognized is as shown in FIG. 15 as described above.
- a score image read by the scanner 12 is acquired at one dot and one byte, and one bit is used as a plane (bitSrc) of the original image.
- a thick part exists while scanning around the above vertical thin line (hereinafter referred to as stem candidates), the boundary line of this thick part is detected, coordinates are voted at certain intervals, and the elliptic equation is calculated. If this elliptic equation is valid as a notehead, add it to the ellipse storage data ( ep ).
- the left and right label bits of the stem candidates of the drum note bit plane are erased with a certain width as shown in Fig.1. Then the label of the drum note head can be separated from the stem. However, in some cases, notehead labels may be split into multiple labels, as shown in Figure 2. Therefore, recognition is performed while performing label combining as described later.
- bit-planes Detect labels on bit-planes (bitDrm) as they scan around the tails.
- the detected label rectangle is spread slightly to the left and right, and the plane (bitSrc) in this rectangle is targeted for dictionary matching.
- Spreading the rectangle slightly to the left and right is a process to reduce stem noise. That is, since the distance between the detected label and the stem is short, if the rectangle is left as it is, some of the stems may or may not enter the recognition target, and the matching with the dictionary will be greatly changed.
- the rectangle is expanded so that stems are included in the recognition target. The reason why the target bit plane is set to bitSrc instead of bitDrm is to prevent the state of staff elimination from affecting matching.
- bitSrc in the rectangle (label) is matched with the dictionary. Any matching method may be used.
- IDs are prepared for one notehead type by the combination of noteheads, stems, and staves.
- ID integration processing is performed. That is, as shown in Fig. 19 and Fig. 20, when the notehead intersects with the staff and intersects with the stem, these are combined and more than one ID is assigned to one notehead type. Be prepared.
- the recognition target label (label matching the dictionary) is as shown in Fig. 21.
- These patterns may be used as one ID from the beginning, but then the number of registration patterns for one ID becomes enormous. Therefore, as described above, if the classification is made based on the intersection with the staff and the intersection with the suffix, the number of patterns per ID is reduced, and it becomes easier to organize the dictionary.
- Whether or not matching is to be performed is determined based on the size of the rectangle. For example, a rectangle whose height is clearly smaller than the notehead does not need to be matched, so the process proceeds to the label combining process described later. If the width is wide, a tie may be connected to the notehead, so the tie elimination process described later is performed. If this process fails and the rectangle remains large, the matching fails from the beginning and the label binding process is reset.
- Matches the note head dictionary with the label If no match is found (ID—MA TCHINGNONE), label scanning is continued, then the label is detected and combined, and re-recognition (matching the dictionary again) is performed. . However, matching is performed once with the second label itself used for the combination, and if the priority of the ID of the matching result is the highest, this is prioritized. It also resets the maximum size (d x t) of label merging and resets label merging (to enable label merging), and also sets the vertical distance (dy t) at which new merging starts. Furthermore, if the priority of the ID of the recognition result is the highest, the rectangle combining is terminated at that point, and the rectangle and distance are initialized to perform a new rectangle combining (the above two reset processings are performed). Do).
- priorities are given to recognition results because the shape may be the same as another notehead before it becomes a recognition rectangle that includes all the noteheads that should be originally recognized. If the recognition result has a low priority, the ID and rectangle are saved and the next label scan is performed. If no higher priority ID is found, this is given priority.
- the recognition target label created during label combining is recognized by a different ID from the intended one, put it in the dictionary as reciprocal travel, and if the recognition result becomes this, recognize it as recognition failure. You can also. There are special cases where the matching result is special, such as a combination of a notehead and a tremolo symbol that represents a combination of noteheads. If these are recognized, processing is performed accordingly, as described later. When matching with the dictionary is completed, data is added to the notehead data (ep). 4 Stem couplingRecognition
- the combining process with the stem candidate is performed.
- special processing may be required for drum note heads. This will be described later.
- noteheads other than black ball white ball
- the recognized notehead type is left in the symbol storage data. That is, the note head type is written in the storage area dRumNote in the recognition symbol storage data.
- FIGS. 22 to 24 Details of the matching process including the label combining process are shown in flowcharts in FIGS. 22 to 24.
- the process shown in the figure is to search for bit D rm while scanning around the vertical line of a stem candidate with a certain width dw, and if found, apply a painting function to it and apply a rectangle (rect Cur: (Enclosing rectangle) is detected. While judging the size of the rectangle, as shown in Fig. 25 (a) and (b), matching is performed only with rect Curr, and depending on the result, the rectangle is merged with the previous rectangle, and the merged rectangle (rec tMr g : Rectangle that connects labels).
- step S21 the value of default is entered into the coordinates of rec tMr g and rect Cur, and the coordinates of the rectangle are initialized, and the stored notehead ID is also initialized.
- step S22 the y value of the highest point of the stem is put into yBef.
- step S23 y is looped from the top to the bottom of the stem candidates.
- step S24 it is determined whether or not each coordinate of recMrg is a default value, and if it is the default value, the process jumps to step S29 described later. If this value is not the default value, go to step S25. If there is some distance where there is no dot at that time, it must be reset for the next scan.
- step S25 it is determined whether or not the absolute value of the difference between the value of the point y under investigation and the value of the uppermost point of the stem has exceeded the value of dyt.
- the process jumps to step 29, but if it does, it is determined in step S26 whether or not the stored notehead ID is in the initial state. If it is in the initial state, the process proceeds to step S28 described later. On the other hand, if not in the initial state, in step S27, notehead data is created using the saved notehead ID and the rectangle. In step S28, a default value is set for each coordinate of rec tM rg, and the stored note ID is also initialized.
- Step S29 the periphery of the vertical line of the stem and tail is scanned with a certain width dw.
- step S30 it is determined whether or not the bit bit Drm exists at the coordinates (x, y). If not, the process jumps to step S48, which will be described later, and ends the X-direction scanning loop.
- step S30 if the same bit exists, the painting function is applied to this bit in step S31 to detect a second label (rectangle) (rect Cur).
- step S32 it is determined whether the found second label rectangle is larger than the maximum size (dxt) of the label combination, and if it is determined to be larger, tie elimination processing described later is performed in step S33.
- step S34 it is determined whether or not the tie elimination process has succeeded. If the tie elimination process has failed, the process jumps to step S42, and the bottom y coordinate of rect Curr is set to yB ef. If it is determined in S34 that the tie elimination process has been successful, and if it is determined in S32 that the found second label rectangle is smaller than the above dXt, in step S35, the second label rectangle is determined. It is determined whether or not the label is large enough for matching.
- step S48 If the label is small, the process jumps to step S48 to be described later and ends the X-direction scanning loop. If it is determined in S35 that the size is sufficient, then in step S36, matching is first performed once only with the second label (rectCur). In step S37, it is determined whether or not the priority of the ID is the maximum. If it is determined that the priority is the maximum, the process jumps to step S42, where the bottom y coordinate of rect Cur is set to yB ef, and In S46, notehead data is created. If it is determined in S37 that the priority is not the maximum, it is determined in step S38 whether or not the coordinates of the label rec tMrg to be combined match the default value. If not, step S39 is performed.
- step S40 the combining process of the first label and the second label is performed, and if they match, the combining process is not performed in step S40, and the shape as it is is set as a merge rectangle (rec tMr g).
- step S41 the bottom y coordinate of the above rec tMr g is set to the above y B ef.
- step S43 it is determined whether or not rec tMr g is large enough for matching. If it is determined that rec tMr g is not sufficient, the process jumps to step S48 to be described later and ends the loop of the X-direction running. I do.
- step S44 matching with the dictionary of rec tMr g is performed.
- step S45 it is determined whether or not the priority of the ID is the maximum. If it is determined that the priority of the ID is the maximum, the step The process jumps to S46 to create notehead data using the saved notehead ID and the rectangle. If the priority is not the highest, the process jumps to step S48 to terminate the X-direction scanning loop.
- step S47 a process of setting a default value to each coordinate of rec tMr g (end of label combination) is performed, and a stored note ID is initialized.
- step S45 If it is determined in S45 that the priority is not the highest, and if the label combination end processing is performed in S47, the rape of the X-direction scanning is ended in step S48. Further, in step S49, the loop of scanning in the y direction is ended. Thereafter, in step S50, it is determined whether or not the remaining stored notehead ID is in the initial state, and if it is in the initial state, the process ends. If it is not the initial state, notehead data is created in step S51.
- FIG. 26 shows the flow of the rectangular matching process in steps S36 and S44 in FIG.
- step S52 matching with the dictionary is performed, and the processing result is input to the ID.
- step S53 it is determined whether or not the matching has succeeded. If it is determined that the matching has failed (ID—MATCH I NGNONE), the process ends. If it is determined in S53 that no matching failure has occurred, it is determined in step S54 whether or not the matching result is reject travel, and if it is determined that reject travel, the process ends. If it is determined in step S54 that it is not a reject travel, then in step S55, it is determined whether or not the matching result is a combining notehead.
- step S56 If it is determined that the matching result is a combining notehead, in step S56, Note ID and rectangle are saved. On the other hand, if it is determined in S55 that the character is not a head, then in step S57, it is determined whether or not the matching result is a tremolo mouth symbol. If it is determined that the symbol is a tremolo symbol, in step S58, The tremolo thick portion is erased. On the other hand, if it is determined in S57 that the symbol is not a tremolo symbol, the notehead ID and the rectangle are stored in step S59. After finishing the processing of S56, S58 and S59, the entire processing is finished.
- the run length will be longer than a certain length dyt 2 (the part of the tie in contact with the notehead will have a run length longer than dyt 2) or the second and subsequent runs (while scanning the run) The run that is found separately in the vertical direction) is used as a tie, and up to that point is erased.
- the tremolo symbol as shown in Fig. 4 can also be recognized. Especially in the case of drum music, there are relatively many tremolo symbols. Since the tremolo symbol has almost the same thickness and spacing as the hook, if no countermeasures are taken, the flag will be counted in the same way as the hook, and it will be mistaken for a short note such as a 32nd note. Resulting in. Therefore, the tremolo symbol is registered in the dictionary as shown in Fig. 5. However, in this configuration, the symbol pasting interface does not support tremolo symbols. If a match is found (see step S57 in Fig. 26), the thick part is erased (see step S58 in Fig. 26) to take measures against flag count failure when detecting consecutive hooks. (6) Note-stem combining process
- noteheads other than black balls may have a stem at the center of the notehead, as shown in Fig. 2.
- note heads are rarely attached to both sides of the stem.
- the first notehead of the upward stem or the downward stem is combined, and then the middle notehead is combined.
- this is not a black ball or a white ball either the center of the ellipse or the stem coordination flag is checked according to the positional relationship between the center of the ellipse and the X coordinate of the stem, and the head of the stem is checked.
- the notehead of it is determined that the combination is impossible based on the positional relationship in the X direction.
- the stem length in the state before concatenation becomes short, so the shortest length of the stem length combined with the notehead is The value must be kept low.
- the note with the downward stem on the right side of Fig. 10 (b) is deleted, and the stem candidates are changed to those combining the upper and lower stems as shown in Fig. 10 (c). Yes (right side of the figure).
- note-stem concatenation is also performed on black balls, the stem candidates combined in the above process and black balls are connected. '
- the hi-hat closed (+) symbol shown in Fig. 11 ⁇ The tuplet number is mistaken for a note head, and when this is combined as the head of a stem, the stem direction is completely different. It will be recognized as a note. As a countermeasure, these symbols and tuplet numbers may be registered in the dictionary as rigid travel. However, since the stem direction of drum staves is different from that of regular music, it can be limited to some extent. Is above the fifth line and the lower end of the stem is above the first line, the stem is also effective as a countermeasure against false recognition of hat-open (°)], and the lower end of the stem is above the first line. When the lower stem and the upper end of the stem are below the fifth line, it is determined that the stem is downward, and the first note head is combined with the candidate stem.
- the leading note head of these drum notes and a stem candidate are combined, and a drum note having a note head that divides a stem is recognized.
- the remaining first noteheads are used.
- the stem is upward, the lower stem is below the first line and If the upper end of the stem is below the fifth line, the stem is determined to be downward, and the candidate stem is combined with the rest of the stems.
- the candidate is combined with the remaining note heads. It is set to be.
- noteheads of drum staves other than the black ball and the white ball with low appearance probability (no recognition) are drawn with thin lines such as (X, ⁇ ), and there are various other types.
- these cannot be detected by the thick and thin separation processing and the ellipse detection processing as in the case of black ball detection. This is done by matching the detected label around the tail candidate with the dictionary.
- noteheads may be split into multiple labels due to stem erasure, so if matching fails, further scanning of stems candidates is continued and the next detected notehead label and the separated label After performing the join processing of, matching with the dictionary is performed again.
- each process is performed as described above.
- drum notation is recognized while estimating the notation of the drum notation described in various notations, a complicated It is possible to convert to a data format that can be played with few operations without using an interface and without burdening the user. Also, users who do not have knowledge of drum scores can use them.
- the configuration of the computer-readable recording medium that records the score reading method and the score reading program according to the present invention is useful when reading a score, especially a drum score, mechanically. It is suitable for creating data for karaoke performances from musical scores, or for performing part of a machine performance instead of human performance in studio recording or live performance.
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
A method of reading a music comprising the step of recognizing all signs of a music including musical notes, the step of estimating the drum notation in a drum part of the music based on the data obtained in the above step, the step of assigning a practical sounding instrument to the sign of the recognized drum part according to the drum notation estimated in the above step, and the step of converting the data into the form of music data that can be played and/or displayed. This makes it possible to recognize the notation of the drum music described by various notations and to convert the recognized data into a form that can be played with a minimum amount of operation.
Description
楽譜読み取り方法及び楽譜読み取りプログラムを記録したコンビ. タ読み取り 可能な記録媒体 明 A combination of a score reading method and a score reading program. A readable recording medium.
技術分野 Technical field
田 Rice field
本発明は、 楽譜のうち、 特にドラム譜の読み取りを可能にする楽譜読み取り方 法及び楽譜読み取りを行うプログラムを記緑したコンピュータ読み取り可能な記 録媒体に関する。 · The present invention relates to a score reading method for reading drum scores among scores, and a computer-readable recording medium storing a program for reading scores. ·
背景技術 Background art
通常楽譜を機械的に認識させる場合は、 五線認識、 第 2 9図に示されるような 段落の認識の後、 五線を消去して、 種々の方法を使いながら、 第 3 0図(a )に示 される黒玉 bや同図(b )に示される白玉 wなどの音符の符頭、 同図(c )に示され る該符頭に連続する符尾 t、 更に同図(d )に示される該符尾に連続する旗 f 、 そ の他を認識している。 If the score is to be recognized mechanically, the staff should be recognized. After recognizing the paragraphs as shown in Fig. 29, the staff should be erased and various methods could be used. ), The notehead of a note such as the white ball w shown in FIG. 4 (b), the suffix t following the notehead shown in FIG. ) Recognizes the flag f and others that follow the suffix.
これに対し、 ドラムセットの楽譜表記であるドラム譜は、 楽器の歴史的要因や、 演奏上の要因から、 楽譜表記が固定していない。 On the other hand, the notation of the drum set, which is the notation of the drum set, is not fixed due to historical factors of musical instruments and factors in performance.
最も一般的な表記法というものも存在しないので、 ある特定の表記の認識だけ を対象にするのであれば、 ドラム譜認識の汎用性がなくなってしまう。 The most common notation does not exist, so if you only want to recognize a particular notation, you lose the versatility of drum notation recognition.
他方、 様々な表記法を認識対象にする場合、 表記された記号を表記通りに認識 するだけでは、 その音符をどのドラム楽器 (ドラム音) で演奏するかを特定する ことができず、 そのままではドラム譜を演奏することはできなかった。 On the other hand, if various notations are to be recognized, simply recognizing the notation as written cannot identify which drum instrument (drum sound) the musical note is to be played on. I couldn't play the drum score.
また、 このように特定の表記法にとらわれずにドラム譜を認識させようとする 場合、 その認識結果を正しく演奏させるためには、 その記号 (音符を含む) が実
際にどのようなドラム音 (ドラム楽器) であるかを指定しなければならない。 こ のような指定をユーザに行わせることも可能であるが、 その場合、 ユーザがドラ ム譜の表記法について熟知している必要がある。 更にその指定のために、 複雑な インターフェースを使用すると共に、 その指定操作も複雑になり、 膨大な修正ェ 数も必要となって、 トータルの修正コストが増加する結果となる。 Also, when trying to recognize drum staves without being bound by a particular notation as described above, in order to play the recognition result correctly, the symbols (including notes) are actually used. When doing so, you have to specify what kind of drum sound (drum instrument) it is. It is possible for the user to make such a designation, but in that case, the user must be familiar with the notation of the drum score. In addition, a complicated interface is used for the specification, and the specification operation is also complicated, a large number of corrections are required, and the total correction cost is increased.
加えてドラム譜認識前に表記タイプの指定を行い、 この指定された表記タイプ に基づいて認識を行なって、 認識後の修正を不要にすることができるとしても、 同様にユーザ側に表記法の正確な知識を要求することになる。 In addition, even if the notation type is specified before recognizing the drum notation and recognition is performed based on the specified notation type, and correction after recognition is unnecessary, the user is also required to specify the notation type. You will need accurate knowledge.
以上のような問題が、 従来からある楽譜認識技術において、 ドラム譜への対応 を阻害していた。 These problems have hindered conventional music score recognition technology from supporting drum scores.
一方、 ドラム譜に表示される符頭のうち、 通常の楽譜と同じ黒玉 · 白玉以外の 音符は、 (χ )、 (◊)など、 細線で書かれており、 この他にも色々なタイプが存在 する。 そのため、 通常楽譜の音符認識に用いられている、 太細分離 (特開平 9一 9 7 0 6 0号参照、 画像データから細い線を構成する部分を分離しそれから細い 線を構成される記号を検出し、 残りの画像から太い記号を検出して、 楽譜上に現 れる記号の認識を行う方式) 、 楕円検出 (楕円式を用いて通常の音符の符頭に使 用される黒玉や白玉を認識する方式) で検出することができない。 On the other hand, among the note heads displayed on the drum score, the notes other than the black and white balls, which are the same as in the normal score, are written in thin lines such as (χ) and (◊). Exists. For this reason, bold and fine separation (refer to Japanese Patent Application Laid-Open No. Hei 9-97060), which is usually used for musical note recognition, separates the parts that make up thin lines from image data, Detects and detects thick symbols from the rest of the image, and recognizes symbols that appear on the score.) Ellipse detection (black and white balls used for note heads of ordinary notes using elliptical expressions) Can not be detected.
この他、 符頭へのタイ結合や、 2つ以上の符頭が縦方向で接触した和音など、 従来方式では解決できない問題が存在する。 また符尾に対して符頭が結合してい る位置が楽譜によって違っていることや、 符尾の途中に符頭があって、 符尾を分 断するタイプの音符があるなど、 通常の楽譜にはない問題がある。 In addition, there are other problems that cannot be solved by the conventional method, such as tie-joining to noteheads and chords in which two or more noteheads touch vertically. Ordinary scores, such as the position where noteheads are joined to stems depending on the score, or noteheads in the middle of stems that break the stems. There is no problem.
本発明は従来技術の上記問題に鑑み創案されたもので、 本願構成の第 1の目的 は、 様々な表記法で記述されたドラム譜の表記法を認識し、 少ない操作で演奏可 能なデータ形式に変換することができる構成を提供せんとするものである。 また本願構成の第 2の目的は、 通常楽譜とは異なるドラム譜におけるドラム音 符の認識を可能にし、 演奏及び/又は表示可能なデータ形式に変換することがで きる構成を提供せんとするものである。
発明の開示 The present invention has been made in view of the above-mentioned problems of the prior art, and a first object of the present invention is to recognize notation of a drum notation described in various notations and to perform data with a small number of operations. It does not provide a configuration that can be converted to a format. A second object of the present invention is to provide a configuration that enables recognition of drum notes in a drum score different from a normal score and that can convert the data into a playable and / or displayable data format. It is. Disclosure of the invention
そのため請求の範囲 1に係る発明の構成は、 音符を含む楽譜の全ての記号を認 識する記号認識工程と、 該工程によって得られた情報に基づいて楽譜のドラムパ ートにおけるドラム表記法の推定を行う表記法推定工程と、 該工程により推定さ れたドラム表記法に従って、 認識されたドラムパー卜の記号に実際の発音楽器を 割り当てる楽器割り当て工程と、 演奏及び Z又は表示可能な楽譜データ形式に変 換するデータ変換工程とを有することを特徴としている。 また請求の範囲 9の記 録媒体の構成は、 これらの機能を実行させるための楽譜読み取りプログラムを記 緑したコンピュータ読み取り可能な記録媒体として提供するものである。 すなわ ち、 音符を含む楽譜の全ての記号を認、識する記号認識機能と、 該機能によって得 られた情報に基づいて楽譜のドラムパートにおけるドラム表記法の推定を行う表 記法推定機能と、 該機能により推定されたドラム表記法に従って、 認識されたド ラムパートの記号に実際の発音楽器を割り当てる楽器割り当て機能と、 演奏及び Therefore, the configuration of the invention according to claim 1 includes a symbol recognition step of recognizing all symbols of a musical score including a note, and an estimation of a drum notation in a drum part of the musical score based on information obtained in the step. A musical notation estimating step of performing the following, a musical instrument assigning step of assigning an actual sounding musical instrument to the recognized symbol of the drum part in accordance with the drum notation estimated in the step, and a performance and Z or a displayable musical score data format. And a data conversion step for conversion. The configuration of the recording medium according to claim 9 provides a score reading program for executing these functions as a computer-readable recording medium. That is, a symbol recognition function for recognizing and recognizing all symbols in a score including notes, a notation estimation function for estimating a drum notation in a drum part of a score based on information obtained by the function, An instrument assignment function for assigning an actual sounding instrument to a recognized drum part symbol according to the drum notation estimated by the function;
/又は表示可能な楽譜データ形式に変換するデータ変換機能とを実行させるため の楽譜読み取りプログラムが、 その記録媒体に記録されている構成として提供さ れる。 A score reading program for executing a data conversion function of converting to a displayable score data format is provided as a configuration recorded on the recording medium.
上記ドラム譜の認識を行わせる場合、 楽譜上の記号認識から一義的にドラム音 (ドラム楽器) の割り当てを行わせることができない。 そのため、 本発明の構成 は、 楽譜の全ての記号認識を行わせた後、 それらの情報を基に一旦ドラム表記法 を推定させてから、 ドラム音の割り当てを行い、 演奏及び/又は表示可能なデー タ形式に変換させることにしている。 When recognizing the drum score, it is not possible to uniquely assign the drum sound (drum instrument) from the recognition of the symbol on the score. Therefore, according to the configuration of the present invention, after performing all the symbol recognition of the score, the drum notation is once estimated based on the information, and then the drum sound is assigned, and the performance and / or display can be performed. It is decided to convert to data format.
前記楽譜読み取り方法 (記録媒体) において、 前記記号認識工程 (機能) によ り認識される楽譜のドラムパートにおける記号として、 ドラム音符の符頭 ·符尾 •旗、 ドラム音符に係る記号、 ドラム譜に特徴的な文字列を含み、 前記ドラム音 符に係る記号の認識に当たっては、 ドラム音符に係る記号と該ドラム音符との係 りも一緒に検出するようにする。 上述のように、 ドラムパートの楽譜読み取りは、 一旦楽譜上の全記号の認識を終了した段階でなければ、 正確な推定はできないの であるから、 推定を行う前に、 少なくとも、 これらの記号の認識と記号の係り具 合について、 正確に認識しておく必要がある。 もちろんドラム表記法の推定を行
う場合、 これらの記号及びその係りの正確な認識以外に、 後述するように、 ドラ ム符頭の五線位置の認識も、 重要な判断要素となる。 In the score reading method (recording medium), the symbols in the drum part of the score recognized by the symbol recognition step (function) include a note head of a drum note, a stem, a flag relating to a flag, a drum note, and a drum score. In recognizing the symbol related to the drum note, the relation between the symbol related to the drum note and the drum note is also detected. As described above, accurate reading cannot be made until the score of the drum part has been read until all the symbols on the score have been recognized.Therefore, at least these symbols must be read before estimation. It is necessary to accurately recognize the relationship between recognition and symbols. Of course, drum notation estimation In this case, in addition to the accurate recognition of these symbols and their relations, the recognition of the position of the staff of the dram note is also an important judgment factor, as described later.
また前記表記法推定工程 (機能) により ドラム表記法の推定を行う場合に、 記 号認識工程 (機能) によって得られた、 少なくとも、 ドラム符頭の五線位置、 ド ラム符頭の種類、 ドラム音符に係るハイハットオープンの記号、 ドラム音符に係 るハイハットクローズの記号、 ドラム音符に係るアクセント記号、 ドラム音符の 符尾、 ドラム音符に付く旗、 音符のドラム音指定のための文字列、 前記ドラム音 符の旗により定まる.音長、 該旗により求められた他のドラム音符の音長があるこ とで符頭種類により定まる別の音長を含むこれらの情報に基づいて行うことにな る。 When the drum notation is estimated by the notation estimating step (function), at least the position of the staff of the drum head, the type of drum head, and the drum obtained by the symbol recognition step (function). A hi-hat open symbol for a note, a hi-hat close symbol for a drum note, an accent symbol for a drum note, a suffix of a drum note, a flag attached to a drum note, a character string for specifying the drum sound of a note, the drum Determined by the flag of the note. The pitch is determined based on these information including another pitch determined by the type of notehead given the presence of the length of the other drum note determined by the flag.
これは、 まずシンバル系のドラム楽器及びそれ以外のドラム楽器は、 その種類 の違いによって、 五線の表示位置 (音高) が変わり (但し楽器によってはその位 置が一義的に定まっていないものもある) 、 更にドラム符頭も異なるものが使用 される (但し同じものが使用されることもある。 中にはドラム符頭も、 五線の位 置も同じになるものもある) 。 従ってドラム符頭が五線のどの位置にあるかによ つて、 ドラム楽器の推定の範囲が狭まり、 且つドラム符頭の種類によりある程度 その推定の妥当性も高まる。 This is because the display position (pitch) of the staff changes depending on the type of cymbal-type drum instrument and other drum instruments. (However, the position of some instruments is not fixed. There is also a different drum note head (although the same one may be used, some of which have the same drum note head and staff position). Therefore, depending on the position of the drum notehead on the staff, the range of estimation of the drum instrument is narrowed, and the validity of the estimation is increased to some extent depending on the type of drum notehead.
し力 し、. シンバル系では、 ドラム符頭が中抜きダイヤ型 (◊) の場合、 それが 2分音符 ·全音符を指すものなのか、 或いはある特定めシンバル系の楽器を指す ものなのかが直ぐには判断できな 、場合がある。 同様に判断が直ぐにできないも のに、 ドラム符頭が (X ) 型の場合がある。 In the cymbal system, if the drum note head is a hollow diamond type (◊), does it refer to a half note or whole note, or to a specific cymbal instrument? May not be immediately determined. Similarly, there are cases where the drum note head is of the (X) type, although the judgment cannot be made immediately.
これらの場合、 ドラム音符に係るハイハットオープンの記号 ( ° ) があれば、 それは必ずハイハットであり、 該記号が付いているドラム音符の符頭は、 ハイハ ッ トである可能性がある。 しかし同じ符頭でも該記号が付いていない場合は、 ノヽ ィハツトクローズを指す場合の他、 クラッシュシンバルやトップシンバルを示し ていることもある。 In these cases, if there is a hi-hat open symbol (°) related to a drum note, it is always a hi-hat, and the note head of the drum note with the symbol may be a hi-hat. However, even if the same notehead does not have this symbol, it may indicate a crash cymbal or a top cymbal, as well as a note hat close.
ドラム音符に係るアクセント記号( > ) ( Λ )があれば、 一般的にはその音符に アクセントを付けることを意味するが、 クラッシュシンバルを指していることも ある。 この場合は楽譜に使用されているアクセント記号付きの符頭の種類及ぴ符
頭の五線位置からある程度判断できる。 If accents according to note drum (>) (Λ), generally it will be understood to imply the accented on the note, sometimes pointing crash cymbal. In this case, the type of notehead with accents and the It can be judged to some extent from the staff position of the head.
このような場合に、 音符のドラム音指定のための文字列がそれについていれば、 該文字列が優先され、 そこから他の記号が推定されることもある。 In such a case, if a character string for designating the drum sound of a note is attached to the character string, the character string takes precedence, and other symbols may be estimated therefrom.
更に前述のダイヤ型符頭に、 符尾及ぴその符尾に付く旗がある場合、 該旗は 8 分音符や 1 6分音符等の音長を指していることが分かる (ドラム音符の旗により 定まる音長) 。 その場合、 その符頭のものは 2分音符や全音符を指すものではな く、 特定のドラム楽器を示すものであり、 それによつて、 また他のドラム音符の 音長も求まることもある (旗により求められた他のドラム音符の音長があること で符頭種類により別の音長が定まる) 。 Furthermore, if the above-mentioned diamond-shaped notehead has a stem and a flag attached to the stem, it is understood that the flag indicates a note length such as an eighth note or a sixteenth note (drum note flag). Length determined by In that case, the notehead does not refer to a half note or whole note, but to a particular drum instrument, and may also determine the duration of other drum notes ( The other note lengths determined by the flag determine the different note lengths depending on the notehead type.)
従ってドラム表記法の推定に当たっては、 上記した記号などの情報に基づいて 行うことになる。 Therefore, estimation of the drum notation is performed based on information such as the above-mentioned symbols.
上記表記法推定工程 (機能) により、 シンバル系以外のドラム楽器に関するド ラム表記法の実際の推定を行う場合、 符頭が五線の第 3間にあり且つ黒玉とそれ 以外の種類が検出されるのであれば、 黒玉の符頭のものをスネアドラム、 (R)又 は黒玉以外の符頭のものをリムショットとし、 符頭が五線の第 3間にあり且つ黒 玉の符頭のもののみが検出され、 更にリムショットを表現する文字列が検出され るのであれば、 黒玉の符頭のものを全てリムショットとし、 それ以外の黒玉の符 頭のものをスネアドラムとする。 スネアドラム及びリムショットは、 共に五線の 第 3間に符頭が位置するように示されることになる。 その場合でも、 スネアドラ ムは通常黒玉の符頭のもので示され、 リムショットは (R) 等の別符頭の場合や、 黒玉のまま文字列でリムショットを指定する場合もある。 従って、 以上のような 推定が成り立つ。 When the actual notation of drum notation for drum instruments other than cymbals is estimated by the above notation estimation process (function), the notehead is between the third staff members, and black balls and other types are detected. If it is, a black ball notehead is a snare drum, (R) or a notehead other than a black ball is a rim shot, and the notehead is between the third staff and the black ball If only note heads are detected, and if a character string representing a rim shot is detected, all black ball heads are rim shots, and other black ball heads are snares. Drum. Snare drum and rim shots will both be shown with noteheads located between the third of the staff. Even in such a case, the snare dram is usually indicated by a notehead with a black dot, and the rim shot may be a separate notehead such as (R), or the rim shot may be specified as a character string with the black dot. Therefore, the above estimation holds.
上記表記法推定工程 (機能) により、 シンバル系以外のドラム楽器に関するド ラム表記法の実際の推定を行う場合に、 符頭が五線の第 1線以下にあり且つ黒玉 以外であれば、 該ドラム音符をペダルハイハツトとする。 When performing the actual estimation of drum notation for drum instruments other than cymbals by the above notation estimation step (function), if the notehead is below the first line of the staff and is not a black ball, The drum note is used as a pedal hi-hat.
通常ペダルハイハットは、 下第 1間に符頭 (X ) として表記される。 し力 しバ スドラムを避けて下側にずらす場合もある。 誤認識の可能性も考慮して、 上記の ように、 第 1線以下の黒玉以外の音符はペダルハイハツトとした。 Normally the pedal hi-hat is written as a notehead (X) between the lower first. In some cases, it may be shifted downward to avoid the force drum. In consideration of the possibility of misrecognition, as described above, notes other than black balls below the first line are pedal hi-hats.
前記表記法推定工程 (機能) により、 シンバル系以外のドラム楽器に関するド
ラム表記法の実際の推定を行う場合に、 符頭が黒玉で、 且つ第 3間を除くバスド ラム、 タムとして表記される範囲に該黒玉が検出された場合に、 最下段がある音 高以下であればそれをバスドラムとし、 残りを複数の音高のタムに割り当て、 最 下段がある音高より高レ、場合は、 全てを複数の音高のタムに割り当てる。 According to the notation estimation step (function), a command for drum instruments other than cymbals can be obtained. When performing the actual estimation of the ram notation, if the notehead is a black ball and the black ball is detected in the range indicated as a bass drum or tom, excluding the third interval, a sound with a bottom row If it is below the pitch, it is used as a bass drum, and the rest is assigned to toms of multiple pitches. If the bottom row is higher than a certain pitch, all are assigned to toms of multiple pitches.
通常バスドラム、 タムは黒玉で表記され、 バスドラムは第 1間、 タムは第 2線 から第 5線の第 3線を除く 1一 4音高に表記される。 しかしバスドラムが下第 1 間に表記されるような表記法も存在する。 このような場合、 L o wタムが第 1間 (即ち通常のバスドラムと同一の音高) に表記される可能性が高い。 このように バスドラムの音高により、 タムの音域が変化するので、 最初の工程でバスドラム の音高を含めて黒玉の存在する音高を検出する。 具体的には、 上述のように、 符 頭が黒玉で、 且つ第 3間を除く五線の下第 1間と第 5線の範囲に該黒玉が検出さ れ、 該黒玉の最下段が下第 1間と第 1間の範囲に存在するのであれば、 黒玉の存 在する音高の最下段の音高を示すドラム音符をバスドラム、 それより 1段上の音 高を示すドラム音符を L o wタム、 最上段の音高を示すドラム音符を H i g hタ ム、 更に第 3間以外で L o wタムの音高と H i g hタムの音高の間にある音高を 示すドラム音符を M i dタムとする。 また符頭が黒玉で、 且つ第 3間を除く五線 の第 2線と第 5線の範囲に該黒玉が検出された場合、 最下段の音高を示すドラム 音符を L o wタム、 最上段の音高を示すドラム音符を H i g hタム、 更に第 3間 以外で L o wタムの音高と H i g hタムの音高の間にある音高を示すドラム音符 を M i dタムとする。 Normally, bass drums and toms are indicated by black dots, bass drums are indicated by the first interval, and toms are indicated by 1 to 4 pitches from the second to fifth lines excluding the third line. However, there is also a notation in which the bass drum is written in the lower part. In such a case, there is a high possibility that the Low tom is written in the first interval (that is, the same pitch as a normal bass drum). In this way, the pitch of the bass drum changes the tom range, so the first step detects the pitch where the black ball exists, including the bass drum pitch. Specifically, as described above, the black ball is detected in the range between the first line and the fifth line below the staff except for the third line, and the black ball is detected. If the lower row is between the lower first interval and the first interval, the drum note indicating the lowest pitch of the pitch where the black ball exists is the bass drum, and the pitch one level higher than it is The drum note that indicates the Low tom, the drum note that indicates the top row of the pitch is the High pitch, and the pitch between the Low tom and the High pitch except for the third interval. Let the drum note be the Mid tom. If the notehead is a black ball and the black ball is detected in the range of the second and fifth lines of the staff excluding the third interval, the drum note indicating the lowest pitch is a low tom, The drum note that indicates the top pitch is the high tom, and the drum note that indicates the pitch between the low to high and the high pitch other than the third interval is the mid tom.
前記表記法推定工程 (機能) により、 シンバル系のドラム楽器に関するドラム 表記法の推定を行う場合に、 黒玉以外のドラム符頭が第 4間以上の五線位置にあ ることを条件として、 ドラム符頭の五線位置が 1つの場合と 2つの場合、とに応じ て場合分けし、 またドラム符頭の種類に応じて上記場合分けを細分化し、 更にド ラム音符の旗により定まる音長、 該旗により求められた他のドラム音符の音長が あることで符頭種類により定まる別の音長に応じて上記場合分けをより細分化し ておくと共に、 これらの場合分けに応じて変換テーブルを作成しておき、 ドラム 符頭の五線位置、 ドラム符頭の種類、 ドラム音符に係るハイハットオープンの記 号、 ドラム音符に係るハイハットクローズの記号、 ドラム音符に係るアクセント
記号、 音符のドラム音指定のための文字列に応じて、 推定されるシンバル系のド ラム楽器の種類を変換テーブル中に特定しておき、 該変換テーブルに基づいてド ラム表記法の推定を行う。 In the above notation estimation step (function), when estimating the drum notation for a cymbal-based drum instrument, the drum note head other than the black ball should be at the staff position of the fourth space or higher. Drum note heads are divided into cases according to one staff position and two staff positions, and the above cases are subdivided according to the type of drum note head, and the duration determined by the flag of the drum note The above-mentioned case division is further subdivided in accordance with another note length determined by the notehead type due to the presence of the duration of the other drum note obtained by the flag, and a conversion table in accordance with these case divisions To create the drum staff head position, the type of drum note head, the hi-hat open symbol for the drum note, the hi-hat close symbol for the drum note, and the accent for the drum note The type of cymbal-based drum instrument to be estimated is specified in the conversion table in accordance with the character string for designating the drum sound of symbols and notes, and the drum notation is estimated based on the conversion table. Do.
シンバル系のドラム楽器に関するドラム音符は、 第 4間以上の五線位置に黒玉 以外のドラム符頭で表記される。 その場合でも、 1つの音高で示される場合 (ド ラム符頭の五線位置が 1つの場合) と、 2つの音高で示される場合 (ドラム符頭 の五線位置が 2つの場合) とが存在する。 Drum notes related to cymbal-type drum instruments are indicated by drum heads other than black balls at staff positions in the fourth and higher spaces. Even in this case, there are two cases: one is indicated by one pitch (drum note head has one staff position), and the other is indicated by two pitches (drum note head has two staff positions). Exists.
またシンバル系のドラム楽器の種類に応じて、 ドラム符頭を変えて表記される ことが多い。 例えば 2分音符、 全音符は楽器の特性上、 クラッシュシンバルであ る確率が高い。 また符頭 (◊) は、 ドラム譜の歴史上、 2分音符、 全音符として 表記される確率が高い。 全音符が存在した場合、 2分音符は全音符と同じ符頭で 表記される確率が高い。 シンバル系のドラム音符の表記は 3つ以上の音高で示さ れる確率は低く、 2つの音高で示された場合、 下段がハイハット、 上段がクラッ シュシンバル、 トップシンバルである。 また上段にクラッシュシンバルと トップ シンバルの両方が表記されている場合、 トップシンバルの符頭は (X ) で表され、 クラッシュシンバルはそれ以外の表記 (符頭を変えるなど) である。 更にシンパ ノレ (ハイハッ トシンバル以外) が 1種類しかない場合には、 クラッシュシンバル である。 符頭が (〇) のものは、 ハイハツトオープンとして表記され、 記号 ( ° ) が係っていない [或いは記号 ( + ) が係っている] ハイハツトは、 ハイハツ トクローズである。 Also, depending on the type of cymbal-based drum instrument, it is often written with different drum note heads. For example, half notes and whole notes are likely to be crash cymbals due to the characteristics of musical instruments. Noteheads (◊) have a high probability of being written as half-notes or whole notes in the history of drum staves. When whole notes are present, half notes are likely to be written with the same notehead as whole notes. Cymbal-type drum notes are not likely to be represented by three or more pitches. When two pitches are used, the lower row is the hi-hat, the upper row is the crash cymbal, and the top cymbal. If both the top and bottom cymbals are written in the upper row, the note head of the top cymbal is represented by (X) and the crash cymbal is written in any other way (such as changing the note head). Furthermore, if there is only one kind of sympano (other than hi-hat cymbals), it is a crash cymbal. Those with a note head (〇) are indicated as hi-hat open, and the hi-hat without the sign (°) [or with the sign ( + )] is hi-hat closed.
もちろん、 ドラム音符の旗により定まる音長、 該旗により求められた他のドラ ム音符の音長があることで符頭種類により定まる別の音長などによって、 そこに 一緒に表記されている符頭が、 最初推定したシンバル楽器とは違うことが判明す ることもある。 例えば、 符頭 (◊) が存在しており、 推定前に符頭 (◊) を全音 符、 符頭 (◊) に符尾が付いたものを 2分音符として扱っていたが、 符頭 (◊) に符尾及び旗が付いた 8分音符や 1 6分音符が存在した場合、 符頭 (◊) に符尾 が付いたものは実際には 4分音符であり、 それ故、 符頭 (◊) が付く音符はトツ プシンバルであると分かることもある。 Of course, the note length is determined by the flag of the drum note, the other note length determined by the length of the other drum note determined by the flag, and another note length determined by the notehead type. The head may turn out to be different from the initially estimated cymbal instrument. For example, a notehead (◊) exists, and before estimation, the notehead (◊) is treated as a whole note, and a notehead (◊) with a stem is treated as a half note. If there is an eighth note or a sixteenth note with a stem and a flag on (◊), then the notehead (◊) with a stem is actually a quarter note, and therefore a notehead. A note with (◊) may be recognized as a top cymbal.
そのため上述のように、 ドラム符頭の五線位置が 1つの場合と 2つの場合とに
応じて場合分けし、 またドラム符頭の種類に応じて上記場合分けを細分化し、 更 にドラム音符の旗により定まる音長 [符頭 (◊) の場合の前記 8分音符や 1 6分 音符等] 、 該旗により求められた他のドラム音符 (上記 8分音符や 1 6分音符 等) の音長があることで符頭種類 [符頭 (◊) 等] により定まる別の音長 [符頭 (◊) で符尾の付いた 4分音符等] に応じて上記場合分けをより細分化しておく と共に、 これらの場合分けに応じて変換テーブルを作成しておき、 ドラム符頭の 五線位置、 ドラム符頭の種類、 ドラム音符に係るハイハットオープンの記号、 ド ラム音符に係るハイハツトクローズの記号、 ドラム音符に係るアクセント記号、 音符のドラム音指定のための文字列に応じて、 推定されるシンバル系のドラム楽 器の種類を変換テーブル中に特定しておく。 そして、 該変換テーブルに基づいて ドラム表記法の推定を行うこととしたものである。 Therefore, as mentioned above, the drum staff has one staff position and two The above case is further divided according to the type of drum note, and the above-mentioned eighth note and sixteenth note for the note length (頭) determined by the flag of the drum note. Etc.], and the other note lengths determined by the flag (the above eighth note, 16th note, etc.) have different note lengths [note head (◊), etc.]. The above cases are further subdivided according to the quarter note with a suffix at the notehead (◊), and a conversion table is created according to these cases, and the drum notehead Depending on the line position, the type of drum note head, the hi-hat open symbol for drum notes, the hi-hat close symbol for drum notes, the accent symbol for drum notes, and the character string for specifying the drum sound of notes, Converts the estimated cymbal-type drum instrument type Keep identified in Bull. Then, the drum notation is estimated based on the conversion table.
最終工程として、 表記法推定工程 (機能) により推定されたドラム表記法に従 つて、 認識されたドラムパートの記号に実際の発音楽器を割り当てるのであるが、 その際に、 推定前に 4分音符として認識されたドラム音符に対し、 前記変換テー ブルの値が 2分音符を指定している場合は、 これらのドラム音符を 2分音符に変 換する。 これは表記法によって、 各種ドラム符頭がどの音長を示すか変わるから である。 As the final step, the actual pronunciation instrument is assigned to the symbol of the recognized drum part in accordance with the drum notation estimated by the notation estimation step (function). If the value of the conversion table specifies a half note for a drum note recognized as, these drum notes are converted to half notes. This is because the notation changes the note length of each drum note head.
また前記第 2の目的を達成するために、 請求の範囲 1 7の構成は、 楽譜のィメ ージを読み取ってその音楽記号を認識し、 演奏及びノ又は表示可能な楽譜形式に 変換する楽譜読み取り方法において、 符尾情報を用いその符尾のビットを消去 Further, in order to achieve the second object, the configuration of claim 17 is a musical score for reading an image of a musical score, recognizing the musical symbol, and performing and converting the musical symbol into a displayable musical score format. In the reading method, use the stem information to erase the bits at the stem.
(以後消去は、 画像のビットプレーンを消すことを言い、 認識結果保存データ上 のデータそのものを消す削除と区別する) することで符頭のラベルを分離し、 符 尾候補を走査し、 それによつて検出された該符尾候補周辺にある分離ラベルを辞 書とマッチングしてドラム符頭記号の認識を行った後、 認識された符頭と符尾候 補との結合処理を行うことを特徴としている。 (Hereinafter, erasing refers to erasing the bit plane of the image, which is distinguished from erasing, which erases the data itself on the recognition result storage data.) After that, the separated labels around the detected stem candidates are matched with the dictionaries to recognize the drumhead symbols, and then the combining process of the recognized noteheads and candidate stems is performed. And
ドラム譜の符頭は、 黒玉や白玉以外の音符については、 上述のように、 (X )、 (◊)など、 細線で書かれており、 この他にも色々なタイプが存在するので、 通常 楽譜の音符認識に用いられている、 太細分離方式、 楕円検出方式で検出すること ができない。 そのため、 通常の記号認識と同様に、 分離抽出したラベルを辞書と
マッチングすることで認識を行う。 しかし符尾があるため、 符頭だけを 1つのラ ベルとして分離できない。 また連鉤ゃ和音等もあるため、 符尾を含めて辞書化し ようとすると、 パターンが膨大になり不可能である。 そのため本構成では、 符尾 の情報を利用して、 一旦符頭のラベルを分離し、 分離したラベルを辞書とマッチ ングして、 通常の記号認識と同じ方法で認識できるようにしている。 その際、 符 頭から分離された符尾候補を走査して、 符尾候補周辺にあるラベルをマッチング 対象としてドラム符頭の認識を行い、 マッチングの行われた符頭は最終的に符尾 との連結が行われる。 As mentioned above, note heads of drum staves are written with thin lines such as (X) and (◊) for notes other than black and white balls, and there are various other types as well. It cannot be detected by the thick / fine separation method or ellipse detection method that is usually used for musical note recognition. Therefore, as in the case of ordinary symbol recognition, the separated and extracted labels are used as a dictionary. Recognition is performed by matching. However, because of stems, it is not possible to separate note heads as a single label. In addition, since there are consecutive hooks and chords, it is impossible to create a dictionary that includes stems because the pattern becomes enormous. Therefore, in this configuration, using the stem information, the label of the note head is once separated, and the separated label is matched with the dictionary so that it can be recognized in the same way as ordinary symbol recognition. At this time, the scanhead candidates separated from the noteheads are scanned, and the drum noteheads are recognized with the labels around the notehead candidates as matching targets. Is performed.
上記構成は、 請求の範囲 2 7の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 符尾情報 を用いて符頭のラベルを分離するラベル分離機能と、 符尾候捕を走査する走査機 能と、 該走査で検出された該符尾候補周辺にある分離ラベルを辞書とマッチング して符頭の認識を行いドラム符頭を認識する認識機能と、 認識された符頭と符尾 候補とを結合する結合機能とを実行するプログラムを有している。 The above configuration is the same for a computer-readable recording medium that stores the score reading program according to claim 27. The configuration includes a label separation function for separating note head labels using stem information. A scanning function for scanning the stems, and a recognition function for recognizing drumheads by recognizing noteheads by matching the separated labels around the candidate stems detected by the scanning with a dictionary. It has a program for executing a combining function for combining the recognized notehead and the stem candidate.
上記構成において、 分離ラベルと辞書とのマッチングに失敗した場合、 符尾候 補の走査を続けて次に検出された符頭ラベルと前記分離ラベノレとの結合処理を行 つた後、 辞書とのマッチングを再度行うようにすれば良い。 これは、 第 1図に示 すような場合、 符尾を消去しても符頭の認識に問題は生じないが、 第 2図に示す ような場合、 符尾を消去した後、 符頭が複数のラベルに分離してしまうからであ る。 このような場合は、 最初に行われるマッチングが失敗するので、 その後ラベ ル結合を行って、 再度マッチングを行うことで、 符頭の認識が可能になる。 上記構成は、 請求の範囲 2 8の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 分離ラベ ルと辞書とのマツチングの成否を判定するマツチング判定機能と、 該マツチング に失敗した場合、 前記走査機能により符尾候補の走査を続けさせて、 次に検出さ れた符頭ラベルと前記分離ラベルとの結合処理を行うラベル結合機能とを実行す るプログラムを更に有し、 ラベル結合後、 前記認識機能に対し、 結合されたラベ ルと辞書とのマッチングを再度行わせることになる。 In the above configuration, if the matching between the separated label and the dictionary fails, the scan of the candidate stem is continued, the next detected note head label is combined with the separated label, and then the matching with the dictionary is performed. Should be performed again. This means that in the case shown in Fig. 1, erasing the stem does not cause a problem in recognizing the notehead, but in the case shown in Fig. 2, after erasing the stem, the notehead is removed. This is because they are separated into multiple labels. In such a case, the matching that is performed first fails, so after performing label combining and performing matching again, notehead recognition becomes possible. The above configuration is the same for a computer-readable recording medium that stores the score reading program according to claim 28. The configuration includes a matching judgment function for judging the success or failure of the matching between the separation label and the dictionary. If the matching fails, the scan function is continued to scan for stem candidates, and then a label combining function for combining the detected notehead label and the separation label is executed. It further has a program, and after the label combination, causes the recognition function to perform the matching between the combined label and the dictionary again.
辞書マツチング失敗後に行われる上記ラベル結合及び再度のマツチング処理を
行う場合でも、 次に検出され結合処理に使用された符頭ラベル自体についても辞 書とマッチングさせ、 該マッチング結果の方が優先度が高い場合、 その認識結果 を優先させるようにすべきである。 The above-described label combining and re-matching processing performed after dictionary matching fails. Even if it is performed, the notehead label itself that was detected and used for the combining process next should be matched with the dictionary, and if the matching result has a higher priority, the recognition result should be given priority. .
上記構成は、 請求の範囲 2 9の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 次に検出 され結合処理に使用された符頭ラベル自体についても、 前記認識機能により辞書 とのマッチングを行わせ、 該マッチング結果の方が優先度が高い場合、 その認識 結果を優先させることになる。 The above-described configuration is the same for a computer-readable recording medium that stores the score reading program of claim 29, and the configuration includes the notehead label itself detected and used for the combining process next. The dictionary is matched by the recognition function, and if the matching result has a higher priority, the recognition result is given priority.
また請求の範囲 1 8の楽譜読み取り方法で、 ラベル結合を繰り返して行い、 そ の結合中にマッチングして認識された夫々の認識結果に優先度をつけ、 優先度の 高い順に該認識結果を決定すると良い。 ラベルの結合中、 本来認識すべき符頭を 全て含む認識矩形にならないうちに、 別の符頭と同じ形状となる場合があるので、 マッチングを行う場合は、 認識結果に優先度をつけると良い。 優先度の低い認識 結果であった場合、 その I Dと矩形を保存しておき、 次のラベル走査を行う。 こ れより優先度の高い I Dが見つからなければこちらを優先する。 ラベル結合途中 にできる認識対象ラベルが意図するのとは別の I Dに認識されてしまう場合には、 これをリジェクトラベルとして辞書に入れ、 これに認識された場合には、 認識失 敗とすることもできる。 In the score reading method according to claim 18, label combining is repeatedly performed, and priorities are given to the respective recognition results recognized and matched during the combining, and the recognition results are determined in descending order of priority. Good. During label merging, the shape may be the same as another notehead before it becomes a recognition rectangle that includes all the noteheads that should be recognized, so if matching is performed, priority should be given to the recognition results . If the recognition result has a low priority, the ID and rectangle are saved, and the next label scan is performed. If an ID with a higher priority is not found, this is given priority. If the recognition target label formed during label combination is recognized by a different ID from the intended one, put it in the dictionary as reject travel, and if it is recognized, it will be recognized as recognition failure. You can also.
上記構成は、 請求の範囲 3 0の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 前記符頭 認識及ぴラベノレ結合を繰り返して行わせる間に、 その符頭認識中にマッチングし て認識された夫々の認識結果に優先度をつける優先度付加機能を実行させるため のプログラムを更に有し、 前記認識機能で、 優先度の高い順に該認識結果を修正 することになる。 The above configuration is the same for a computer-readable recording medium that records the score reading program according to claim 30, and the configuration is such that the note head recognition and the labenole combination are repeatedly performed. A program for executing a priority addition function for assigning a priority to each recognition result recognized by matching during the note head recognition, wherein the recognition function sorts the recognition results in descending order of priority. It will be corrected.
上記の構成では、 符頭にタイが接触している場合、 ラベル分離ができない。 そ のため、 まずタイを消去してからラベル分離を行い、 該タイが接触している符頭 を含むドラム音符の認識を行うようにすると良い。 In the above configuration, label separation cannot be performed when a tie is in contact with the note head. For this reason, it is preferable to first erase the ties, then separate the labels, and recognize the drum notes including the noteheads in contact with the ties.
上記構成は、 請求の範囲 3 1の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 符頭に接
触するタイを消去するタイ消去機能を実行するプログラムを更に有し、 該消去後 にラベル分離機能でラベル分離を行い、 前記認識機能で、 該タイが接触している 符頭の認識を行う。 The above-described configuration is the same for a computer-readable recording medium that stores the score reading program of claim 31. The program further includes a program for executing a tie erasing function for erasing a touched tie. After the erasing, the label separating function performs label separation, and the recognition function recognizes a notehead with which the tie is in contact.
第 3図に示すように、 通常のドラムセット以外の楽器を同一五線上に表記して いる場合に、 (X )同士が接触した和音が存在する場合がある。 このような場合、 辞書とのマッチング前に、 夫々の符頭を分離して認識矩形を設定するのは困難で ある。 そのため、 請求の範囲 2 2構成では、 符頭同士が上下に接触した結合符頭 自体を辞書に登録しておき、 この辞書と該結合符頭とのマッチングを行って、 結 合符頭の認識を行うこととした。 As shown in Fig. 3, when instruments other than a normal drum set are represented on the same staff, there may be chords where (X) contacts each other. In such a case, it is difficult to set the recognition rectangle by separating each notehead before matching with the dictionary. For this reason, in the claims 22 configuration, the combined noteheads whose noteheads touch each other up and down are registered in a dictionary, and the dictionary is matched with the combined noteheads to recognize the combined noteheads. It was decided to do.
上記構成は、 請求の範囲 3 2の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 符頭同士 が上下に接触した結合符頭自体を辞書に登録しておき、 前記認識機能でこの辞書 と該結合符頭とのマッチングを行って、 結合符頭の認識を行うようにしたもので ある。 The above configuration is the same for a computer readable recording medium that records the score reading program of claim 32. The configuration is such that the combined noteheads whose noteheads are in contact with each other up and down are registered in the dictionary. The recognition function matches the dictionary and the combined notehead to recognize the combined notehead.
これまでのように、 符尾候補の周辺のラベルを結合しながら辞書とマッチング していくことで、 第 4図に示すようなトレモロ記号を認識することもできる。 特 にドラム譜の場合トレモ口記号は比較的多い。 トレモ口記号は連鉤と略同じ太さ、 間隔も略同じなので、 対策を行わないと、 連鈎と同様に旗の計数を行なってしま い、 3 2分音符などの音長の短い音符と誤認してしまう。 従って本願構成では、 第 5図に示すような形でトレモ口記号を辞書に登録しておき、 該トレモ口記号の 認識を行ってその記号ビットの消去を行った後、 トレモロ記号を含んで表示され ていた他のドラム音符の認識を行うこととした。 As in the past, tremolo symbols as shown in Fig. 4 can be recognized by matching the dictionary while combining labels around stem candidates. Especially in the case of drum music, there are relatively many tremolo mouth symbols. Because the tremolo mouth symbol is almost the same thickness and spacing as the hook, if no countermeasures are taken, the flag will be counted in the same way as the hook, and short notes such as 32 notes will be counted. Misunderstood. Therefore, in the configuration of the present application, the tremolo mouth symbol is registered in the dictionary as shown in FIG. 5, the tremolo mouth symbol is recognized, the symbol bit is deleted, and the tremolo symbol is displayed including the tremolo symbol. Recognition of other drum notes was performed.
上記構成は、 請求の範囲 3 3の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 トレモロ 記号を辞書に登録しておき、 前記認識機能で該トレモロ記号の認識を行うと共に、 該トレモロ記号のビットを消去する記号消去機能を実行するプログラムを更に有 し、 消去後トレモ口記号を含んで表示されていた他のドラム音符の認識を行うこ とにした。 The above configuration is the same for a computer-readable recording medium storing the musical score reading program according to claim 33. The configuration is such that tremolo symbols are registered in a dictionary, and the tremolo symbol is registered by the recognition function. In addition to recognizing the symbol, the program further has a program for executing a symbol erasing function for erasing the bits of the tremolo symbol. After the erasure, another drum note displayed including the tremolo mouth symbol is recognized. did.
本願構成では、 通常楽譜の認識時に行われていると同様に符頭の認識後、 該符
頭と符尾の結合処理を行なっているが、 ドラム譜の場合、 この結合処理にも特別 な処理が必用になる。 その一っは符頭と符尾の位置関係に起因するものである。 即ち黒玉以外の符頭の場合、 第 2図に示すように、 符頭の中心に符尾が付く場合 があることである。 また符尾の両側に符頭が付くことは少ない。 In the configuration of the present invention, after the note head is recognized, the Although the head and stem are combined, special processing is required for drum staves. One of them is caused by the positional relationship between note heads and stems. In other words, noteheads other than black balls may have a stem at the center of the notehead, as shown in Fig. 2. In addition, note heads are rarely attached to both sides of the stem.
音符の認識は、 符頭と符尾候捕の結合によってなされるが、 該結合は、 まず符 尾の先頭の符頭を結合した後、 中間の符頭の結合を行なう。 Recognition of notes is done by combining noteheads and stemheads, in which the first notehead at the end of the stem is combined and then the middle notehead.
通常の符頭 (黒玉、 白玉) の場合、 玉が符尾の左右に付く場合がある。 また先 頭の玉は X方向 (横方向) の位置が決まっている (例えば符尾上向きならば先頭 の符頭は符尾の左にしか付かない) 。 よって先頭の玉の結合時、 符尾と符頭の X 方向の位置関係を左右に限定することになる。 この時、 符頭が符尾のどちらの端 に付いているか (符尾上向きか下向きか) は、 第 6図に示すように、 符尾候補の Y方向 (縦方向) の中点 C Cと符頭中心 C Yの Y座標の位置関係によって決める。 また先頭の玉であるかどうかについては、 同図に示すように、 符尾候補の端 S T と符頭中心 C Yとの距離、 或レ、は符頭楕円の上下端との関係などにより判定する。 しかしドラム符頭の場合、 X方向に見た場合に、 符尾が符頭の中心にある場合 があるので、 先頭の玉の場合にも、 第 7図(a ) ( b )に示すように、 左右の限定を 行わない (どちらも結合可とする) 。 この後、 符尾の重複結合を防ぐために、 符 頭符尾結合後、 符頭の符尾の付いた側のフラグをチェックするが、 ドラム符頭の 場合、 第 8図に示すように、 実際の符尾と符頭中心の X方向の位置関係に拘わら ず、 決まった方向をチェックする (符尾上向きなら右側をチェックする) 。 尚、 このチヱックフラグは、 符頭と符尾候補を結合する際、 符尾の重複結合を防ぐた めに、 符頭側の保存データ中データの属性を示すものとして記憶されるものであ る。 In the case of normal noteheads (black ball, white ball), the ball may be attached to the left and right of the stem. In addition, the head ball has a fixed position in the X direction (horizontal direction) (for example, if the stem is upward, the first note head is attached only to the left of the stem). Therefore, when combining the first ball, the positional relationship between the stem and the notehead in the X direction is limited to the left and right. At this time, the end of the stem (either upward or downward) is determined by the midpoint CC in the Y direction (vertical direction) of the stem, as shown in Fig. 6. Determined by the positional relationship of the Y coordinate of the head center CY. As shown in the figure, whether or not the ball is the first ball is determined by the distance between the end ST of the suffix candidate and the center CY of the notehead, or the relationship between the upper and lower ends of the notehead ellipse. . However, in the case of a drum notehead, when viewed in the X direction, the stem may be at the center of the notehead, so even in the case of the first ball, as shown in Fig. 7 (a) and (b) , Left and right are not limited (both can be combined). After this, the flag on the side with the stem of the notehead is checked after combining the stemheads to prevent the overlapping of stems, but in the case of drum noteheads, the actual Check the fixed direction regardless of the position of the stem and the center of the notehead in the X direction (if the stem is upward, check the right side). Note that this check flag is stored as indicating the attribute of the data in the stored data on the notehead side in order to prevent overlapping of the stems when combining the notehead with the stem candidates.
その場合の本願の構成として、 結合させようとする符尾候補が上向きか下向き かの違いによって該符尾候補との結合位置を特定するフラグを、 各符頭に備えて おり、 これらの符頭と符尾候補との結合を行う過程で、 前記フラグで特定された 符尾の結合位置以外への結合を不可としている。 In this case, as a configuration of the present application, each notehead is provided with a flag for specifying the position of the link with the stem candidate depending on whether the stem candidate to be combined is upward or downward. In the process of combining the stems with the stem candidates, the stems specified by the flag are not allowed to be combined at positions other than the combining position.
ドラム譜の場合に、 特有な結合処理を行なわなければならないもう一つの理由 は、 第 9図(a ) ( b )に示すような符尾を分断する符頭が存在することである。 図
のような例の場合、 符尾の先頭の黒玉は、 4分音符ではなく、 8分音符として認 識されるべきである。 符尾を分断する符頭は、 同図に示されるように、 先頭の玉 が黒玉であり、 分断する符頭が 1つ存在するというパターンが殆どである。 そこ で本構成では、 まず黒玉を対象とせず、 第 1 0図に示すように、 符尾を分断する 符頭とその上下の符尾候補との結合を行って、 同図( b )のような該符頭を共有す る符尾逆向きのドラム音符を認識した後、 そのうち図右側の符尾が下向きの音符 を削除 (消去のように画像のビットプレーンを消すのではなく、 認識結果保存デ ータ上のデータそのものを消す処理) し、 同図(c )のように上下の符尾を結合し たものを符尾候補とし (図右側) 、 最終的に残りの符頭 (黒玉) と結合させるよ うにする。 Another reason that special combining processing must be performed in the case of drum staves is the presence of noteheads that separate stems as shown in Figs. 9 (a) and 9 (b). Figure In an example like this, the leading black dot in the stem should be recognized as an eighth note, not a quarter note. As shown in the figure, most of the noteheads that divide stems are black balls at the beginning, and there is one notehead that separates them. Therefore, in this configuration, first, the black ball is not targeted, and as shown in Fig. 10, the stems that separate the stems are combined with the candidate stems above and below the stems. After recognizing a drum note with the opposite stem that shares the note head, the note on the right side of the figure deletes the downward note (instead of erasing the bit plane of the image as in the case of erasing, the recognition result). The process of erasing the data on the stored data itself), and combining the upper and lower stems as candidate stems (right side in the figure) as shown in Fig. 9 (c), and finally the remaining noteheads (black) Ball).
上記構成は、 請求の範囲 3 4の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 前記結合 機能によつて符尾を分断する符頭とその上下の符尾候補との結合を行つて、 該符 頭を共有する符尾逆向のドラム音符を前記認識機能により認識した後実行される、 符尾が下向きの音符を削除する下向き音符削除機能と、 上下の符尾を結合する符 尾結合機能との実行プログラムを有しており、 結合されたものを符尾候補として、 前記結合機能により残りの符頭と結合させるようにするものである。 The above configuration is the same for a computer-readable recording medium that stores the score reading program according to claim 34. The configuration includes a note head that separates stems by the combining function and upper and lower note heads. A down note deletion function for deleting notes with down stems, which is executed after recognizing by the recognition function a drum note having a reverse stalk that shares the note head by performing the combination with the stem candidates. It has an execution program with a stem combining function for combining upper and lower stems, and the combined one is used as a stem candidate to be combined with the remaining noteheads by the combining function.
ドラム譜の場合に、 特有な結合処理を行なわなければならない更に別の理由は、 〇符頭を認識するために、 ハイハットオープンの ( ° ) が符尾の近くに存在した 場合、 符頭と誤認する可能性があることである。 この対策のため、 〇符頭につい ては、 下向きの符尾を結合したくない場合、 左側のフラグをチヱックしておけば、 このチェック側に符尾が結合されることはない (一般的にフラグのチェックされ た側は符尾候補の結合は不可とされる) 。 Yet another reason for the special combining process for drum staves is that, in order to recognize the notehead, if the hi-hat open (°) is near the stem, it is mistaken for a notehead. It is possible that As a countermeasure, if you do not want to attach downward stems to the 頭 note head, you can check the flag on the left side, and no stem will be attached to this check side. The checked side of the flag is not allowed to combine stem candidates.)
また第 1 1図に示されるハイハツトクローズの(+ )の記号ゃ連符数字が符頭と 誤認されてしまい、 これを符尾先頭の符頭として結合すると、 符尾向きが逆の全 く異なる音符として認識されてしまうことになる。 その対策としてこれらの記号 ゃ連符数字をリジェクトラベルとして辞書に登録しても良いが、 ドラム譜の符尾 向きは通常楽譜と異なり、 ある程度限定できることを利用して、 本願構成では、 符尾上端が五線より上に出ており且つ符尾下端が五線より下に出ていない場合、
即ち符尾上端が第 5線より上且つ符尾下端が第 1線より上の場合に、 符尾は上向 き レ、ィハツトオープン ( ° ) の誤認対策としても有効である] 、 符尾下端が五 線より下に出ており且つ符尾上端が五線より上に出ていない場合、 即ち符尾下端 が第 1線より下且つ符尾上端が第 5線より下の場合に、 符尾は下向きと判断して、 先頭符頭と該符尾候補とを結合させることとした。 Also, the hi-hat closed (+) symbol shown in Fig. 11 and the tuplet number are mistaken for a notehead, and when this is combined as a notehead at the beginning of a stem, the stem direction is completely reversed. It will be recognized as a different note. As a countermeasure, these symbols ゃ Tuplet numbers may be registered in the dictionary as reject travel, but the stem direction of drum staves is different from that of normal music, and it can be limited to some extent. Is above the staff and the lower stem is not below the staff, In other words, when the upper stem is above the fifth line and the lower stem is above the first line, the stem is effective as a countermeasure against false recognition of upward and open hats (°)]. If the bottom end is below the staff and the top of the stem is not above the staff, that is, if the bottom of the stem is below the first line and the top of the stem is below the fifth line, The tail was determined to be downward, and the first notehead and the candidate were joined.
上記構成は、 請求の範囲 3 5の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体についても同様であり、 その構成としては、 符尾上端 が五線より上に出ており且つ符尾下端が五線より下に出ていない場合に、 符尾は 上向き、 符尾下端が五線より下に出ており且つ符尾上端が五線より上に出ていな い場合に、 符尾は下向きと判断する符尾向き判定機能を実行するプログラムを更 に有しており、 該判定を行った後、 前記結合機能により先頭符頭と該符尾候補と を結合させることとした。 The above configuration is the same for a computer-readable recording medium storing the score reading program according to claim 35, wherein the upper end of the stem is above the staff and the lower end of the stem. If the stem is not below the staff, the stem is upward, and if the bottom of the stem is below the staff and the upper stem is not above the staff, the stem is downward. The program further includes a program for executing a stem direction determination function for determining that the first notehead and the stem candidate are combined by the combining function after the determination is performed.
しかし、 符尾を分断する符頭の上述した認識処理及びこれらの符尾符頭の結合 処理がなされた場合に、 上記の符尾向きを判断する構成を実施すると、 第 1 2図 に示される共有符頭に下向き符尾が連結した構成の認識が不可となる (符尾上端 が五線より上に出ており且つ符尾下端が五線より下に出ていない場合は、 上向き 符尾と判断されるため) 。 そのため本願構成では符尾を分断する符頭のための上 記処理を行なった後、 符尾向きの正規化を行なうことにした。 即ち、 符尾を分断 する符頭を有する音符を含むドラム音符の認識時に、 これらのドラム音符の先頭 符頭と符尾候補の結合処理を行い、 符尾を分断する符頭を有するドラム音符につ いては、 該符頭を共有する符尾逆向きのドラム音符を認識した上で、 符尾が下向 きの音符を削除して、 上下の符尾を結合したものを符尾候補として残りの先頭符 頭と結合させると共に、 他のドラム音符については、 符尾上端が五線より上に出 ており且つ符尾下端が五線より下に出ていない場合に、 符尾は上向き、 符尾下端 が五線より下に出ており且つ符尾上端が五線より上に出ていない場合に、 符尾は 下向きと判断して、 該符尾候補と残りの符頭と結合させ、 これらの条件に合わな いものは、 元の符尾候補に戻した後 (符尾向きの正規化処理) 、 該符尾候補と残 りの符頭とを結合させることとしている。 However, when the above-described recognition process of the noteheads that divide the stems and the combining process of these stemheads are performed, the configuration for determining the stem direction described above is implemented, as shown in FIG. It is not possible to recognize a configuration in which a downward stem is connected to a common notehead. (If the upper end of the stem is above the staff and the lower end of the stem is not below the staff, the upward stem is not recognized. To be judged). Therefore, in the configuration of the present application, normalization in the direction of stems is performed after performing the above-described processing for noteheads that divide stems. That is, at the time of recognizing a drum note including a note having a note head that separates a stem, the leading note head of these drum notes is combined with a candidate for a stem to form a drum note having a note head that separates a stem. After recognizing the drum note with the opposite stem that shares the notehead, delete the note with the lower stem, and leave the combination of the upper and lower stems as candidate stems. In addition to the first note head, the stem is turned up and the other drum notes are raised if the upper stem is above the staff and the lower stem is not below the staff. If the lower end of the stem is below the staff and the upper end of the stem is not above the staff, it is determined that the stem is downward, and the candidate for stem is combined with the remaining note heads. For those that do not meet the condition of, after returning to the original stem candidates (normalization processing for stem direction), The stem candidates are combined with the remaining note heads.
上記構成は、 請求の範囲 3 6の楽譜読み取りプログラムを記録したコンビユー
タ読み取り可能な記録媒体についても同様であり、 その構成としては、 符尾を分 断する符頭を有する音符を含むドラム音符の認識時に、 前記結合機能によりこれ らのドラム音符の先頭符頭と符尾候補の結合処理を行い、 符尾を分断する符頭を 有するドラム音符については、 前記認識機能により、 該符頭を共有する符尾逆向 きのドラム音符を認識した上で、 前記下向き音符削除機能により、 符尾が下向き の音符を削除して、 前記符尾結合機能により上下の符尾を結合したものを符尾候 補として、 更に前記結合機能により残りの先頭符頭と結合させると共に、 他のド ラム音符については、 前記符尾向き判定機能により、 符尾上端が五線より上に出 ており且つ符尾下端が五線より下に出ていない場合に、 符尾は上向き、 符尾下端 が五線より下に出ており且つ符尾上端が五線より上に出ていない場合に、 符尾は 下向きと判断して、 前記結合機能により該符尾候補と残りの符頭と結合させる他、 これらの条件に合わないものは、 元の符尾候補に戻す符候補復帰機能を実行する ためのプログラムを更に有しており、 元の符尾候補に復帰後、 結合機能により該 符尾候補と残りの符頭とを結合させることとしている。 The above configuration is a combination recording a score reading program according to claim 36. The same applies to a recording medium that can read data, and the configuration is such that when recognizing a drum note including a note having a note head that divides a suffix, the first note head of the drum note is combined with the first note head of the drum note by the combining function. For a drum note having a note head that divides a stem by performing a process of combining stem candidates, the above-mentioned downward note is used after recognizing a drum note of the opposite stem that shares the note head by the recognition function. The delete function deletes notes with lower stems, and combines the upper and lower stems with the stem combination function as a candidate for stems. For other drum notes, the stem direction determination function allows the stem to be directed upward when the upper stem is above the staff and the lower stem is not below the staff. The lower stem is If the stem is below the line and the upper end of the stem is not above the staff, it is determined that the stem is downward, and in addition to combining the candidate stem with the remaining noteheads by the combining function, Those which do not meet these conditions further have a program for executing a note candidate return function for returning to the original stem candidate. The remaining noteheads are to be combined.
図面の簡単な説明 BRIEF DESCRIPTION OF THE FIGURES
第 1図は、 ドラム音符の符頭ラベル分離処理の状態を示す説明図、 第 2図は、 符尾消去処理により符頭が複数に分割された状態を示す説明図、 第 3図は、 符頭 が上下に接触した状態の音符を含む楽譜例を示す説明図、 第 4図は、 トレモロ記 号を含む楽譜例を示す説明図、 第 5図は、 トレモロ記号辞書用画像例を示す説明 図、 第 6図は、 符頭と符尾の結合の場合の位置関係判定方法を示す説明図、 第 7 図は、 ドラム譜の符頭と符尾の結合状態を示す説明図、 第 8図は、 符頭と符尾の 結合の際にフラグのチェック状態を示す説明図、 第 9図は、 符頭により符尾が分 断された例を示す説明図、 第 1 0図は、 符尾を分断する符頭の音符認識処理の例 を示す説明図、 第 1 1図は、 ハイハツトクローズ及ぴ連符数字の記号をを含む楽 譜例を示す説明図、 第 1 2図は、 共有符頭に下向き符尾が連結した構成の例を示 す説明図、 第 1 3図は、 本発明に係る楽譜読み取りプログラムを記録したコンビ ユータ読み取り可能な記録媒体を外部記憶装置で読み込ませて稼動する楽譜読み
取り装置の実施例構成を示すブロック図、 第 1 4図は、 C P Uのメイン処理を示 すフローチャート、 第 1 5図は、 認識対象符頭を示す説明図、 第 1 6図は、 認識 結果中に特定の記号がある場合にその認識結果の書き込みを行う音符の特定方法 を示す説明図、 第 1 7図は、 ドラム譜標準パターンを示す説明図、 第 1 8図は、 範囲指定のある或いはない括弧の状態を示す説明図、 第 1 9図は、 1つの符頭種 類に統合されるべき符頭が五線と交差した場合の例を示す説明図、 第 2 0図は、 同じく 1つの符頭種類に統合されるべき符頭が符尾と交差した場合の例を示す説 明図、 第 2 1図は、 上記交差の場合に認識対象となるラベルの態様を示す説明図、 第 2 2図は、 ラベル結合処理を含むマッチング処理の詳細を示すフローチヤ一ト、 第 2 3図は、 同じくラベル結合処理を含むマッチング処理の詳細を示すフローチ ヤート、 第 2 4図は、 同じくラベル結合処理を含むマッチング処理の詳細を示す フローチャート、 第 2 5図は、 ラベル結合処理を含むマッチング処理の実際の例 を示す説明図、 第 2 6図は、 矩形マッチング処理の流れを示すフローチャート、 第 2 7図は、 タイと接触した符頭ラベルにおけるタイ認識処理を示す説明図、 第 2 8図は、 次段落のハイハツトオープンが認識矩形に入り込んできた状態を示す 説明図、 第 2 9図は、 楽譜上の段落の説明図、 第 3 0図は、 認識対象たる音符の 黒玉 · 白玉の符頭、 符尾及び旗を示す説明図である。 FIG. 1 is an explanatory diagram showing a state of a notehead label separation process of a drum note, FIG. 2 is an explanatory diagram showing a state where a notehead is divided into a plurality of portions by a stem erasing process, and FIG. Fig. 4 is an explanatory diagram showing an example of a musical score including notes with their heads touching up and down, Fig. 4 is an explanatory diagram showing an example of a musical score including a tremolo symbol, and Fig. 5 is an explanatory diagram showing an example of an image for a tremolo symbol dictionary. FIG. 6 is an explanatory view showing a positional relationship determination method in the case of combining noteheads and stems, FIG. 7 is an explanatory view showing the state of connecting noteheads and stems in a drum staff, and FIG. Fig. 9 is an explanatory diagram showing the check state of the flag at the time of combining the head and stem, Fig. 9 is an explanatory diagram showing an example in which the stem is separated by the head, and Fig. 10 is Explanatory diagram showing an example of the note recognition process for note heads to be divided, Fig. 11 shows an example of a musical score including hi-hat closed and tuplet numeral symbols FIG. 12 is an explanatory diagram showing an example of a configuration in which a downward stem is connected to a common note head, and FIG. 13 is a computer-readable recording recording a score reading program according to the present invention. Score reading that operates by reading the medium in the external storage device FIG. 14 is a block diagram showing the main processing of the CPU, FIG. 15 is an explanatory diagram showing the notehead to be recognized, and FIG. 16 is a diagram showing the result of recognition. Fig. 17 is an explanatory diagram showing the method of specifying the note for writing the recognition result when there is a specific symbol in Fig. 17. Fig. 17 is an explanatory diagram showing a standard drum notation pattern. An explanatory diagram showing the state of no parentheses, FIG. 19 is an explanatory diagram showing an example in which a notehead to be integrated into one notehead type crosses a staff, and FIG. Fig. 21 is an explanatory diagram showing an example in which a notehead to be integrated into one notehead type intersects a stem, and Fig. 21 is an explanatory diagram showing the form of a label to be recognized in the case of the intersection. Fig. 2 is a flowchart showing details of the matching process including label combining process, Fig. 23 is the same FIG. 24 is a flowchart showing details of the matching process including the label combining process. FIG. 24 is a flowchart showing details of the matching process also including the label combining process. FIG. 25 is an actual flowchart of the matching process including the label combining process. An explanatory diagram showing an example, FIG. 26 is a flowchart showing a flow of the rectangle matching process, FIG. 27 is an explanatory diagram showing a tie recognition process for a notehead label in contact with a tie, and FIG. Explanatory diagram showing the state in which the hi-hat open of the paragraph has entered the recognition rectangle, Fig. 29 is an explanatory diagram of the paragraph on the score, and Fig. 30 is the black ball and white ball head of the note to be recognized. It is explanatory drawing which shows a suffix and a flag.
発明を実施するための最良の形態 BEST MODE FOR CARRYING OUT THE INVENTION
(実施形態 1 ) · (Embodiment 1)
以下本発明の一実施形態を添付図面に基づき説明する。 第 1 3図は本発明に係 る楽譜読み取りプログラムを記録したコンピュータ読み取り可能な記録媒体を後 述するフレキシブルディスクドライブ F D D 5等の外部記憶装置 (或いは C D— R OMドライブ等) で読み込ませて稼動する楽譜読み取り装置の実施例構成を示 すブロック図である。 この装置は、 パソコンなどの電子計算機の構成に、 スキヤ ナゃ M I D Iインターフェース回路を付加したものである。 C P U 1は、 R OM 2或いは R AM 3に格納されるプログラムに基づき、 楽譜読み取り装置全体の制 御を行う中央演算処理装置である。 また予め設定された所定の周期で C P U 1に
割り込みをかけるタイマ回路を内蔵している。 RAM3はプログラムエリアの他、 画像データバッファ、 ワークエリア等として使用される。 ハードディスク装置 H DD4及ぴフレキシブルディスク ドライブ FDD 5は、 プログラム及ぴ画像デー タ、 演奏データ等を格納する。 C RT 6は CPU 1の制御に基づき、 CRTイン ターフェース回路 7から出力される映像情報を表示し、 キーボード 8から入力さ れた情報は、 キーボードィンターフェース回路 9を経て C PU 1に取り込まれる。 プリンタ 10は、 CPU1の制御に基づき、 プリンタインターフェース回路 1 1 から出力される印字情報を印字する。 An embodiment of the present invention will be described below with reference to the accompanying drawings. FIG. 13 shows a computer-readable recording medium storing a musical score reading program according to the present invention, which is read and operated by an external storage device (or a CD-ROM drive or the like) such as a flexible disk drive FDD 5 described later. FIG. 1 is a block diagram showing the configuration of an embodiment of a musical score reading device. This device is obtained by adding a scanner and a MIDI interface circuit to the configuration of an electronic computer such as a personal computer. The CPU 1 is a central processing unit that controls the entire score reading apparatus based on a program stored in ROM 2 or RAM 3. In addition, the CPU 1 Built-in timer circuit for interrupt. The RAM 3 is used as an image data buffer, a work area, and the like in addition to the program area. The hard disk drive HDD4 and the flexible disk drive FDD5 store programs, image data, performance data, and the like. The CRT 6 displays video information output from the CRT interface circuit 7 based on the control of the CPU 1, and the information input from the keyboard 8 is input to the CPU 1 via the keyboard interface circuit 9. It is. The printer 10 prints the print information output from the printer interface circuit 11 under the control of the CPU 1.
スキャナ 1 2は、 例えば (印刷された) 楽譜を光学的に走査して、 2値或いは グレースケール或いはカラーの画像データに変換するものであり、 フラットべッ ド型、 ハンディ型、 フィーダ型等任意のタイプのスキャナを使用できる。 スキヤ ナ 12によって読み取られた画像情報は、 スキャナインターフェース回路 1 3を 介して、 RAM3或いは HDD 4に取り込まれる。 M I D Iインターフェース回 路 14は、 音源モジュール等の外部の M I D I機器との間で M I D Iデータの送 受信を行う回路である。 バス 1 5は、 本楽譜読み取り装置内の各回路を接続し、 各種データ、 プログラム、 アドレス等をやり取りさせている。 なお、 この他にマ ウスなどのポインティングデバイスや RS 232 C等のシリアノレインターフエ一 ス回路等を備えていても良い。 The scanner 12 optically scans (printed) music, for example, and converts it into binary, grayscale, or color image data. The scanner 12 can be any type such as a flatbed type, a handy type, or a feeder type. Types of scanners can be used. The image information read by the scanner 12 is taken into the RAM 3 or the HDD 4 via the scanner interface circuit 13. The MDI interface circuit 14 is a circuit that transmits and receives MIDI data to and from an external MIDI device such as a sound source module. The bus 15 connects each circuit in the musical score reader and exchanges various data, programs, addresses, and the like. In addition, a pointing device such as a mouse or a serial interface circuit such as RS232C may be provided.
第 14図は CPU 1のメイン処理を示すフローチヤ一トである。 ステップ S 1 においては、 スキャナ 12によって楽譜のイメージを RAM3に取り込む。 画像 は 2値の画像データとして取り込む。 ステップ S 2においては、 かすれやドット ノイズ等を軽減するために、 図形融合等の画質平滑化処理を行う。 ステップ S 3 においては、 解像度と濃度の情報を得ると共に、 後段における五線検出の基準デ ータを得るために、 後述する画質チェック処理を行う。 楽譜の認識処理において は、 解像度及び濃度が所定の範囲から外れると認識率が低下してしまうので、 ス テツプ S 3においては、 これらの値が、 所定の範囲内に入っているか否かがチェ ックされる。 ステップ S 4においては、 ステップ S 3におけるチェック結果が画 質 OKであるか否かが判定され、 結果が〇Kでない場合にはステップ S 1に戻つ て、 解像度や濃度を変えて再度取り込みを行う。 ステップ S 5においては、 後述
する五線認識を行う。 五線認識処理において、 五線走査開始位置検出処理と五線 シフト量の検出処理が行われる。 ステップ S 6においては、 段落認識処理を行う。 この処理は、 大きく、 段落認識処理と、 大かっこ認識処理に分かれる。 段落認識 処理においては、 画像全体で五線を検出し、 五線同士で左端が略同じ場所にある 五線の組を探し、 五線の端同士が、 黒画素で結ばれているかどうかを検査し、 段 落を認識する。 ステップ S 7においては、 段落の認識結果を表示して、 段落認識 結果が正しいか否かを利用者にチェックさせることにより、 O Kか否かが判定さ れ、 結果が Ο Κでない場合にはステップ S 8に移行して、 段落認識結果の修正が 行われる。 尚、 五線認識が失敗した場合には、 その後の処理が行えないので、 解 像度や濃度を変更して再度画像を取り込む必要がある。 従ってステップ S 7にお いては、 まず五線の認識結果を表示し、 正しいか否かを利用者に判定させ、 もし 正しくない場合には、 S 1.に戻ってイメージを再度取り込み、 また五線が正しく 認識されている場合には、 段落認識結果を表示し、 チェックさせるようにしても 良い。 FIG. 14 is a flowchart showing the main processing of the CPU 1. In step S 1, the image of the musical score is loaded into the RAM 3 by the scanner 12. Images are captured as binary image data. In step S2, image quality smoothing processing such as graphic fusion is performed to reduce blurring and dot noise. In step S3, an image quality check process, which will be described later, is performed to obtain resolution and density information and to obtain reference data for staff detection in a later stage. In the music score recognition process, if the resolution and density are out of the predetermined range, the recognition rate will be reduced. Therefore, in step S3, it is checked whether or not these values are within the predetermined range. Is locked. In step S4, it is determined whether or not the check result in step S3 is image quality OK. If the result is not 〇K, the process returns to step S1 to change the resolution and density and re-acquire. Do. In step S5, Perform staff recognition. In the staff recognition process, a staff scanning start position detection process and a staff shift amount detection process are performed. In step S6, a paragraph recognition process is performed. This process is roughly divided into paragraph recognition and bracket recognition. In the paragraph recognition process, staffs are detected in the entire image, a set of staffs whose left ends are at approximately the same location between the staffs is searched, and it is checked whether the ends of the staffs are connected by black pixels. And recognize the step. In step S7, the recognition result of the paragraph is displayed, and the user is checked whether or not the paragraph recognition result is correct, and it is determined whether or not it is OK. If the result is not Ο ス テ ッ プ, the step is performed. Proceeding to S8, the paragraph recognition result is corrected. If the staff recognition fails, subsequent processing cannot be performed, so it is necessary to change the resolution and density and import the image again. Therefore, in step S7, the staff recognition result is displayed first, and the user is judged whether or not the staff is correct. If the line is correctly recognized, the paragraph recognition result may be displayed and checked.
ステップ S 9においては、 ユーザにより各段落のドラムパートを選択させる。 その後ステップ S 1◦において、 通常パートは通常楽譜認識を、 ドラムパートは ドラム譜としての認識を行う。 全てのページで記号の認識が終了した後、 ステツ プ S l l〜1 3において、 1曲中のドラムパートを 2回走査 (2回ノレープ) する ことで、 ドラムパートに関して曲全体でドラム表記法の推定と該表記法に従った 楽器の割り当てを行う。 本構成では、 ドラム表記法推定結果の修正インターフエ ースを備えていない。 これは、 認識結果が間違っていれば、 認識された楽譜記号 を修正することで対応するからである。 最後にステップ S 1 4において、 割り当 てられた発音楽器に対して、 その音長及び音高を指定した演奏可能な楽譜データ 形式に変換する。 In step S9, the user selects a drum part of each paragraph. Then, in step S1◦, the normal part performs normal music score recognition, and the drum part performs drum score recognition. After the recognition of symbols on all pages, the drum part in one song is scanned twice (twice noraping) in Steps Sll to 13 so that the drum notation is Estimate and assign instruments according to the notation. This configuration does not include a modified interface for the drum notation estimation result. This is because if the recognition result is wrong, the recognized score symbol can be corrected. Finally, in step S14, the assigned musical instrument is converted into a playable musical score data format in which the pitch and pitch are specified.
以下ステップ S 9〜ステップ S 1 4までを詳細に説明する。 五線認識、 段落認 識を行い、 段落認識のチェック時に同時に、 或いは段落認識結果の修正時に同時 に、 ステップ S 9において、 ドラムパートの設定をユーザに行わせる。 これは認 識された五線、 段落の結果を表示して、 ドラム譜である五線をチェックさせるこ とで設定する。 ここで段落認識結果を保存するデータのパート情報に、 ドラム譜
であるかどうかのフラグを設定する。 Hereinafter, steps S9 to S14 will be described in detail. In step S9, the user performs the drum part setting at the same time as checking the paragraph recognition or correcting the paragraph recognition result. This is done by displaying the results of the recognized staff and paragraphs and having the staff check the drum staves. The part information of the data that saves the paragraph recognition results Set a flag to determine if
設定されたフラグ情報に基づいて、 認識部で、 通常楽譜認識とドラム譜認識の 場合分けを行い、 ステップ S 1 0において、 ドラム譜に関して記号認識を行う。 通常楽譜認識と、 ドラム譜認識の違いは次の通りである。 ドラム譜認識では、 ド ラム譜に存在しない記号の認識をスキップする (但し誤設定、 誤認識対策、 表記 間違いなどの対策のために、 認識自体は行い、 出力だけを制限する場合もある) 。 ドラム譜認識では、 ドラム譜に固有の記号 '固有の文字列の認識を追加し、 他方 ドラム譜に不要な文字列の認識を削除する。 また黒玉 · 白玉以外のドラム符頭の 認識を追加する。 他方ドラム譜の記号の出現確率 ·出現形態に対応したしきい値 の変更を行う (例えばスラーの出現確率は低いので、 認識時にしきい値を厳しく することにより高速化できる、 など) 同様に、 通常音符の認識しきい値を変更 する (黒玉和音が少ない、 白玉の出現率は小さい、 等。 そのため、 黒玉のしきい 値を厳しく したり、 場合によっては白玉を認識しないようにする。 本構成では白 玉は認識しないものとする) 。 Based on the flag information that has been set, the recognition unit classifies normal music score recognition and drum score recognition, and in step S10, performs symbol recognition on the drum score. The differences between normal score recognition and drum score recognition are as follows. Drum notation recognition skips the recognition of symbols that do not exist in the drum notation. (However, in order to take measures against misconfiguration, misrecognition, spelling mistakes, etc., recognition itself is performed and only output may be limited.) In drum notation recognition, we add the unique symbol 'unique string recognition to the drum notation, while removing the recognition of unnecessary strings in the drum notation. Also, recognition of drumheads other than black and white balls is added. On the other hand, the probability of appearance of symbols on drum staves · Change the threshold value corresponding to the appearance form (for example, since the appearance probability of slurs is low, it is possible to speed up by making the threshold value stricter during recognition, etc.) Change the threshold for recognition of normal notes (the number of black ball chords is small, the appearance rate of white ball is small, etc.) Therefore, the threshold value of black ball should be strict, or in some cases, white ball should not be recognized. In this configuration, white balls are not recognized.)
このうちドラム符頭の認識は以下のように行う。 ドラム譜の符頭で、 通常の楽 譜と同じ黒玉は、 通常楽譜同様に、 五線の線などを消去して行う太細分離処理及 ぴ黒玉部分の認識のための楕円検出処理により行う。 本構成では、 前述のように、 ドラム楽譜における白玉の出現確率は低いので、 認識を行わない。 他方、 これら 以外のドラム譜の符頭は (x、 O) 等、 細線で描かれており、 またこの他にも色 々なタイプが存在するので、 これまでと同様に、 太細分離処理及び楕円検出処理 で検出することができない。 そのため、 全音符については通常の記号 (例えば休 符等) と同様に、 検出されたラベル (対象とする記号を認識するために、 適当な 大きさに設定された矩形) を辞書とマッチングすることにより行う。 それ以外の 符頭の認識は、 符尾候補 (符尾と仮にされるもの) でラベルを分離し、 符尾候補 の周辺のラベルを結合しながら辞書とマッチングすることで実現する。 このドラ ム符頭の認識については、 後述する実施形態 7の欄において詳述する。 また認識 対象符頭は第 1 5図のようになる。 これ以外にもドラム符頭は存在するが、 この 程度に対応しておけば一般的なドラム譜は略対応できることになる。 また符頭が 五線のどの位置にあるか (音高) によって認識対象符頭種類を変化させることも
有効である [例えば符頭(R)は第 3間しか存在しない等、 本構成ではこのような 認識は行っていない] 。 黒玉 (白玉) 以外の符頭に関しては、 認識された符頭の 種類を記号保存データに残す。 即ち認識記号保存データ中の保存領域 d r u mN o t eに符頭種類を書き込む。 The recognition of the drum head is performed as follows. Black dots, which are the same as normal scores, in the note head of a drum score, are separated by thick and thin separation processing performed by erasing staff lines and the like, and ellipse detection processing for recognizing black dots is performed in the same way as normal scores. Do. In this configuration, as described above, recognition is not performed because the probability of occurrence of white balls in a drum score is low. On the other hand, note heads of drum staves other than these are drawn with thin lines such as (x, O), and there are various other types. It cannot be detected by the ellipse detection processing. Therefore, for whole notes, the detected labels (rectangles of an appropriate size to recognize the target symbol) must be matched with the dictionary, just like normal symbols (for example, rests). Performed by Recognition of other noteheads is realized by separating the labels with the stems (provisioned as stems) and matching the dictionary with the labels around the stems. The recognition of the drum head will be described in detail in a section of a seventh embodiment described later. The noteheads to be recognized are as shown in Fig. 15. There are other drum note heads, but if this level is supported, general drum staves can be almost supported. It is also possible to change the type of notehead to be recognized depending on where the notehead is on the staff (pitch). It is valid [for example, note recognition (R) exists only in the third period, and such a recognition is not performed in this configuration]. For noteheads other than black ball (white ball), the recognized notehead type is left in the symbol storage data. That is, the note head type is written in the storage area dru mN ote in the recognition symbol storage data.
またドラム譜の認識に当たっては、 更にドラム音符に係る記号の認識も重要で ある。 例えばハイハツトシンバルは音符の上方に ( ° ) や ( + ) 等を書くこと によってオープンとクローズ (その他ハーフオープン) 等を表現する場合がある。 またアクセント ( > ) が付いているものをシンバル (クラッシュ) とし、 他をハ ィハットシンバルとするような表記法もある。 従ってこれらの係り具合を検出す ることが必要になる。 そのためドラム譜の場合、 記号認識時に ( ° ) や ( + ) を追加認識する。 認識結果中に、 ( ° ) 、 ( + ) 及び ( > ) などが存在したら、 第 1 6図に示すように、 この記号の上下左右にある適当な幅を加算した矩形 B中 に符頭中心 C又は符尾端点 Dが存在する音符に夫々の記号種類に応じた値を書き 込む。 通常ドラム譜の場合、 これらの記号の係りが影響する音符は、 もっとも上 の音高に書かれたものだけであり、 またクラッシュシンバルを表現するァクセン ト記号とハイハツト記号が重複することもない。 これらの対象になる音符の符頭 は、 (X ) 符頭を持つ音符に限られる。 よって、 係りの対象となる音符は最も音 高の高いものとし、 ハイハットとァクセントは同じ位置へのフラグとして記憶領 域を削除することも考えられる。 しカゝし、 誤認識の可能性や、 処理を簡単にする ことを考えると、 同じ帯域にある全ての音符に別々のフラグを書き込んでも良い。 本構成では、 同じ帯域の黒玉以外の音符全てに夫々の記号に応じた値を書き込む。 但し、 この場合、 係り具合の検出の優先順を考慮する必要がある。 つまりハイハ ットオープン、 クローズ等が係る場合には、 アクセントの係りは考慮する必要が ない。 よって、 最初にハイハット記号の係りの検出、 その後にアクセント記号の 係りの検出という順番に、 一度係りを検出した音符には係りの上書きができいな いようにする。 また後述する標準パターンではハイハットハーフオープン、 ハイ ハツトクォータオープン等は対応していないが、 記号認識と係りの認識も行い、 ノヽイノヽ、 卜ノヽーフォープン、 ノヽイノヽクト夕ォ一夕オープン ノヽイノ、、ク卜ォー プンに変更しても良い。 (d r u mN o t eの空き領域に値を入れる) ハイハツ
トオープン、 クローズ等はアクセントよりも優先的に書き込む。 In recognizing drum scores, it is also important to recognize symbols related to drum notes. For example, hi-hat cymbals sometimes express open and close (or other half-open) by writing (°) or ( + ) above the note. There is also a notation that accents (>) are cymbals (crashes) and others are hi-hat cymbals. Therefore, it is necessary to detect the degree of these factors. Therefore, for drum notation, (°) and (+) are additionally recognized when recognizing symbols. If (°), (+), (>), etc. are present in the recognition result, as shown in Fig. 16, the center of the notehead is added to the rectangle B to which the appropriate width at the top, bottom, left and right of this symbol is added. Write the value corresponding to each symbol type to the note where C or stem end point D exists. In the case of normal drum staves, the notes affected by these symbols are only those written at the highest pitch, and there is no overlap between the accent symbol that expresses the crash cymbal and the hi-hat symbol. The noteheads of these notes are limited to those with (X) noteheads. Therefore, it is conceivable that the note to be involved is the highest pitch, and that the hi-hat and the axent delete the storage area as a flag at the same position. However, considering the possibility of misrecognition and simplifying the processing, it is possible to write separate flags for all notes in the same band. In this configuration, a value corresponding to each symbol is written to all notes other than the black ball in the same band. However, in this case, it is necessary to consider the priority of detection of the degree of engagement. In other words, when hi-hat open or close is involved, it is not necessary to consider the accent. Therefore, it is necessary to detect the change of hi-hat symbols first, and then detect the change of accent marks, so that once a change is detected, the note cannot be overwritten. The standard pattern described later does not support hi-hat half open, hi-hat quarter open, etc. , And may be changed to quotes. (Put a value in the free area of drumNote) Open, close, etc. are written with priority over accents.
以上のようにして記号認識を終了すると、 次のステップ S I 1〜S 1 2におい て、 ドラム表記法の推定を行う。 本構成では、 当てはめという作業により対応す る表記法を推定し、 またその認識結果を表示し、 演奏するために、 ドラム譜標準 パターンの形式でデータを作成する。 上記当てはめは、 1曲中のドラムパートを 2回走査することで実現する。 当てはめ結果は、 d r u mN o t eに更に実際の 楽器を表現するフラグを書き込む。 このフラグを参照し、 ドラム譜標準パターン の形式でデータを作成する。 尚、 上記当てはめ工程の説明をする前に、 ドラム表 記法と、 ドラム譜標準パターンについて、 以下に説明する。 When the symbol recognition is completed as described above, the drum notation is estimated in the next steps SI1 to S12. In this configuration, data is created in the form of a standard drum notation pattern in order to estimate the corresponding notation by the operation of fitting, display the recognition result, and perform. The above fit is achieved by scanning the drum part in one song twice. As a result of the fitting, a flag representing the actual instrument is further written in drumNote. By referring to this flag, data is created in the format of drum standard pattern. Before describing the above-mentioned fitting process, the drum notation and the drum standard pattern will be described below.
ドラム譜の表記法には、 様々な種類がある。 中には非常に特殊な表記法もある が、 このようなものは頻度も低いので対象にしない。 ドラム表記法で最も問題に なるのはシンパノレ (ハイハツトシンバノレ、 クラッシュシンパノレ、 トップシンバノレ 等) の表記法である。 それ以外の楽器は音高が多少変わる程度である。 伹し、 タ ムは、 個数 (音高数) が変化する (2個、 3個、 4個の場合……) 。 シンバルの 表記法は大きく 2つのタイプに分けられる。 即ち 1つの音高で表現される場合と、 ハイハットとそれ以外を 2つ (以上) の音高に分ける場合である。 また夫々のタ イブにおいて、 更に楽器の種類を符頭の種類を変えて表現する場合と、 ァクセン トのあるなしで表現する場合に分けられる。 2分音符、 全音符を表現するために、 更に別符頭を使う場合もある。 その他文字列により楽器の種類を指定する場合も あり、 加えて曲の先頭で文字列により楽器を指定する場合と、 文字列により領域 分けをする場合、 また全ての音符に文字列による指定を行う場合もある。 There are many different notations for drum notation. Some of the notations are very special, but they are infrequent and not included. The most problematic in drum notation is the notation of sympa noles (such as hihattoshinbanore, crash-simpanore, top-symbanolle). Other musical instruments have a slightly different pitch. However, the number of pitches (pitch number) changes (in the case of two, three, or four…). Cymbal notation is roughly divided into two types. In other words, there is a case where one pitch is expressed and another case where the hi-hat and the rest are divided into two (or more) pitches. In each type, the type of musical instrument can be divided into two types: one with a different notehead type, and the other with or without an accent. In some cases, additional noteheads are used to represent half notes and whole notes. In addition, the type of instrument may be specified by a character string.In addition, the instrument may be specified by a character string at the beginning of the song, the area may be divided by a character string, or the character string may be specified for all notes. In some cases.
上述のように、 本構成の楽譜読み取り装置には、 第 1 7図に示すように、 認識 した結果を表示し、 演奏するためのドラム譜標準パターンがある。 対応楽器は、 クラッシュシンバル (サイ ドシンバルと呼ばれることもある) 、 トップシンバル (ライ ドシンバルと呼ばれることもある) 、 ハイハツトオープン、 ハイハツ トク ローズ、 スネアドラム、 リムショット、 H i g hタム、 M i dタム、 L o wタム、 バスドラム、 ペダルノヽィハットである。 この標準パターンに記号認識した結果を 当てはめなければならない。 また標準パターンが対応している以外の楽器が表記 される場合 (カウベル、 チャイム、 ゴングなど) もあり、 このような場合も適切
な当てはめの対応が必要である。 As described above, the score reading apparatus of this configuration has a drum score standard pattern for displaying the recognized result and performing as shown in FIG. Supported instruments are crash cymbal (sometimes called side cymbal), top cymbal (sometimes called ride cymbal), hi-hat open, hi-hat close, snare drum, rim shot, high tom, mid tom, Low toms, bass drums and pedal no-hats. The result of symbol recognition must be applied to this standard pattern. There are also cases where instruments other than the standard patterns are supported (cowbells, chimes, gongs, etc.). It is necessary to take appropriate measures.
シンバル系以外のドラム楽器の当てはめ手順を以下に説明する。 The procedure for applying a drum instrument other than a cymbal system will be described below.
スネアドラム、 リムショットは、 五線の第 3間に表記されるとして良い。 スネ アドラムは通常黒玉で表現され、 リムショットは(R)等の別符頭の場合や、 黒玉 のまま、 文字列でリムショットを指定する場合がある。 そこで 2回の走査のうち S 1 1の第 1ループで、 第 3間の黒玉はスネアドラムとし、 黒玉以外の符頭はリ ムショットとする。 黒玉以外の符頭が存在したら論理値 r i mO t h e r E X i s tを真にする。 またリムショットを表現する文字列を検索し、 存在したら、 論 理値 r i mS t r E X i s tを真にする。 S 1 3の第 2ループで、 論理値 r i m S t r E x i s tが真で且つ r i mO t h e r E x i s tが偽の場合、 第 3間の 音符を全てリムショットとする。 Snare drums and rim shots may appear between the third lines of the staff. The snare drum is usually represented by a black ball, and the rim shot may be a separate note head such as (R), or the rim shot may be specified as a character string without changing the black ball. Therefore, in the first loop of S11 of the two scans, the black ball between the third is a snare drum, and the noteheads other than the black ball are rim shots. If there is a notehead other than a black ball, the logical value r i mO t h e r E X i st is set to true. Also, a character string representing the rim shot is searched, and if it exists, the logical value rimSt rEXi st is set to true. In the second loop of S13, if the logical value rimStrExiSt is true and rimOthereExiSt is false, all the notes in the third are rim shots.
通常ペダルハイハットは下第 1間に符頭 (X) として表記される。 しかしバス ドラムを避けて下側にずらす場合もある。 そのため誤認識の可能性も考慮し、 第 1線以下の黒玉以外の音符はペダルノヽィハツトとする。 ペダルハイハツトは 1回 のループで設定できる。 Usually the pedal hi-hat is written as a notehead (X) between the lower first. However, there are also cases where it is shifted downward to avoid the bass drum. Therefore, in consideration of the possibility of erroneous recognition, notes other than the black ball below the first line are used as pedal noise. Pedal hi-hat can be set in one loop.
通常バスドラム、 タムは黒玉で表記され、 バスドラムは第 1間、 タムは第 2線 から第 5線の第 3線を除く 1一 4音高に表記される。 しかしバスドラムが下第 1 間に表記されるような表記法も存在する。 このような場合、 L O Wタムが第l間 (即ち通常のバスドラムと同一の音高) に表記される可能性が高い。 このように バスドラムの音高により、 タムの音域が変化するので、 第 1ループでバスドラム の音高を含めて黒玉の存在する音高を検出する。 但し本構成では、 下第 1間より も低い音高は誤認識として削除する。 このため S 1 1の第 1ループで、 黒玉の存 在する音高の、 最下段 (m i n T om) とその 1段上 (m i nTom2 n d) の 2段階、 最高音高 (ma x Tom) を検出し、 且つ下第 1間よりも低い音高の黒 玉音符は削除する。 この時、 タムの最高音高は第 5線までで通常は問題ないが、 本構成では、 誤認識や特殊な表記の可能性を考えて、 検出範囲を上第 2間まで広 げておく。 これらの情報からバスドラムの音高とタムの音高を次のようにして検 出する。 即ち m i nT omが第 1間より低ければ、 バスドラムの音高 (h e i g h t B a s s D r um) を m i nTomとし、 L o wタムの音高 (h e i g h t
L oTom) を m i nT om2 n dとする。 そうでなければ、 バスドラムの音高 は第 1間であり、 この場合、 m i nT omが第 1間であれば、 L owタムの音髙 は m i nTom2 n dとし、 そうでなければ、 L o wタムの音高は m i n T o m である。 また H i g hタムの音高 (h e i g h t H i T o m) は m a x T o mで ある。 次の S 1 3の第 2ループでバスドラム、 タムの実際の設定 (確定) を行う。 即ち、 黒玉で且つ音高が h e i g h t B a s s D r umであればバスドラム、 黒 玉で且つ音高が h e i g h t L o T omであれば L o wタム、 黒玉で且つ音高が h e i g h t H i T o mであれば H i g hタム、 そして黒玉で、 音高が h e i g h t L oTomと h e i g h t H i T omの間で、 第 3間以外の場合、 M i dタ ムとする。 標準パターンでは、 タムは 3種類なので、 4個以上のタムは、 中間を 1種類のタムに割り当てる。 Normally, bass drums and toms are indicated by black dots, bass drums are indicated by the first interval, and toms are indicated by 1 to 4 pitches from the second to fifth lines excluding the third line. However, there is also a notation in which the bass drum is written in the lower part. In such a case, there is a high possibility that the LOW tom is written between the lth (that is, the same pitch as a normal bass drum). As described above, the tom range changes depending on the pitch of the bass drum, and therefore, the pitch including the pitch of the bass drum is detected in the first loop. However, in this configuration, pitches lower than the lower first interval are deleted as erroneous recognition. For this reason, in the first loop of S11, the pitch at which the black ball exists is two steps, the lowest (minTom) and one step above (minTom2nd), the highest pitch (max Tom) Is detected, and a black ball note with a pitch lower than the lower first interval is deleted. At this time, the maximum pitch of the tom is usually no more than the fifth line, but in this configuration, the detection range is extended to the second interval in consideration of the possibility of misrecognition and special notation. From this information, the pitch of the bass drum and the pitch of the tom are detected as follows. That is, if minTom is lower than the first interval, the pitch of the bass drum (height Bass Drum) is set to minTom, and the pitch of the low tom (height Let LoTom) be minTom2nd. Otherwise, the pitch of the bass drum is in the first interval, in this case, if minTom is in the first interval, the low tom pitch is minTom2nd, otherwise, the low tom is Low. Tom's pitch is min Tom. The pitch of the high tom (height Hi Tom) is max Tom. In the second loop of S13, the actual settings (confirmation) of the bass drum and tom are made. That is, if it is a black ball and the pitch is height Bass Drum, a bass drum, if it is a black ball and the pitch is height LoTom, a low tom, and if it is a black ball and the pitch is height Hi If it is Tom, it is a High tom and a black ball, and the pitch is between heightLoTom and heightHiTom. In the standard pattern, there are three types of toms, so for four or more toms, the middle is assigned to one type of tom.
シンバル系のドラム楽器の当てはめ手順を以下に説明する。 上述のようにシン バル系のドラム楽器の表記法は種々有り、 1回のループだけでは当てはめを行う ことはできない。 そこで全ページ、 全段落の全てのドラムパートの認識結果の走 查を 2回 (2回のループ) 行うことで当てはめを決定する。 第 1のループにおい て、 シンバルに該当する音域で、 夫々の音高での夫々の符頭の数などの情報を得 る。 第 2ループの前に、 得られた情報から、 ドラム当てはめ条件に基づいてドラ ム表記当てはめのための変換テーブルを設定する。 第 2ループで変換テーブルを 使って夫々の音符の実際に鳴らす楽器を設定する。 The procedure for applying a cymbal-based drum instrument will be described below. As described above, there are various notations for cymbal-based drum instruments, and it is not possible to perform fitting using only one loop. Therefore, the fit is determined by running twice (two loops) the recognition results of all drum parts in all pages and all paragraphs. In the first loop, in the range corresponding to the cymbal, information such as the number of noteheads at each pitch is obtained. Before the second loop, a conversion table for drum notation fitting is set from the obtained information based on the drum fitting conditions. In the second loop, use the conversion table to set the instrument that actually plays each note.
ドラム譜標準パターンへの当てはめ処理では、 様々な表記法の中から、 前提と できる条件を使って、 妥当な推定を行う。 前提条件は以下のようなものである。 2分音符、 全音符は楽器の特性上、 クラッシュシンバルである確率が高い。 よつ て本構成では、 2分音符、 全音符はクラッシュシンバルであるとして、 表記法の 推定を可能とする。 また符頭 (◊) は、 ドラム譜の歴史上、 2分音符、 全音符と して表記される確率が高い。 よって符頭 (◊) を、 2分音符、 全音符に優先的に 割り当てることによって、 表記法の推定をより妥当なものにすることができる。 全音符が存在した場合、 2分音符は全音符と同じ符頭で表記される確率が高い。 シンバル系のドラム音符の表記は 3つ以上の音高で示される確率は低く、 2つの 音高で示された場合、 下段がハイハット、 上段がクラッシュシンバル、 トップシ
ンバルである。 また上段にクラッシュシンバルとトップシンバルの両方が表記さ れている場合、 トップシンバルの符頭は (X ) で表され、 クラッシュシンバルは それ以外の表記 (符頭を変えるなど) である。 更にシンバル (ハイハットシンパ ル以外) が 1種類しかない場合には、 クラッシュシンバルである d 符頭が (〇) のものは、 ハイハットオープンとして表記され、 記号 ( ° ) が係っていない [或 いは記号 ( + ) が係っている] ハイハツトは、 ハイハツトクローズである。 In the process of fitting to the standard drum notation pattern, a reasonable estimation is made from various notations using prerequisite conditions. The preconditions are as follows. Half notes and whole notes are likely to be crash cymbals due to the characteristics of the instrument. Therefore, in this configuration, it is possible to estimate the notation assuming that the half note and the whole note are crash cymbals. Noteheads (◊) are more likely to be written as half-notes or whole notes in the history of drum staves. Therefore, assigning note heads (◊) to half notes and whole notes preferentially makes the notation estimation more appropriate. If whole notes are present, half notes are likely to be written with the same notehead as whole notes. Cymbal-type drum notes are not likely to be represented by three or more pitches.If they are represented by two pitches, the lower row is a hi-hat, the upper row is a crash cymbal, and the top It is a member. If both the cymbal and top cymbal are written in the upper row, the notehead of the top cymbal is represented by (X), and the crash cymbal is written in other ways (such as changing the notehead). Furthermore, if there is only one type of cymbal (other than the hi-hat cymbal), the crash cymbal whose d- note head is (〇) is indicated as hi-hat open, and the symbol (°) is not related. Is associated with the sign ( + ).] A hi-hat is a hi-hat closed.
以下ドラム譜標準パターンへの当てはめ処理によるシンバル系ドラム楽器の推 定処理を以下に詳述する。 The estimation process of cymbal-based drum instruments by applying the process to the drum standard pattern will be described in detail below.
S 1 1の第 1ループで、 以下の情報について取得する。 In the first loop of S11, the following information is acquired.
i )夫々の音高での夫々の符頭の数 i) the number of each notehead at each pitch
ϋ )夫々の音高での夫々の符頭に 8分音符より短い音符があるかどう )) Whether each notehead at each pitch has a note shorter than an eighth note
iii)夫々の音高での夫々の符頭でァクセントが付いているものの割合 iii) Percentage of each notehead with accent at each pitch
iv)符頭 (◊) の音符が存在するか否かの論理値設定 iv) Set logical value to determine whether note (符) note exists
また符頭 (〇) の音符をハイハットオープンにする処理や、 符頭 (△) ゃ符頭 ( C )をトップシンバルに置き換える処理はここで行う。 Here, the process of opening the note with the notehead (〇) in the hi-hat open and the process of replacing the notehead (△) and the notehead (C) with the top cymbal are performed here.
S 1 1の第 1ループでは夫々の音高での夫々の符頭の数を求めたが、 S 1 2の 第 2ループ前処理では、 この情報テーブルを音高が低い方から走査し、 実際のシ ンバルの音高を求める。 最初に見つかった音高が第 1の音高とし、 次に見つかつ た音高が第 2の音高とし、 それ以降は第 2の音高に正規化する。 但し、 第 1の音 高の音符の数が極端に少ない場合、 音符の誤認識の可能性が高いので、 その音符 は削除指定し、 シンバルの音高の検出結果をずらしても良い。 特にシンバルの音 高が 3段以上になった場合に、 この処理が有効である。 In the first loop of S11, the number of noteheads at each pitch was determined, but in the second loop preprocessing of S12, this information table was scanned from the lowest pitch, Find the pitch of the cymbal. The first pitch found is the first pitch, the second one found is the second pitch, and so on. However, if the number of notes at the first pitch is extremely small, there is a high possibility that a note is erroneously recognized. Therefore, the note may be deleted and the cymbal pitch detection result may be shifted. This process is especially effective when the pitch of the cymbal is three or more steps.
次にドラム当てはめ変換テーブルを作成する。 変換テーブルは、 2つの音高で、 夫々の符頭の種類とアクセント等の係りの状態に応じて場合分けされた要素につ いて、 音符がその状態であった場合の割り当て楽器の種類を書き込めるようにす る。 Next, a drum fitting conversion table is created. The conversion table can write the type of instrument assigned when the note was in that state, for the two pitches, for the elements classified according to the type of note head and the relation of accent etc. So that
音符状態の場合分けとしては、 C T— P E K E— NU N [符頭 (X ) で係りな し] 、 C T— P E K E— C L S [符頭 (X ) で ( + ) が係っている] 等のように なる。 また楽器割り当ての種類としては、 D N HH C L O S E (ハイハツトク
ローズ) 、 DN_S I DEHALF (クラッシュシンバルの 2分音符) などであ る。 検出されたシンバルの音高数等によって、 表記をタイプ分けし、 夫々のタイ プに応じて変換テーブルに楽器を割り当てる。 タイプ分けは、 例えば下記表 1に 示すとおりである。 There are different types of note states, such as CT—PEKE—NU N [not involved with notehead (X)], CT—PEKE—CLS [( + ) is concerned with notehead (X)], etc. become. The type of instrument assignment is DN HH CLOSE Rose), DN_S I DEHALF (half note of a crash cymbal). Notations are classified according to the number of pitches of the detected cymbals, and instruments are assigned to the conversion table according to each type. The classification is, for example, as shown in Table 1 below.
【表 1】 【table 1】
また変換テーブルへの楽器の割り当ては、 上記処理前提に基づいて、 最も妥当 なものを当てはめる。 The most appropriate instrument is assigned to the conversion table based on the above processing assumptions.
即ち、 タイプ 1なら、 全てハイハットであるとするのが妥当である。 もちろん 前提条件により、 通常はハイハットクローズで、 ( ° ) が係っていれば、 ハイハ ットオープンとする。 In other words, if it is type 1, it is reasonable to assume that all are hi-hats. Of course, due to the preconditions, hi-hat is normally closed, and if (°) is involved, hi-hat is open.
タイプ 2では、 符頭 (X) 以外はクラッシュシンバルの 2分音符 (全音符) と するのが妥当である。 この場合、 符頭 (X) でアクセント付きのものはクラッシ ュシンバルとする。 変換テーブルの CT— PEKE— ACC [符頭が (X) で、 且つアクセント付き] を、 DN一 S I DE (クラッシュ.シンバル) 、 符頭 (X) 以外の変換テーブルを DN— S I DEHALF (クラッシュシンバルの 2分、 全 音符) に設定する。
タイプ 23では、 下段は全てハイハットシンバルとし、 上段については、 以下 のようになる。 For type 2, it is reasonable to use crash cymbal half notes (whole notes) except for the notehead (X). In this case, noteheads (X) with accents are considered classical cymbals. Conversion table CT— PEKE— ACC [note head (X) and accented], DN- SI DE (crash. Cymbal), conversion table other than note head (X) DN— SI DEHALF (crash cymbal) 2 minutes, whole note). In Type 23, the lower row is all hi-hat cymbals, and the upper row is as follows.
符頭 (X) はトップシンバルとする。 The notehead (X) is the top cymbal.
また全音符が存在し、 全音符と同じ符頭が全音符以外に存在すれば、 全音符は クラッシュシンバルの全音符であり、 全音符と同じ符頭の音符をクラッシュシン バルの 2分音符、 全音符と異なる符頭 (もう一方) をクラッシュシンバルとする。 全音符が存在し、 全音符と同じ符頭が全音符以外に存在しないか、 全音符が存 在しない場合、 符頭 (◊) が存在すれば、 符頭 (◊) をクラッシュシンバル 2分 音符、 もう一方をクラッシュシンバルの 4分音符とし、 符頭 (◊) が存在しなけ れば、 数が少ない方をクラッシュシンバル 2分音符、 もう一方をクラッシュシン バルの 4分音符とする。 Also, if there is a whole note and the same notehead as the whole note exists other than a whole note, the whole note is a whole note of the crash cymbal, a note with the same notehead as the whole note is a half note of the crash cymbal, A note head different from the whole note (the other) is a crash cymbal. If a whole note is present and the same notehead as the whole note does not exist except for the whole note, or if there is no whole note, the notehead (◊) will crash the notehead (◊) if there is a cymbal cymbal. The other is a cymbal cymbal quarter note, and if there is no notehead (◊), the smaller number is a cymbal cymbal quarter note and the other is a crash cymbal quarter note.
全音符が存在しなくて、 符頭 (◊) が存在すれば、 符頭 (◊) をクラッシュシ ンバノレ 2分音符、 もう一方をクラッシュシンバノレ 4分音符とする。 If a whole note does not exist and a notehead (◊) is present, the notehead (◊) is a crash cymba-nore quarter note and the other is a crash cymba-nore quarter note.
上記表記法は、 最も確率が高いものであるが、 例えばタイプ 2では符頭 X以外 がクラッシュシンバルの 4分音符であり、 符頭 (X) にァクセントが付いたもの がハイハツトである場合もあり得る。 The above notation is the most probable, but for example, in Type 2, other than the notehead X is a quarter note of the crash cymbal, and the notehead (X) with an accent is a hihat. obtain.
第 2ループの前処理が終えて S 1 3の第 2ループで楽器の割り当てがなされる。 即ち認識結果を走査しながら、 夫々の音高の夫々の符頭、 記号の係り具合に対応 して、 変換テーブル上の楽器を割り当てる。 そして変換テーブルの値が DN_S I DEHALF等の 2分音符を指定している場合、 推定前に元々 4分音符として 認識さている場合には音符 I Dを 2分音符に変換する。 また変換テーブルに削除 の指定 (DN— MATCH I NGNONE) があった場合には、 認識記号を削除 する ( I D= I D— DELETED) 。 After the preprocessing of the second loop is completed, instruments are assigned in the second loop of S13. That is, while scanning the recognition result, the musical instruments on the conversion table are assigned according to the relation between the noteheads and symbols of each pitch. If the conversion table value specifies a half note such as DN_S I DEHALF, and if it is originally recognized as a quarter note before estimation, it converts the note ID to a half note. If the conversion table is specified to be deleted (DN—MATCH I NGNONE), the recognition symbol is deleted (ID = ID—DELETED).
上記走査中に文字列による楽器の指定を認識して変換テープノレ上の楽器を割り 当てることも行われる力 シンバルの文字列は、 " r i d e c y m" 、 " s i d e c ym" 、 " t . cノ' 、 " c . c . " 等で、 文字列同士類似しており、 誤認の危 険性が高い。 このため、 ドラム譜に表記される文字列を全て辞書ィヒし、 認識結果 を全て反映させるのは危険である。 よって、 文字列の辞書を誤認識の確率の低い ものだけに制限し、 文字列の効果も制限することが妥当である。 本構成では、 文
字列を" t o p " だけにし、 効果を、 クラッシュシンバルが 2分 ·全音符なしで 指定されている時に、 通常クラッシュシンバルとするところをトップシンバルと する場合と、 ハイハツトシンバルが ( ° ) ( + ) の係りなしに指定された時に、 通常ハイハツトシンバルとするところをトップシンバルとする場合の 2通りのみ とする。 この 2通りの場合の両方に該当する場合には、 どちらか表記の確率が高 い方にする。 During the above scanning, it is also possible to assign the instrument on the conversion tape by recognizing the designation of the instrument by the character string. The character string of the force cymbal is "ridecym", "sidecym", "t.cno", " c. c. ", etc., the strings are similar to each other, and the risk of misidentification is high. Therefore, it is not possible to dictionary all the strings written on the drum notation and reflect all the recognition results. Therefore, it is reasonable to limit the dictionary of character strings to only those with a low probability of misrecognition and limit the effect of the character strings. If the character string is only "top" and the effect is specified with a crash cymbal of 2 minutes and no whole note, the top cymbal where the crash cymbal is usually set and the hi-hat cymbal will be (°) ( + ) If there is no specification, there are only two cases where the top cymbal is the place where the hi-hat cymbal is normally set. If both of these two cases apply, the one with the higher probability of notation should be used.
その他符頭 (△) ゃ符頭(C )を認識可能にしている。 これらは通常カウベルや カップであり、 標準パターンには存在しない。 よって当てはめ処理で変換テープ ルに削除を指定して消してしまうことも考えられる。 また、 タンパリン等のパー カツシヨン類がドラム譜上に表記されている場合にも、 第 3線上の (X ) 符頭等、 当てはめ処理で対応していなレ、表記の場合には、 特別な処理を行わなければデー タ上から削除される。 しかしこのような音符を単純に削除すると、 リズムが成り 立たない場合もあるので、 トップシンバル等で置き換えることもできる。 また同 様に音符を単純に削除すると、 リズムが成り立たない場合があるので、 削除の代 わりに、 同じ音長の休符と置き換えることも考えられる。 Other note heads (△) ゃ Recognize note heads (C). These are usually cowbells and cups and are not present in the standard pattern. Therefore, it is conceivable that the conversion process deletes the conversion table by specifying deletion. Also, even if percussion such as tampaline is written on the drum notation, special processing is required if it is not supported by the fitting process, such as the (X) notehead on the third line. Otherwise, the data will be deleted from the data. However, simply deleting such notes may not be able to achieve the rhythm, so they can be replaced with top cymbals. Similarly, simply deleting a note may not be able to achieve the rhythm, so instead of deleting the note, it is conceivable to replace it with a rest of the same duration.
このようにして楽器の割り当てがなされたら、 ステップ S 1 4において、 上記 の楽譜認識から明らかになつているドラム譜の音符の音高 ·音長に基づき、 演奏 及び/又は表示可能な楽譜データ形式に変換する。 After the musical instruments have been assigned in this manner, in step S14, the musical score data format that can be played and / or displayed based on the pitches and durations of the notes of the drum notation that are evident from the musical score recognition described above. Convert to
以上のようにしてドラム譜の表記を認識することにより、 ユーザに負担をかけ ずにドラム譜を認識して演奏を行うことが可能になる。 またドラム譜に関する知 識のないユーザにも、 その利用が可能となる。 上記実施形態構成の他、 以下のような他の実施形態構成も考えられる。 By recognizing the notation of the drum notation as described above, it becomes possible to recognize and perform the drum notation without burdening the user. Also, users who do not have knowledge of drum scores can use them. In addition to the configuration of the above-described embodiment, the following other embodiment configuration is also conceivable.
(実施形態 2 ) (Embodiment 2)
ドラム譜への音符その他の記号の貼り付けに関して、 標準パターンを設け、 標 準パターン形式での貼り付け以外はできないような構成であると、 市販楽譜と異 なる表記で貼り付けることが必要となり、 認識結果の修正も、 元楽譜を基準とす ることができない。 楽譜通りにどんな表記も可能にするィンターフェースを設け、 演奏時に、 上記当てはめアルゴリズムで表記法を推定し、 演奏する楽器を特定す
るようにすれば、 認識結果の修正は、 元楽譜と同じ状態になるようにすれば良い ことになる。 If a standard pattern is provided for pasting notes and other symbols to the drum score, and if it is not possible to do anything other than pasting in the standard pattern format, it will be necessary to paste with a notation different from commercial music score, Correction of the recognition result cannot be based on the original score. Provide an interface that allows any notation as in the score, and when performing, estimate the notation using the above-mentioned fitting algorithm and identify the instrument to be played. Then, the recognition result should be corrected so that it is in the same state as the original score.
(実施形態 3 ) (Embodiment 3)
本構成では、 文字列により、 曲の途中で音色 (ドラム楽器) を変更する表記法 に対応させている。 このような表記法で特に問題になるのは、 スネアドラムとリ ムショットの変更、 クラッシュシンパノレと トップシンバルの変更、 ノヽイノヽットと トップシンパ の変更である。 In this configuration, a character string is used to support notation that changes the timbre (drum instrument) in the middle of a song. Of particular concern with this notation are changes to snare drum and rim shots, changes to crash sympanole and top cymbals, and changes to noise notes and top sympa.
処理はスネアドラム · リムショットの場合とその他の場合 (シンバル) との 2 種類に分ける。 そして夫々で実際に文字列による曲の途中での音色変更が行われ ているかの判定を行う。 またシンバルの場合には、 どちらの変更かを判定しなけ ればならない。 文字列の時系列での反映の実現のため、 この実施形態では、 認識 する文字列を、 リムショッ ト、 トップシンバルの他に、 スネアドラム、 クラッシ ュシンバル、 ハイハツ トシンバル等も追加する。 更に文字列に付随する括弧等の 範囲指定も認識する手段も追加する。 その場合に、 後に行う時系列整列の基準と なるホットスポットを、 括弧の始点 (左端) とする。 括弧の範囲指定は、 第 1 8 図( a )のように終端のある場合と、 同図(b )のように終端のない場合を区別して 認識している。 そして終端のある文字列の場合、 時系列走査の際に基準とできる ように、 括弧の右端をホットスポットとする文字列終端用の I Dを持つ別の記号 データを追加する。 また文字列の括弧による範囲指定の終端が分離して表記され る場合に備えて、 第 1 8図(c )に示されるような終端括弧も認識する。 この場合 には時系列整列の基準ホットスポットを括弧の右端とする。 更に範囲指定なしの 文字列の場合、 音符に対して後ろ (右) にずれる場合があるので、 ホットスポッ トを時系列的に少し前 (左) にずらすことも考えられる。 Processing is divided into two types: snare drum / rim shot and other cases (cymbals). Then, it is determined whether or not each of the timbres is actually changed in the middle of the music by the character string. In the case of a cymbal, you must determine which change. In this embodiment, a snare drum, a classic cymbal, a hi-hat cymbal, and the like are added to the character string to be recognized in addition to the rimshot and the top cymbal in order to realize the reflection of the character string in a time series. In addition, a means to recognize the range specification such as parentheses attached to the character string is added. In this case, the hot spot that becomes the reference for time series sorting performed later is the starting point (left end) of the parentheses. The parenthesized range specification is recognized by distinguishing between the case where there is a terminal as shown in Fig. 18 (a) and the case where there is no terminal as shown in Fig. 18 (b). In the case of a character string with a terminator, another symbol data with an ID for terminating the character string with the right end of the parenthesis as a hot spot is added so that it can be used as a reference for time-series scanning. It also recognizes terminal brackets as shown in Fig. 18 (c), in case that the end of the range specification by the parentheses of the character string is described separately. In this case, the reference hot spot for chronological ordering is the right end of the parentheses. Furthermore, in the case of a character string without a range, the hot spot may be shifted slightly forward (left) in chronological order because the note may be shifted backward (right) from the note.
このようにして認識された結果を時系列に整列しておく。 The results recognized in this way are arranged in chronological order.
スネアドラム · リムショットの音色変更の処理は次のようにして行われる。 ま ず認識結果を時系列的な先頭から走査する。 音色保存データ s n a r e O r R i mの初期値を D N— S NA R Eとする。 第 3間の黒玉が存在したら、 d r u mN o t eに s n a r e O r R i mの値を書き込む。 スネアドラムを表す文字列又は
リムショットを表す文字列が存在したら、 s n a r e O r R i mに D N— S N A R E又はD N—R I Mを書き込む。 又終端 I Dが検出された場合には、 現在の s n a r e O r R i mとは逆の値に書き換える。 そして繰り返し小節線終端等が存 在した場合に s n a r e O r R i mの変更を行っても良い。 他方、 第 3間の開始 位置以外の音色指定が、 スネアドラムを表す文字列とリムショットを表す文字列 のどちらか一方しか存在しなかった場合と、 両方の文字列が交互に存在する場合 に、 処理を変更することも考えられる。 即ち両方の文字列が存在する場合は、 終 端を考慮しなくて良い。 The process of changing the tone of the snare drum rim shot is performed as follows. First, the recognition result is scanned from the top in time series. The initial value of the tone storage data snare Or Rim is DN—SNA RE. If there is a third black ball, write the value of snare Orim to dru mN ote. A string representing a snare drum or If there is a character string representing the rim shot, write DN-SNARE or DN-RIM in snare Or Rim. When the terminal ID is detected, the value is rewritten to a value opposite to the current snare_or_Rim. Then, when there is a repeated bar line end or the like, snare Or Rim may be changed. On the other hand, when the tone specification other than the start position between the third is only one of the character string representing the snare drum and the character string representing the rim shot, and the case where both character strings are alternately present, However, it is conceivable to change the processing. In other words, if both character strings exist, the end does not need to be considered.
シンバルの音色変更の処理は以下のようにして行われる。 トップシンバル、 ク ラッシュシンバル、 ハイハツトの場合には、 文字列でクラッシュシンバルと トッ プシンバルを交換する場合と、 ハイハツトシンバルと トップシンバルを交換する 場合があり、 文字列での楽器変更を行っているかの判定と同時に、 どちらの楽器 変更かを判別しなければならない。 The process of changing the tone color of a cymbal is performed as follows. For top cymbals, crash cymbals, and hi-hats, there are cases where the clash cymbal and top cymbal are exchanged with a character string, and where the hi-hat cymbal and top cymbal are exchanged. At the same time, you must determine which instrument to change.
以下の処理は、 表記法推定時に夫々のタイプ (例えば上記表 1に示したタイプ 2 3等) に応じて変換テーブルに楽器を割り当てる工程 (表 1の後に続く記載を 参照) の後に追加的に実施する (但しトップシンバルを表す文字列の処理を行わ ない) 。 この処理の結果を 「1回目の推定結果」 とする。 The following processing is performed after the step of assigning instruments to the conversion table according to each type (for example, type 23 shown in Table 1 above) at the time of notation estimation (see the description following Table 1). Execute (however, do not process the character string representing the top cymbal). The result of this processing is referred to as “first estimation result”.
まずシンバルの音高が 2つの場合には、 ハイハツトとトップシンバルの交換は あり得ない。 また 1回目の推定結果で、 既にクラッシュシンバルと トップシンパ ルが両方存在している場合には、 文字列での楽器交換を行わない。 シンバルの音 高が 1段の場合も、 1回目の推定結果でクラッシュシンバルと トップシンバルが 両方存在している場合には、 ハイハツトシンバノレとトップシンバルの交換と推定 できる。 そうでない場合、 時系列での認識結果走查を 1度行い、 トップシンバル を表す文字列で指定された領域で、 1回目の推定結果での、 ハイハットシンバル とクラッシュシンバルの音符数を計数し、 ハイハットシンバルが多ければ、 ハイ ハットシンバルと トップシンバルの交換と判定し、 そうでなければ、 クラッシュ シンバルと トップシンバルの交換と判定する。 この判定では、 ハイハットシンパ ルの方が、 基本的にクラッシュシンバルよりも数が多いということを考慮して、 ハイハットシンバル、 クラッシュシンバルの数の大小ではなく、 全体の数に対す
るクラッシュシンバルの割合をしきい値により判定しても良い。 First, if the cymbal has two pitches, there is no exchange between the hi-hat and the top cymbal. If the first estimation results show that both the cymbal and the top cymbal already exist, the instrument is not exchanged using a character string. Even when the cymbal has one pitch, if both the crash cymbal and the top cymbal are present in the first estimation result, it can be estimated that the hihat cymbal and the top cymbal are exchanged. Otherwise, run the recognition result in time series once, count the number of notes of the hi-hat cymbal and the crash cymbal in the first estimation result in the area specified by the character string representing the top cymbal, If there are many hi-hat cymbals, it is determined that the hi-hat cymbal and the top cymbal are exchanged. Otherwise, it is determined that the crash cymbal and the top cymbal are exchanged. In this judgment, considering that the number of hi-hat cymbals is basically larger than the number of crash cymbals, the number of hi-hat cymbals and crash cymbals is not May be determined based on a threshold value.
交換方式が決定したら、 もう 1度時系列走査を行い、 スネアドラム、 リムショ ッ 卜の処理と同様に楽器の変更を行う。 ハイハツトシンバルと トップシンバルの 交換であれば、 1回目の推定結果でハイハツトシンバルとされたものをトップシ ンバルと交換する。 クラッシュシンバルと トップシンバルの交換であれば、 1回 目の推定結果でクラッシュシンバルとされたものをトップシンバルと交換する。 Once the exchange method has been determined, perform another time-series scan and change the instrument in the same way as for the snare drum and rim shot. In the case of exchanging the hi-hat cymbal and the top cymbal, the one that was regarded as the hi-hat cymbal in the first estimation result is exchanged for the top cymbal. In the case of exchanging a crash cymbal with a top cymbal, the crash cymbal determined in the first estimation result is exchanged for a top cymbal.
(実施形態 4 ) " ドラムパートの指定をユーザに行わせず、 自動でドラムパートであるかどうか を認識させる。 スコア譜では、 五線の左にパート名が文字列表記されることが多 いので、 この文字列を認識すれば、 ドラムパートを自動認識できる。 また音符認 識で、 黒玉 · 白玉以外に、 ドラム符頭も認識可能とし、 認識後、 ドラム符頭の数 によってドラムパートを認識することもできる。 この場合、 誤認識の可能性や、 通常楽譜に手拍子等が (X ) .符頭で表記されるような場合を考慮して、 ドラム符 頭の数にしきい値を設ける。 ユーザに、 ドラムパートが存在するかどうかだけを 指定させれば、 五線の左の文字列の認識や、 通常楽譜でのドラム符頭の認識等の、 ドラム譜が存在しない場合に無駄になる処理や、 誤認識の危険性を回避すること ができる。 またドラムパートが存在することが指定されていれば、 単純に段落の 最も下のパートをドラム譜と指定することもできる。 (Embodiment 4) "The user does not specify a drum part, but automatically recognizes whether or not it is a drum part. In a score, a part name is often described as a character string to the left of the staff. By recognizing this character string, the drum part can be recognized automatically.In addition to the note recognition, in addition to black and white balls, drum heads can also be recognized, and after recognition, the drum part can be recognized according to the number of drum heads. In this case, a threshold value is set for the number of drum note heads, taking into account the possibility of misrecognition and the case where clapping and the like are usually indicated by (X). By letting the user specify whether or not a drum part exists, it is useless when there is no drum notation, such as recognition of the character string to the left of the staff and recognition of the drum head in normal music. Processing and risk of misrecognition It can be avoided. Also if it is specified that the drum part is present, it is also possible to simply specify the lowermost part of the paragraph and drum notation.
(実施形態 5 ) (Embodiment 5)
曲のテンポによって、 クラッシュシンバルと トップシンバルの割り当てを変化 させる。 曲のテンポが遅い場合、 曲調が静かな場合が多く、 このような場合に、 通常クラッシュシンバルを使うような状況でトップシンバルを使用し、 柔らかい アクセントを付けるような奏法を行うのが一般的である。 しかしこれが文字列等 で明記されていることは少ない。 よってテンポからこのような状況を推定する。 即ちテンポがある値より遅く、 且つ表記法の楽器の割り当てで、 トップシンパノレ の割り当てがなかった場合、 通常クラッシュシンバルとするところを、 トップシ ンバルとする。 なお、 テンポはテンポ記号を認識しているので判別できる。
(実施形態 6 ) The assignment of the crash cymbal and the top cymbal varies depending on the tempo of the song. When the tempo of a song is slow, the tone of the song is often quiet, and in such a case, it is common to use a top cymbal in a situation where a crash cymbal is normally used and to perform a soft accent. is there. However, this is rarely specified in character strings. Therefore, such a situation is estimated from the tempo. In other words, if the tempo is slower than a certain value and the notation is assigned to the instrument, and there is no top sympanole assigned, the part that would normally be the crash cymbal is the top cymbal. The tempo can be determined because the tempo symbol is recognized. (Embodiment 6)
文字列の認識率、 特にドラム譜の認識に特ィヒした文字列の認識の高精度化を行 う。 例えば" r i d e c y m" と" s i d e c y m" は 1字違いで意味が大き く変わってしまう。 従って例として、 " i d e c y m" が認識されたら 8文字中 7文字がマッチしていると言うことで、 文字列の認識成功として単純にどちらか 辞書中の記載順が早い文字列に落とすような処理では問題がある。 そこで文字列 中の注意すべき文字の位置を辞書に保存する。 そして上記文字位置の文字の認識 が失敗している場合には、 文字列認識結果に落とさない処理をなし、 その位置に 存在する可能性のある文字の内、 最もマッチング度が高いものを検出し、 精度を 上げる (例としては、 rと sのマッチング度を比較し、 sが高かったら、 " s i d e c y m にする 。 To improve the accuracy of character string recognition, especially character string recognition especially for drum music recognition. For example, "ridecym" and "sidecym" are significantly different in meaning due to the difference of one character. Therefore, as an example, when "idecym" is recognized, 7 out of 8 characters are matched, so that a successful recognition of the character string is simply performed to drop the character string in the dictionary in the earlier order. Then there is a problem. Therefore, the positions of the characters to be noted in the character string are stored in the dictionary. If the recognition of the character at the above character position has failed, a process that does not reduce the character string recognition result is performed, and the character with the highest matching degree among the characters that may exist at that position is detected. , Increase the precision (for example, compare the degree of matching between r and s, and if s is high, change to "sidecym".
(実施形態 7 ) (Embodiment 7)
ここでは、 請求の範囲 1 7〜 3 6に記載された発明の実施形態につき説明する。 上述した実施形態 1におけるドラム符頭の認識では、 通常の楽譜と同じ黒玉は、 通常楽譜同様に、 五線の線などを消去して行う太細分離処理及び黒玉部分の認識 のための楕円検出処理により行い、 またドラム楽譜における白玉の出現確率は低 いので、 認識を行わないことは既に説明したとおりである。 それに対し、 黒玉 ' 白玉以外のドラム譜の符頭は (X、 O) 等、 細線で描かれており、 またこの他に も色々なタイプが存在するので、 黒玉の検出の場合と同様に、 太細分離処理及ぴ 楕円検出処理で検出することができない。 そのため、 符尾を消去した上で符頭ラ ベル (対象とする記号を認識するために設定された矩形) を分離し、 符尾候補 Here, embodiments of the invention described in claims 17 to 36 will be described. In the drum note head recognition according to the first embodiment described above, the black ball, which is the same as the normal score, is used for the thick and thin separation processing performed by erasing the staff lines and the like and the black ball portion recognition as in the normal score. As described above, the recognition is not performed because the detection is performed by the ellipse detection process and the probability of white balls appearing in the drum music is low. On the other hand, note heads of drum staves other than black ball 'white ball' are drawn with thin lines such as (X, O), and there are various other types. In addition, it cannot be detected by the thick / fine separation processing and the ellipse detection processing. Therefore, after removing the stems, the notehead labels (rectangles set to recognize the target symbol) are separated,
(符尾と仮にされるもの) を走査して符尾候補周辺にある検出されたラベルを辞 書とマッチングすることにより行う。 伹し符尾消去により符頭が複数のラベルに 分断されてしまうことがあるので、 マッチングが失敗した場合、 更に、 符尾候補 の走査を続けて次に検出された符頭ラベルと前記分離ラベルとの結合処理を行つ た後、 辞書とのマッチングを再度行う。 この他、 ドラム譜の認識及び結合処理に おいては、 特有なものが存在するので、 それらについては後に述べる。 尚、 ドラ
ム譜における黒玉の和音 (黒玉の接触がある場合) は少ないので、 前述した楕円 検出処理ではなく、 上述のラベル分離によるマッチングによって符頭を検出する こともできる。 そして、 認識対象符頭は、 前述のように第 1 5図に示されるもの となる。 This is done by scanning (provisioned as stems) and matching the detected labels around the stem candidates with the dictionaries.尾 Since noteheads may be broken into multiple labels due to stem erasure, if matching fails, further scan the stem candidates and continue with the next detected notehead label and the separation label. After performing the join processing with, matching with the dictionary is performed again. In addition, there are unique drum recognition and combining processes, which will be described later. In addition, Dora Since the number of chords of the black ball in the musical score (when there is contact with the black ball) is small, note heads can also be detected by matching by label separation described above, instead of the ellipse detection processing described above. The notehead to be recognized is as shown in FIG. 15 as described above.
以下、 本楽譜認識装置の構成におけるドラム譜の楽譜認識方法の詳細を説明す る。 その認識の前提として、 スキャナ 1 2で読み取られた楽譜画像を 1 ドット 1 バイトで取得しておき、 そのうちの 1ビットを元画像のプレーン (b i t S r c ) とする。 Hereinafter, the details of the method of recognizing the score of a drum score in the configuration of the present score recognition apparatus will be described. As a prerequisite for this recognition, a score image read by the scanner 12 is acquired at one dot and one byte, and one bit is used as a plane (bitSrc) of the original image.
( 1 ) 通常の音符の検出方法(白玉以外) (1) Normal note detection method (other than white ball)
白玉を除く通常音符の検出 (黒玉の検出) は、 Normal note detection (white ball detection) excluding white ball is
①太細分離処理 ① Thick and fine separation processing
元画像のプレーン (b i t S r c ) を、 通常音符用及びドラム音符用に、 別の 2つのビットプレーン (b i t T i c、 b i t D r m) にコピーする。 コピーさ れた 2つのビットプレーンにおいて、 五線消去処理を行う。 但し元画像のプレー ン (b i t S r c ) における五線消去は行わない。 楽譜画像を横方向に走査し、 コピーされたビットプレーンのうちの 1つ (b i t T i c ) から短いランを消去 する。 縦方向も走査し、 短いランを消去する。 残った部分は、 楽譜上の太い構成 要素 (黒玉符頭、 連鈎など) を構成している。 Copy the original image plane (bitSrc) to two other bitplanes (bitTic, bitDrm) for normal and drum notes. Perform staff erasure processing on the two copied bit planes. However, staff elimination in the original image plane (bitSrc) is not performed. Scans the score image horizontally, eliminating short runs from one of the copied bitplanes (bitTic). It also scans vertically, eliminating short runs. The remaining parts make up the thick components on the music score (black ball head, hook, etc.).
②符尾検出 ② Stem detection
横方向走査で消去した短いランのビットを使用して、 縦方向の細線を検出する。 Detects fine vertical lines using short run bits erased by horizontal scanning.
③符頭検出 ③ Note head detection
上記縦の細線 (以下符尾候補という) の周辺を走査しながら、 太部分が存在し た場合、 この太部分の境界線を検出し、 あるインターバルで座標を投票し、 楕円 式を計算する。 この楕円式が符頭として妥当な形であれば、 楕円保存データ (e p ) に追加する。 If a thick part exists while scanning around the above vertical thin line (hereinafter referred to as stem candidates), the boundary line of this thick part is detected, coordinates are voted at certain intervals, and the elliptic equation is calculated. If this elliptic equation is valid as a notehead, add it to the ellipse storage data ( ep ).
④符尾結合 ·認識 ④ Stem couplingRecognition
上記符尾候補と楕円が音符として妥当な位置関係にあるかどうかを判別し、 妥 当であれば、 符尾との結合処理を行った上で、 音符として、 認識結果に追加する。 という手順で、 行われる。
認識した黒玉は、 次に行われるドラム符頭認識の対象にならないように、 コピ 一されたもう 1つのビットプレーン (b i t D r m) から消去しておく。 また小 音符は誤認の危険性が高いので、 認識しないか、 あるいは消去を行わないなどの 処置を行う方が良い。 It is determined whether or not the stem candidate and the ellipse are in a proper positional relationship as a note, and if appropriate, are combined with the stem, and then added to the recognition result as a note. It is performed in the procedure as follows. The recognized black ball is deleted from the other copied bit plane (bit D rm) so that it is not subject to the next drum note recognition. Since small notes have a high risk of misidentification, it is better to take measures such as not recognizing them or deleting them.
( 2 ) ドラム音符の認識基本処理 (2) Drum note recognition basic processing
①符頭ラベル分離 ① Note head label separation
ドラム音符用のビットプレーン (b i t D r m) の符尾候補の左右のラベルビ ットを、 第 1図に示すように、 ある幅で消去する。 そうすると、 ドラム符頭のラ ベルが符尾と分離できる。 しかし場合によっては、 第 2図に示すように、 符頭の ラベルが複数のラベルに分離してしまう場合もある。 そのため、 後述するように ラベル結合を行いながら、 認識を行う。 The left and right label bits of the stem candidates of the drum note bit plane (bitDrm) are erased with a certain width as shown in Fig.1. Then the label of the drum note head can be separated from the stem. However, in some cases, notehead labels may be split into multiple labels, as shown in Figure 2. Therefore, recognition is performed while performing label combining as described later.
② マッチング ② Matching
符尾候捕の周りを走査しながら、 ビットプレーン (b i t D r m) のラベルを 検出する。 検出されたラベル矩形を左右に少し広げ、 この矩形中にあるプレーン ( b i t S r c ) を辞書とのマッチングの対象とする。 矩形を左右に少し広げる のは、 符尾のノイズを減らすための処理である。 即ち、 検出されたラベルと符尾 との距離が近いために、 矩形そのままだと、 符尾の一部が認識対象に入ったり入 らなかったりし、 辞書とのマッチングが大きく変わってしまうので、 矩形を広げ、 符尾を認識対象に入れてしまうようにしている。 また、 対象ビットプレーンを b i t D r mではなく b i t S r cにするのは、 五線消去の状態がマッチングに影 響しないようにするためである。 Detect labels on bit-planes (bitDrm) as they scan around the tails. The detected label rectangle is spread slightly to the left and right, and the plane (bitSrc) in this rectangle is targeted for dictionary matching. Spreading the rectangle slightly to the left and right is a process to reduce stem noise. That is, since the distance between the detected label and the stem is short, if the rectangle is left as it is, some of the stems may or may not enter the recognition target, and the matching with the dictionary will be greatly changed. The rectangle is expanded so that stems are included in the recognition target. The reason why the target bit plane is set to bitSrc instead of bitDrm is to prevent the state of staff elimination from affecting matching.
そして該矩形 (ラベル) 内の b i t S r cを辞書とマッチングする。 マツチン グの方式はどのようなものでも良い。 Then, bitSrc in the rectangle (label) is matched with the dictionary. Any matching method may be used.
マッチングのための辞書は、 符頭と符尾、 五線の接触状態の組み合わせにより、 1つの符頭種類に、 複数の I Dを用意する。 マッチング後、 I Dの統合処理を行 う。 即ち第 1 9図及び第 2 0図に示すように、 符頭が五線と交差した場合及び符 尾と交差した場合、 更にこれらが組み合わされて、 1つの符頭種類に、 複数の I Dが用意される。 この時認識対象ラベノレ (辞書とマッチングするラベル) は、 第 2 1図に示すようになる。 これらを別 I Dとして辞書とマッチングし、 最終的に
符頭 (X ) という 1つの I Dに統合する。 これらのパターンを最初から 1つの I Dとしても良いが、 そうすると、 1つの I Dへの登録パターンが膨大になる。 従 つて上記のように、 五線との交差 ·符尾との交差によつて分類しておいた方が、 I Dあたりのパターン数が少なくなり、 辞書作成時に整理がし易くなる。 For the dictionary for matching, multiple IDs are prepared for one notehead type by the combination of noteheads, stems, and staves. After matching, ID integration processing is performed. That is, as shown in Fig. 19 and Fig. 20, when the notehead intersects with the staff and intersects with the stem, these are combined and more than one ID is assigned to one notehead type. Be prepared. At this time, the recognition target label (label matching the dictionary) is as shown in Fig. 21. Match these with the dictionary as separate IDs, and finally Merge into a single ID, notehead (X). These patterns may be used as one ID from the beginning, but then the number of registration patterns for one ID becomes enormous. Therefore, as described above, if the classification is made based on the intersection with the staff and the intersection with the suffix, the number of patterns per ID is reduced, and it becomes easier to organize the dictionary.
マツチングをとるかどうかを矩形のサイズによって判断する。 例えば縦幅が符 頭よりも明らかに小さい矩形は、 マッチングを取るまでもないので、 後述のラベ ル結合処理に移る。 また横幅が広い場合は、 符頭にタイが連結した場合が考えら れるので、 後述のタイ消去処理を行う。 この処理が失敗し、 矩形が大きいままの 場合は、 最初からマッチング失敗とし、 ラベル結合処理もリセットする。 Whether or not matching is to be performed is determined based on the size of the rectangle. For example, a rectangle whose height is clearly smaller than the notehead does not need to be matched, so the process proceeds to the label combining process described later. If the width is wide, a tie may be connected to the notehead, so the tie elimination process described later is performed. If this process fails and the rectangle remains large, the matching fails from the beginning and the label binding process is reset.
③ ラベノレ結合 ③ Ravenore coupling
符頭辞書とラベルとのマッチングをとり、 マッチングしなかった場合 (I D— MA T C H I N G N O N E ) 、 ラベルの走査を続け、 次に検出されたラベルと結 合させて、 再認識 (再度辞書とマッチング) する。 但し結合に使用した第 2のラ ベル自体で一度マッチングを行い、 マッチング結果の I Dの優先度が最大であれ ば、 こちらを優先する。 またラベルの結合の最大サイズ (d x t ) のリセットと、 ラベル結合のリセット (ラベル結合可の状態にする) を行い、 新たな結合を開始 する縦の距離 (d y t ) も設定する。 更に、 認識結果の I Dの優先度が最大であ れば、 その時点で矩形結合を終了し、 新たな矩形結合を行うための、 矩形や距離 の初期化処理を行う (上記 2つのリセット処理を行う) 。 Matches the note head dictionary with the label. If no match is found (ID—MA TCHINGNONE), label scanning is continued, then the label is detected and combined, and re-recognition (matching the dictionary again) is performed. . However, matching is performed once with the second label itself used for the combination, and if the priority of the ID of the matching result is the highest, this is prioritized. It also resets the maximum size (d x t) of label merging and resets label merging (to enable label merging), and also sets the vertical distance (dy t) at which new merging starts. Furthermore, if the priority of the ID of the recognition result is the highest, the rectangle combining is terminated at that point, and the rectangle and distance are initialized to perform a new rectangle combining (the above two reset processings are performed). Do).
マッチングは、 ラベルの結合中、 本来認識すべき符頭を全て含む認識矩形にな らないうちに、 別の符頭と同じ形状となる場合があるので、 認識結果に優先度を 付ける。 優先度の低い認識結果であった場合、 その I Dと矩形を保存しておき、 次のラベル走査を行う。 これより優先度の高い I Dが見つからなければこちらを 優先する。 During label combining, priorities are given to recognition results because the shape may be the same as another notehead before it becomes a recognition rectangle that includes all the noteheads that should be originally recognized. If the recognition result has a low priority, the ID and rectangle are saved and the next label scan is performed. If no higher priority ID is found, this is given priority.
ラベル結合途中にできる認識対象ラベルが意図するのとは別の I Dに認識され てしまう場合には、 これをリジヱクトラベルとして辞書に入れ、 認識結果がこれ になった場合には、 認識失敗とすることもできる。 符頭が結合したものを表す結 合符頭ゃトレモロ記号など、 マッチング結果が特殊な場合があるが、 これらが認 識された場合は、 後述するように、 それに応じた処理を行う。
辞書とのマッチングが取れた場合符頭データ (e p) にデータを追加する。 ④符尾結合 ·認識 If the recognition target label created during label combining is recognized by a different ID from the intended one, put it in the dictionary as reciprocal travel, and if the recognition result becomes this, recognize it as recognition failure. You can also. There are special cases where the matching result is special, such as a combination of a notehead and a tremolo symbol that represents a combination of noteheads. If these are recognized, processing is performed accordingly, as described later. When matching with the dictionary is completed, data is added to the notehead data (ep). ④ Stem couplingRecognition
黒玉と同様に、 符尾候補との結合処理を行う。 但しドラム符頭の場合には、 特 殊な処理が必要な場合がある。 それについては後述する。 そして黒玉 (白玉) 以 外の符頭に関しては、 認識された符頭の種類を記号保存データに残す。 即ち認識 記号保存データ中の保存領域 d r umNo t eに符頭種類を書き込む。 In the same way as for the black ball, the combining process with the stem candidate is performed. However, special processing may be required for drum note heads. This will be described later. For noteheads other than black ball (white ball), the recognized notehead type is left in the symbol storage data. That is, the note head type is written in the storage area dRumNote in the recognition symbol storage data.
上記ラベル結合処理を含むマッチング処理の詳細を、 フローチャートとして第 22図乃至第 24図に示す。 同図の処理は、 符尾候補の縦線の周辺を或る幅 dw で走査しながら b i t D rmを探し、 見つかればこれに塗装関数をかけて、 矩形 (r e c t Cu r :検出されたラベルを囲む矩形) を検出する。 矩形の大きさを 判断しながら、 第 25図(a) (b)に示すように、 まず r e c t Cu rだけでマツ チングし、 結果によっては、 以前の矩形とマージし、 マージ矩形 (r e c tMr g :ラベル同士を連結した矩形) でもマッチングする。 Details of the matching process including the label combining process are shown in flowcharts in FIGS. 22 to 24. The process shown in the figure is to search for bit D rm while scanning around the vertical line of a stem candidate with a certain width dw, and if found, apply a painting function to it and apply a rectangle (rect Cur: (Enclosing rectangle) is detected. While judging the size of the rectangle, as shown in Fig. 25 (a) and (b), matching is performed only with rect Curr, and depending on the result, the rectangle is merged with the previous rectangle, and the merged rectangle (rec tMr g : Rectangle that connects labels).
ステップ S 21において、 デフオノレトの値を r e c tMr g、 r e c t Cu r の各座標に入れ、 矩形の座標の初期化を行うと共に、 保存符頭 I Dの初期化も行 う。 ステップ S 22において、 符尾の最上点の y値を y B e f に入れる。 ステツ プ S 23において、 yを符尾候補の最上から最下までループする。 そしてステツ プ S 24において、 r e c tMr gの各座標がデフォルトの値か否かを判断し、 デフォルト値であれば、 後述するステップ S 29に飛ぶ。 この値がデフォルト値 でなければ、 ステップ S 25に進む。 その際ドットが何もない距離がある程度あ ると、 次のものの走査のためにリセットしなければならない。 そのためステップ S 25において、 捜査中の yの点の値と符尾最上点の値との差の絶対値が上記 d y tの値を超えたか否かを判断し、 超えていなければ同じく後述するステップ S 29に飛ぶが、 もし越えていれば、 更にステップ S 26において、 保存符頭 I D が初期状態であるか否かを判断する。 初期状態であれば、 後述するステップ S 2 8に進む。 反対に初期状態でなければ、 ステップ S 27において、 保存符頭 I D と矩形を使用して符頭データを作成する。 ステップ S 28において、 r e c tM r gの各座標にデフォルト値を入れ、 保存符頭 I Dの初期化も行う。 S 25から S 28までの一連の処理は r e c tMr gの座標が初期状態でない場合のみ行う
(S 24参照) 。 この処理が済んだ後、 或いは S 25において、 その値が越えて いないと判断された場合に、 ステップ S 29において、 符尾候捕の縦線の周辺を ある幅 dwで走査する。 ステップ S 30において座標 (x、 y) にビット b i t D rmが存在するか否かが判断され、 存在しなければ、 後述するステップ S 48 に飛んで、 X方向の走査のループを終了する。 S 30において、 同ビットが存在 すれば、 ステップ S 3 1においてこれに塗装関数をかけて、 第 2ラベル (矩形) を検出する (r e c t Cu r) 。 ステップ S 32において、 見つかった第 2ラベ ル矩形がラベル結合の上記最大サイズ (d x t) より大きいかが判断され、 大き いと判断された場合は、 ステップ S 33において後述するタイ消去処理を行う。 ステップ S 34において、 該タイ消去処理が成功したか否かが判断され、 失敗し た場合はステップ S 42に飛ぴ、 r e c t Cu rの最下 y座標を yB e f とする。 S 34においてタイ消去処理が成功したと判断された場合、 及び、 S 32におい て、 見つかった第 2ラベル矩形が上記 d X tより小さいと判断された場合は、 ス テツプ S 35において、 第 2ラベルがマッチングに十分な程の大きさか否かが判 断され、 小さい場合は、 後述するステップ S 48に飛んで、 X方向の走査のルー プを終了する。 S 35において、 十分な大きさであると判断されると、 以後ステ ップ S 36で、 まず第 2ラベル (r e c t Cu r) だけで一度マッチングが行わ れる。 ステップ S 37において、 I Dの優先度が最大か否かが判断され、 最大で あると判断された場合は、 ステップ S 42に飛び、 r e c t Cu rの最下 y座標 を yB e f とすると共に、 ステップ S 46において符頭データを作成する。 S 3 7において優先度が最大でないと判断された場合は、 ステップ S 38において、 結合されるラベル r e c tMr gの座標がデフォルト値と一致するか否かが判断 され、 一致しない場合はステップ S 39において、 第 1のラベルと第 2のラベル の結合処理が行われ、 一致する場合はステップ S 40において結合処理が行われ ず、 そのままの形がマージ矩形 (r e c tMr g) とされる。 ステップ S 4 1に おいて、 上記 r e c tMr gの最下 y座標を上記 y B e f とする。 次にステップ S 43において、 r e c tMr gがマッチングに十分な大きさか否かが判断され、 十分でないと判断された場合は、 後述するステップ S 48に飛んで、 X方向の走 查のループを終了する。 S 43においてその大きさが十分な大きさであると判断
されると、 ステップ S 44において、 r e c tMr gの辞書とのマッチングが行 われ、 ステップ S 45において、 I Dの優先度が最大か否かが判断され、 最大で あると判断された場合は、 ステップ S 46に飛び、 保存符頭 I D及び矩形を用い て符頭データを作成し、 その優先度が最大でなければ、 ステップ S 48に飛んで、 X方向の走査のループを終了する。 上記ステップ S 46の後に、 ステップ S 47 において、 r e c tMr g各座標にデフォルト値を入れる処理 (ラベル結合終 了) を行うと共に、 保存符頭 I Dの初期化を行う。 S 45で、 優先度が最大でな いと判断された場合、 及び S 47でラベル結合終了処理がなされた場合は、 ステ ップ S 48で、 X方向の走査のノレープを終了する。 更にステップ S 49において、 y方向の走査のループを終了する。 その後ステップ S 50において、 残った保存 符頭 I Dが初期状態か否かが判断され、 初期状態であれば、 処理を終了する。 初 期状態でなければ、 ステップ S 51において、 符頭データを作成する。 In step S21, the value of default is entered into the coordinates of rec tMr g and rect Cur, and the coordinates of the rectangle are initialized, and the stored notehead ID is also initialized. In step S22, the y value of the highest point of the stem is put into yBef. In step S23, y is looped from the top to the bottom of the stem candidates. Then, in step S24, it is determined whether or not each coordinate of recMrg is a default value, and if it is the default value, the process jumps to step S29 described later. If this value is not the default value, go to step S25. If there is some distance where there is no dot at that time, it must be reset for the next scan. Therefore, in step S25, it is determined whether or not the absolute value of the difference between the value of the point y under investigation and the value of the uppermost point of the stem has exceeded the value of dyt. The process jumps to step 29, but if it does, it is determined in step S26 whether or not the stored notehead ID is in the initial state. If it is in the initial state, the process proceeds to step S28 described later. On the other hand, if not in the initial state, in step S27, notehead data is created using the saved notehead ID and the rectangle. In step S28, a default value is set for each coordinate of rec tM rg, and the stored note ID is also initialized. A series of processing from S25 to S28 is performed only when the coordinates of rec tMr g are not in the initial state (See S24). After this processing is completed, or when it is determined in S25 that the value is not exceeded, in Step S29, the periphery of the vertical line of the stem and tail is scanned with a certain width dw. In step S30, it is determined whether or not the bit bit Drm exists at the coordinates (x, y). If not, the process jumps to step S48, which will be described later, and ends the X-direction scanning loop. In S30, if the same bit exists, the painting function is applied to this bit in step S31 to detect a second label (rectangle) (rect Cur). In step S32, it is determined whether the found second label rectangle is larger than the maximum size (dxt) of the label combination, and if it is determined to be larger, tie elimination processing described later is performed in step S33. In step S34, it is determined whether or not the tie elimination process has succeeded. If the tie elimination process has failed, the process jumps to step S42, and the bottom y coordinate of rect Curr is set to yB ef. If it is determined in S34 that the tie elimination process has been successful, and if it is determined in S32 that the found second label rectangle is smaller than the above dXt, in step S35, the second label rectangle is determined. It is determined whether or not the label is large enough for matching. If the label is small, the process jumps to step S48 to be described later and ends the X-direction scanning loop. If it is determined in S35 that the size is sufficient, then in step S36, matching is first performed once only with the second label (rectCur). In step S37, it is determined whether or not the priority of the ID is the maximum. If it is determined that the priority is the maximum, the process jumps to step S42, where the bottom y coordinate of rect Cur is set to yB ef, and In S46, notehead data is created. If it is determined in S37 that the priority is not the maximum, it is determined in step S38 whether or not the coordinates of the label rec tMrg to be combined match the default value. If not, step S39 is performed. In, the combining process of the first label and the second label is performed, and if they match, the combining process is not performed in step S40, and the shape as it is is set as a merge rectangle (rec tMr g). In step S41, the bottom y coordinate of the above rec tMr g is set to the above y B ef. Next, in step S43, it is determined whether or not rec tMr g is large enough for matching. If it is determined that rec tMr g is not sufficient, the process jumps to step S48 to be described later and ends the loop of the X-direction running. I do. Judged that the size is large enough in S43 Then, in step S44, matching with the dictionary of rec tMr g is performed. In step S45, it is determined whether or not the priority of the ID is the maximum. If it is determined that the priority of the ID is the maximum, the step The process jumps to S46 to create notehead data using the saved notehead ID and the rectangle. If the priority is not the highest, the process jumps to step S48 to terminate the X-direction scanning loop. After the above step S46, in step S47, a process of setting a default value to each coordinate of rec tMr g (end of label combination) is performed, and a stored note ID is initialized. If it is determined in S45 that the priority is not the highest, and if the label combination end processing is performed in S47, the rape of the X-direction scanning is ended in step S48. Further, in step S49, the loop of scanning in the y direction is ended. Thereafter, in step S50, it is determined whether or not the remaining stored notehead ID is in the initial state, and if it is in the initial state, the process ends. If it is not the initial state, notehead data is created in step S51.
第 26図は、 第 23図のステップ S 36及びステップ S 44における矩形マツ チング処理のフローを示している。 ステップ S 52において、 辞書とのマツチン グが行われ、 その処理結果を I Dに入れる。 ステップ S 53において、 マツチン グが成功したか否かが判断され、 失敗 ( I D— MATCH I NGNONE) と判 断された場合は、 処理を終了する。 S 53で、 マッチングの失敗がなかったと判 断されると、 ステップ S 54において、 マッチング結果がリジェクトラベルか否 かが判断され、 リジェクトラベルと判断された場合は、 処理を終了する。 S 54 で、 リジェクトラベルでないと判断されると、 ステップ S 55において、 マッチ ング結果が結合符頭であるか否かが判断され、 結合符頭と判断された場合は、 ス テツプ S 56において、 符頭 I D及ぴ矩形の保存が行われる。 他方 S 55で、 結 合符頭でないと判断された場合は、 ステップ S 57で、 マッチング結果がトレモ 口記号であるか否かが判断され、 トレモロ記号と判断された場合は、 ステップ S 58において、 トレモロ太部分の消去処理がなされる。 他方 S 57で、 トレモロ 記号でないと判断された場合は、 ステップ S 59で、 符頭 I D及び矩形の保存が なされる。 S 56、 S 58及び S 59の処理を終了した後は、 全体の処理を終了 する。 FIG. 26 shows the flow of the rectangular matching process in steps S36 and S44 in FIG. In step S52, matching with the dictionary is performed, and the processing result is input to the ID. In step S53, it is determined whether or not the matching has succeeded. If it is determined that the matching has failed (ID—MATCH I NGNONE), the process ends. If it is determined in S53 that no matching failure has occurred, it is determined in step S54 whether or not the matching result is reject travel, and if it is determined that reject travel, the process ends. If it is determined in step S54 that it is not a reject travel, then in step S55, it is determined whether or not the matching result is a combining notehead. If it is determined that the matching result is a combining notehead, in step S56, Note ID and rectangle are saved. On the other hand, if it is determined in S55 that the character is not a head, then in step S57, it is determined whether or not the matching result is a tremolo mouth symbol.If it is determined that the symbol is a tremolo symbol, in step S58, The tremolo thick portion is erased. On the other hand, if it is determined in S57 that the symbol is not a tremolo symbol, the notehead ID and the rectangle are stored in step S59. After finishing the processing of S56, S58 and S59, the entire processing is finished.
(3) タイ消去処理
前述のようにラベルの横幅が符頭よりも広い場合は、 符頭にタイが連結してい ると考えられ、 ラベルを分離できないので、 第 2 3図のステップ S 3 2以下で行 われるタイ消去処理を行うことになる。 第 2 7図に示すように、 矩形の左右端か ら逆方向に向かって縦に走査し、 見つかったランが 1つであり、 ラン長が或るし きい値 d y t 2以下である X幅が或るしきい値 d X t 2以上である場合、 これは、 符頭であると判断できる。 その場合ラン長が或る長さ d y t 2より長くなる (符 頭と接触するタイの部分はランの長さが d y t 2より長くなる) か、 第 2以降の ラン (ランを走査していく うちに縦方向に別に見つかるラン) と接触する位置ま でをタイとして、 その部分までを消去する。 (3) Tie erasure processing If the width of the label is wider than the notehead as described above, it is considered that the tie is connected to the notehead, and the label cannot be separated, so the tie elimination performed in step S32 and below in Fig. 23 Processing will be performed. As shown in Fig. 27, scanning is performed vertically from the left and right ends of the rectangle in the opposite direction, and one run is found, and the X width where the run length is less than a certain threshold value dyt 2 is obtained. If it is greater than or equal to a certain threshold value dXt2, it can be determined that this is a notehead. In that case, the run length will be longer than a certain length dyt 2 (the part of the tie in contact with the notehead will have a run length longer than dyt 2) or the second and subsequent runs (while scanning the run) The run that is found separately in the vertical direction) is used as a tie, and up to that point is erased.
( 4 ) 結合符頭処理 (4) Combination notehead processing
ドラム譜に符頭の接触した和音は少なく、 また黒玉同士或いは黒玉とそれ以外 の符頭の接触は問題ないが、 通常のドラムセット以外の楽器を同一五線上に表記 している場合は、 前記第 3図に示すように、 ( X ) 同士が接触した和音が存在す る場合がある。 このような場合、 辞書とのマッチング前に、 夫々の符頭を分離し て認識矩形を設定するのは困難である。 そのため、 符頭同士が上下に接触した結 合符頭自体を辞書に登録しておき、 この辞書と該結合符頭とがマツチングした場 合 (第 2 6図ステップ S 5 5参照) には、 符頭データに連結した符頭の数分だけ データを追加する (同図ステップ S 5 6参照) 。 このようなラベルは縦方向に長 い形をしているので、 ラベルの縦幅により、 辞書の対象 I Dを変化させて、 誤認、 識の率を下げることもできる。 またマッチング自体に、 サイズによる特徴量を追 加することも有効である。 There are few chords with noteheads in contact with drum staves, and there is no problem with contact between black balls or between black balls and other noteheads, but when instruments other than ordinary drum sets are written on the same staff As shown in FIG. 3, there may be a chord in which (X) contacts each other. In such a case, it is difficult to set the recognition rectangle by separating each notehead before matching with the dictionary. For this reason, the combination of note heads whose note heads touch each other up and down is registered in the dictionary, and when this dictionary and the combination note head match (see step S55 in FIG. 26), Data is added as many as the number of noteheads linked to the notehead data (see step S56 in the figure). Since such a label has a long shape in the vertical direction, the ID of the dictionary can be changed according to the vertical width of the label to reduce the rate of misperception and recognition. It is also effective to add a feature value by size to the matching itself.
( 5 ) トレモロ記号処理 (5) Tremolo symbol processing
これまで説明してきた手順に従い、 符尾候捕の周辺のラベルを結合しながら辞 書とマッチングしていくことで、 第 4図に示すようなトレモロ記号を認識するこ ともできる。 特にドラム譜の場合トレモロ記号は比較的多い。 トレモロ記号は連 鉤と略同じ太さ、 間隔も略同じなので、 対策を行わないと、 連鈎と同様に旗の計 数を行なってしまい、 3 2分音符などの音長の短い音符と誤認してしまう。 従つ て、 第 5図に示すような形でトレモロ記号を辞書に登録しておく。 但し、 本構成 では、 記号張り付けインターフェースはトレモロ記号に対応していないので、 こ
れとマッチングした場合 (第 2 6図ステップ S 5 7参照) には、 太部分の消去処 理を行い (同図ステップ S 5 8参照) 、 連鈎検出時の旗計数失敗の対策とする。 ( 6 ) 符頭符尾結合処理 By following the procedure described so far and combining the labels around the suffix and matching the dictionaries, the tremolo symbol as shown in Fig. 4 can also be recognized. Especially in the case of drum music, there are relatively many tremolo symbols. Since the tremolo symbol has almost the same thickness and spacing as the hook, if no countermeasures are taken, the flag will be counted in the same way as the hook, and it will be mistaken for a short note such as a 32nd note. Resulting in. Therefore, the tremolo symbol is registered in the dictionary as shown in Fig. 5. However, in this configuration, the symbol pasting interface does not support tremolo symbols. If a match is found (see step S57 in Fig. 26), the thick part is erased (see step S58 in Fig. 26) to take measures against flag count failure when detecting consecutive hooks. (6) Note-stem combining process
本構成では、 通常楽譜の認識時に行われていると同様に符頭の認識後、 該符頭 と符尾の結合処理を行なっているが、 ドラム譜の場合、 この結合処理にも特別な 処理が必用になる。 In this configuration, the process of combining noteheads and stems is performed after recognition of noteheads as in the case of normal music score recognition. Is required.
① 符頭と符尾の位置関係 ① Positional relationship between note heads and stems
その一つは、 黒玉以外の符頭の場合、 第 2図に示すように、 符頭の中心に符尾 が付く場合があることである。 また符尾の両側に符頭が付くことは少ない。 この ような場合は、 上向き符尾又は下向き符尾の先頭の符頭を結合した後、 中間の符 頭の結合を行なう。 その場合の本構成として、 黒玉、 白玉以外の場合、 楕円の中 心と符尾の X座標の位置関係により、 符頭の左右の符尾結合フラグのどちらかを チェックし、 符尾の先頭の符頭については、 この X方向の位置関係によって、 結 合の不可を判定しているが、 ドラム符頭の場合 (黒玉以外) 、 先頭の符頭結合時、 符尾の縦方向の中心より上か下かによつて、 左右のどちらをチェックするかを決 める。 即ち、 中点より下なら、 X方向の位置関係に拘わらず、 符頭の右側をチェ ックする。 符尾の中間の符頭は、 符尾が上向きか下向きかによつてチェック方向 を決める。 このように、 符頭結合フラグが用いられているのは、 フラグがチエツ クされた側への符尾候補の結合を不可とすることによって、 符尾の重複結合を回 避するためである。 One is that noteheads other than black balls may have a stem at the center of the notehead, as shown in Fig. 2. In addition, note heads are rarely attached to both sides of the stem. In such a case, the first notehead of the upward stem or the downward stem is combined, and then the middle notehead is combined. In this case, if this is not a black ball or a white ball, either the center of the ellipse or the stem coordination flag is checked according to the positional relationship between the center of the ellipse and the X coordinate of the stem, and the head of the stem is checked. Regarding the notehead of, it is determined that the combination is impossible based on the positional relationship in the X direction. However, in the case of a drum notehead (other than a black ball), when combining the first notehead, Decide whether to check left or right depending on whether you are above or below. That is, if it is below the midpoint, the right side of the note head is checked regardless of the positional relationship in the X direction. The middle noteheads determine the check direction depending on whether the stems are facing up or down. The reason why the notehead combination flag is used in this way is to avoid combining stems by disabling the combination of stem candidates on the side where the flag is checked.
② 符尾を分断する符頭 ② Noteheads that divide stems
ドラム譜の場合に、 特有な結合処理を行なわなければならないもう一つの理由 は、 第 9図(a ) ( b )に示すような符尾を分断する符頭が存在することである。 符 尾を分断する符頭は、 同図に示されるように、 先頭の玉が黒玉であり、 分断する 符頭が 1つ存在するというパターンが殆どである。 そこで本構成では、 まず黒玉 を対象とせず、 第 1 0図(a )に示すように、 符尾を分断する符頭とその上下の符 尾候捕との結合を行う。 そうすると、 同図(b )のような該符頭を共有する符尾逆 向きのドラム音符が認識できる。 この後、 符尾連結処理を行う。 但し、 この場合、 連結前の状態の符尾長が短くなるので、 符頭と結合する符尾の長さの最短しきい
値を小さく しておく必要がある。 また符尾連結処理前に、 第 1 0図(b )の右側の 符尾が下向きの音符を削除し、 同図(c )のように上下の符尾を結合したものに符 尾候補を変更する (図右側) 。 それから黒玉も対象とした符頭符尾連結を行うと、 上記処理で結合した符尾候補と黒玉が連結される。 ' Another reason that special combining processing must be performed in the case of drum staves is the presence of noteheads that separate stems as shown in Figs. 9 (a) and 9 (b). As shown in the figure, most of the noteheads that divide stems are black balls at the beginning, and there is one notehead that separates them. Therefore, in the present configuration, first, the black ball is not targeted, and as shown in FIG. 10 (a), the note head dividing the stem and the upper and lower note heads are combined. Then, a drum note having the opposite stem direction and sharing the note head as shown in FIG. Then, the stem-coupling process is performed. However, in this case, the stem length in the state before concatenation becomes short, so the shortest length of the stem length combined with the notehead is The value must be kept low. Before the stem concatenation process, the note with the downward stem on the right side of Fig. 10 (b) is deleted, and the stem candidates are changed to those combining the upper and lower stems as shown in Fig. 10 (c). Yes (right side of the figure). Then, when note-stem concatenation is also performed on black balls, the stem candidates combined in the above process and black balls are connected. '
③ 〇符頭とハイハツトオープン ③ 〇 Note head and hi-hat open
ドラム譜の場合に、 特有な結合処理を行なわなければならない更に別の理由は、 〇符頭を認識するために、 ハイハットオープンの ( ° ) が符尾の近くに存在した 場合、 符頭と誤認する可能性があることである。 この対策のため、 本構成では、 〇符頭は、 予め左右の符尾結合フラグのうち、 左側をチェックしておく。 こうす ることで、 〇符頭に下向き符尾が付かなくなる。 但し、 第 2 8図に示されるよう に、 1つのイメージ中でパート毎に認識矩形が設定される (図中波線で示す) 力 段落が接近していると、 次段落の記号が認識矩形に入ってしまうことがある。 こ のように次段落のハイハツトオープンが認識矩形に入り込んでくる危険性や、 第 1線より下のペダルノヽィハットにハイハットオープンの ( ° ) が使われる可能性 を考えて、 第 1線より下の〇符頭は左側ではなく、 右側のフラグをチェックする ようにしても良い。 Yet another reason for the special combining process for drum staves is that, in order to recognize the notehead, if the hi-hat open (°) is near the stem, it is mistaken for a notehead. It is possible that As a countermeasure against this, in this configuration, the 〇 note head checks the left side of the left and right stem combination flags in advance. In this way, the 頭 note head has no downward stem. However, as shown in Fig. 28, a recognition rectangle is set for each part in one image (indicated by the wavy line in the figure). May enter. Considering the danger of the hi-hat open in the next paragraph entering the recognition rectangle and the possibility of using the hi-hat open (°) for the pedal noisy hat below the first line, The lower 〇 mark head may check the flag on the right instead of the left.
④ ハイハツトクローズ.連符数字の誤認対策 ④ Hi-hat closed, countermeasures for mistaken tuplet numbers
また図 1 1に示されるハイハツトクローズの(+ )の記号ゃ連符数字が符頭と誤 認されてしまい、 これを符尾先頭の符頭として結合すると、 符尾向きが逆の全く 異なる音符として認識されてしまうことになる。 その対策としてこれらの記号や 連符数字をリジヱクトラベルとして辞書に登録しても良いが、 ドラム譜の符尾向 きは通常楽譜と異なり、 ある程度限定できることを利用して、 本構成では、 符尾 上端が第 5線より上且つ符尾下端が第 1線より上の場合に、 符尾は上向き レ、ィ ハットオープン ( ° ) の誤認対策としても有効である] 、 符尾下端が第 1線より 下且つ符尾上端が第 5線より下の場合に、 符尾は下向きと判断して、 先頭符頭と 該符尾候補とを結合させることとした。 In addition, the hi-hat closed (+) symbol shown in Fig. 11 ゃ The tuplet number is mistaken for a note head, and when this is combined as the head of a stem, the stem direction is completely different. It will be recognized as a note. As a countermeasure, these symbols and tuplet numbers may be registered in the dictionary as rigid travel. However, since the stem direction of drum staves is different from that of regular music, it can be limited to some extent. Is above the fifth line and the lower end of the stem is above the first line, the stem is also effective as a countermeasure against false recognition of hat-open (°)], and the lower end of the stem is above the first line. When the lower stem and the upper end of the stem are below the fifth line, it is determined that the stem is downward, and the first note head is combined with the candidate stem.
しかし、 符尾を分断する符頭の上述した認識処理及びこれらの符尾符頭の結合 処理がなされた場合に、 上記の符尾向きを判断する構成を実施すると、 第 1 2図 に示される共有符頭に下向き符尾が連結した構成の認識が不可となる (符尾上端
が第 5線より上且つ符尾下端が第 1線より上の場合は、 上向き符尾と判断される ため) 。 そのため本構成では符尾を分断する符頭のための上記処理を行なった後、 符尾向きの正規化を行なうことにした。 即ち、 符尾を分断する符頭を有する音符 を含むドラム音符の認識時に、 これらのドラム音符の先頭符頭と符尾候補の結合 処理を行い、 符尾を分断する符頭を有するドラム音符については、 該符頭を共有 する符尾逆向きのドラム音符を認識した上で、 符尾が下向きの音符を削除して、 上下の符尾を結合したものを符尾候補として残りの先頭符頭と結合させると共に、 他のドラム音符については、 符尾上端が第 5線より上且つ符尾下端が第 1線より 上の場合に、 符尾は上向き、 符尾下端が第 1線より下且つ符尾上端が第 5線より 下の場合に、 符尾は下向きと判断して、 該符尾候補と残りの符頭と結合させ、 こ れらの条件に合わないものは、 元の符尾候補に戻した後 (符尾向きの正規化処 理) 、 該符尾候補と残りの符頭とを結合させることとしている。 However, when the above-described recognition process of the noteheads that divide the stems and the combining process of these stemheads are performed, the configuration for determining the stem direction described above is implemented, as shown in FIG. It is not possible to recognize a configuration in which a downward stem is connected to a common note head. If is above the fifth line and the lower stem is above the first line, it is determined to be an upward stem.) Therefore, in the present configuration, after performing the above-described processing for the notehead that divides the stem, normalization in the stem direction is performed. That is, at the time of recognizing a drum note including a note having a note head that divides a stem, the leading note head of these drum notes and a stem candidate are combined, and a drum note having a note head that divides a stem is recognized. After recognizing drum notes with opposite stems sharing the same notehead, deleting notes with lower stems, and combining the upper and lower stems as stem candidates, the remaining first noteheads are used. And for other drum notes, if the upper stem is above the fifth line and the lower stem is above the first line, the stem is upward, the lower stem is below the first line and If the upper end of the stem is below the fifth line, the stem is determined to be downward, and the candidate stem is combined with the rest of the stems. After returning to the candidate (stem direction normalization), the candidate is combined with the remaining note heads. It is set to be.
⑤符尾上の太部分の割合による誤認識の削減 削減 Reduction of false recognition by ratio of thick part on stem
通常楽譜でも、 符尾候補上の太部分の割合が高い場合、 符尾の誤認であるとし て、 符頭結合の対象外としていた。 ドラム譜の場合には、 黒玉の和音が少ないの で、 このしきい値を下げ、 誤認識の確率を下げることができる。 特にドラム譜の 場合、 符頭のラベルを分割しマッチングしているので、 実際には音符ではない記 号上に検出された縦線の周辺のラベルを分割 ·結合しながらマッチングするうち に、 符頭として誤認してしまう可能性がある。 そのため上記処理が有効となる。 但し符尾を分割する符頭を処理する際、 短い符尾候捕が存在するので、 注意が 必要である。 これを解決するためには、 ー且第 1 0図(b )の右側の符尾が下向き の音符を削除し、 同図( c )のように上下の符尾を結合したものに符尾候補を変更 し (図右側) 、 それから黒玉も対象とした符頭符尾連結を行った後、 符尾上の太 部分の割合を検出し、 しきい値より高い場合、 その音符を削除するようにすれば 良レ、。 Even in normal scores, if the proportion of thick parts on stem candidates was high, it was regarded as a misidentification of stems and excluded from note head combining. In the case of a drum score, since the number of chords of a black ball is small, the threshold can be lowered to reduce the probability of misrecognition. Especially in the case of drum staves, note head labels are divided and matched, so the labels around the vertical lines detected on symbols that are not actually notes are matched while dividing and joining. You may be mistaken as a head. Therefore, the above processing becomes effective. However, care must be taken when processing noteheads that split stems, since there are short catches. In order to solve this, the note with the lower stem on the right side of Fig. 10 (b) is deleted and the stem candidates are combined with the upper and lower stems as shown in Fig. 10 (c). (Right side of the figure), and then perform note-stem concatenation on black balls as well, detect the proportion of the thick part on the stem, and delete the note if it is higher than the threshold. Good luck,
更に音符の誤認の場合、 連鉤まで誤認する可能性は低いこと、 連鉤の存在する 音符の太部分の割合が比較的髙いことを考慮して、 連鉤のないもののみに、 太部 分の割合によるチェックを行ったり、 連鈎のないものの太部分の割合チェックの しきい値を、 連鉤のあるものより厳しくしたりすることも有効である。
以上の本実施形態構成では、 ドラム譜において、 通常楽譜同様に、 五線の線な どを消去して行う太細分離処理及び黒玉部分の認識のための楕円検出処理により、 通常の楽譜と同じ黒玉の検出を行う。 また該黒玉及び出現確率の低い白玉 (認識 を行わない) 以外のドラム譜の符頭は (X、 ◊) 等、 細線で描かれており、 この 他にも色々なタイプが存在しているが、 これらを黒玉検出と同じように太細分離 処理及ぴ楕円検出処理で検出することはできないため、 符尾を消去した上で符頭 ラベルを分離し、 符尾候補を走査して符尾候補周辺にある検出されたラベルを辞 書とマッチングすることにより行う。 但し符尾消去により符頭が複数のラベルに 分断されてしまうことがあるので、 マッチングが失敗した場合、 更に、 符尾候補 の走査を続けて次に検出された符頭ラベルと前記分離ラベルとの結合処理を行つ た後、 辞書とのマッチングを再度行う。 この他、 ドラム譜の認識及び結合処理に おいては、 特有なものが存在するので、 これまで説明したように、 夫々に特有な 処理を行っている。 以上詳述した請求の範囲 1〜1 6に記載された発明の構成によれば、 様々な表 記法で記述されたドラム譜の表記法を推定しながら該ドラム譜の認識を行うため、 複雑なインターフェースを使用することなく、 しかもユーザに負担をかけずに、 少ない操作で演奏可能なデータ形式に変換することができるようになる。 またド ラム譜に関する知識のないユーザにも、 その利用が可能となる。 In addition, in the case of misidentification of a note, considering that the possibility of misidentification to a continuous hook is low and that the proportion of the thick portion of the note where the continuous hook exists is relatively large, only the thick portion without the continuous hook is used. It is also effective to check by the ratio of minutes and to make the threshold for checking the ratio of the thick part of those without hooks stricter than the one with hooks. In the configuration of the present embodiment described above, in the same manner as in the normal score, in the drum score, a thick and thin separation process performed by erasing staff lines and the like and an ellipse detection process for recognizing a black ball portion are performed. The same black ball is detected. The noteheads of drum staves other than the black ball and the white ball with low appearance probability (no recognition) are drawn with thin lines such as (X, ◊), and there are various other types. However, these cannot be detected by the thick and thin separation processing and the ellipse detection processing as in the case of black ball detection. This is done by matching the detected label around the tail candidate with the dictionary. However, noteheads may be split into multiple labels due to stem erasure, so if matching fails, further scanning of stems candidates is continued and the next detected notehead label and the separated label After performing the join processing of, matching with the dictionary is performed again. In addition, since there is a unique process for recognizing and combining drum staves, each process is performed as described above. According to the configuration of the invention described in claims 1 to 16 described above in detail, since the drum notation is recognized while estimating the notation of the drum notation described in various notations, a complicated It is possible to convert to a data format that can be played with few operations without using an interface and without burdening the user. Also, users who do not have knowledge of drum scores can use them.
また請求の範囲 1 7〜3 6に記載された発明の構成によれば、 通常楽譜とは異 なるドラム譜におけるドラム音符の認識を可能にし、 演奏及びノ又は表示可能な データ形式に変換することができるようになる。 特にドラム譜の符頭認識に当た · つては、 符尾を消去した上で符頭ラベルを分離し、 符尾候補を走査して符尾候補 周辺にある検出されたラベルを辞書とマッチングすることにより行っており、 ま た符尾消去により符頭が複数のラベルに分断されてしまうことがあるので、 マッ チングが失敗した場合、 更に、 符尾候補の走査を続けて次に検出された符頭ラベ ルと前記分離ラベルとの結合処理を行った後、 辞書とのマッチングを再度行うこ とで、 ドラム音符の正確な認識が可能となる。
産業上の利用可能性 Further, according to the configuration of the invention described in claims 17 to 36, it is possible to recognize drum notes in a drum score different from a normal score, and to convert to a data format that can be played and played or displayed. Will be able to In particular, in recognition of noteheads in drum staves, erasing stems and separating notehead labels, scanning candidate stems, and matching detected labels around stem candidates with the dictionary In addition, note endings may cause the note head to be divided into multiple labels, so if matching fails, scanning of stem suffix candidates is continued and the next detection is performed. By performing the matching process between the notehead label and the separation label and then matching the dictionary again, accurate recognition of the drum note becomes possible. Industrial applicability
以上のように、 本発明にかかる楽譜読み取り方法及ぴ楽譜読み取りプログラム を記録したコンピュータ読み取り可能な記録媒体の構成は、 楽譜、 とりわけドラ ム譜を機械的に読みとらせる場合に有用であり、 特に楽譜からカラオケ演奏のた めのデータを作成したり、 スタジオ録音やライブ演奏で、 人による演奏に代わつ てその一部を機械演奏させる場合などに適している。
As described above, the configuration of the computer-readable recording medium that records the score reading method and the score reading program according to the present invention is useful when reading a score, especially a drum score, mechanically. It is suitable for creating data for karaoke performances from musical scores, or for performing part of a machine performance instead of human performance in studio recording or live performance.
Claims
1 . 音符を含む楽譜の全ての記号を認識する記号認識工程と、 該工程によつ て得られた情報に基づいて楽譜のドラムパートにおけるドラム表記法の推定を行 う表記法推定工程と、 該工程により推定されたドラム表記法に従って、 認識され たドラムパートの記号に実際の発音楽器を割り当てる楽器割り当て工程と、 演奏 及ぴ 又は表示可能な楽譜データ形式に変換するデータ変換工程とを実行するこ とを特徴とする楽譜読み取り方法。 1. a symbol recognition step of recognizing all symbols of a musical score including a note, and a notation estimating step of estimating a drum notation in a drum part of the musical score based on information obtained in the step; In accordance with the drum notation estimated in the step, an instrument assigning step of assigning an actual sounding instrument to the recognized symbol of the drum part, and a data conversion step of converting into a performance and / or a displayable score data format are executed. A score reading method characterized by this.
2 . 請求の範囲 1記載の楽譜読み取り方法において、 前記記号認識工程によ り認識される楽譜のドラムパートにおける記号として、 ドラム音符の符頭 ·符尾 •旗、 ドラム音符に係る記号、 ドラム譜に特徴的な文字列を含み、 前記ドラム音 符に係る記号の認識に当たっては、 ドラム音符に係る記号と該ドラム音符との係 りも一緒に検出することを特徴とする請求の範囲 1記載の楽譜読み取り方法。 2. The score reading method according to claim 1, wherein the symbols in the drum part of the score recognized in the symbol recognition step include a note head of a drum note, a stem, a flag, a symbol relating to a drum note, and a drum score. 2. The method according to claim 1, further comprising the step of recognizing the symbol relating to the drum note, and detecting the relationship between the symbol relating to the drum note and the drum note together. How to read music.
3 . 請求の範囲 1乃至 2記載の楽譜読み取り方法において、 前記表記法推定 工程により ドラム表記法の推定を行う場合に、 記号認識機能によって得られた、 少なくとも、 ドラム符頭の五線位置、 ドラム符頭の種類、 ドラム音符に係るハイ ハットオープンの記号、 ドラム音符に係るハイハットクローズの記号、 ドラム音 符に係るアクセント記号、 ドラム音符の符尾、 ドラム音符に付く旗、 音符のドラ ム音指定のための文字列、 前記ドラム音符の旗により定まる音長、 該旗により求 められた他のドラム音符の音長があることで符頭種類により定まる別の音長を含 むこれらの情報に基づいて行うことを特徴とする請求の範囲 1乃至 2記載の楽譜 読み取り方法。 3. In the score reading method according to claims 1 or 2, at least when the drum notation is estimated in the notation estimating step, at least a staff position of a drum note head and a drum obtained by a symbol recognition function. Note head type, hi-hat open symbol for drum notes, hi-hat close symbol for drum notes, accent symbols for drum notes, stems of drum notes, flags attached to drum notes, drum notes for notes These information, including a character string for the following, a pitch determined by the flag of the drum note, and another pitch determined by the type of notehead given the length of the other drum note determined by the flag 3. The score reading method according to claim 1, wherein the score is read based on the score.
4 . 請求の範囲 1乃至 3記載の楽譜読み取り方法において、 前記表記法推定 工程によりシンバル系以外のドラム楽器に関するドラム表記法の推定を行う場合 に、 符頭が五線の第 3間にあり且つ黒玉とそれ以外の種類が検出されるのであれ ば、 黒玉をスネアドラム、 (R)又は黒玉以外をリムショットとし、 符頭が五線の 第 3間にあり且つ黒玉のみが検出され、 更にリムショットを表現する文字列が検
出されるのであれば、 該文字列により指定された黒玉をリムショッ トとし、 それ 以外の黒玉をスネアドラムとすることを特徴とする請求の範囲 1乃至 3記載の楽 譜読み取り方法。 4. The score reading method according to any one of claims 1 to 3, wherein the notation estimation step estimates the drum notation for a drum instrument other than a cymbal system. If black balls and other types are detected, black balls are used as snare drums, (R) or black balls are used as rim shots, and noteheads are between the third staff lines and only black balls are detected. Character string representing the rim shot 4. The musical score reading method according to claim 1, wherein, if issued, the black ball specified by the character string is a rim shot, and the other black balls are a snare drum.
5 . 請求の範囲 1乃至 3記載の楽譜読み取り方法において、 前記表記法推定 工程によりシンバル系以外のドラム楽器に関するドラム表記法の推定を行う場合 に、 符頭が五線の第 1線以下にあり且つ黒玉以外であれば、 該ドラム音符をぺダ ルハイハットとすることを特徴とする請求の範囲 1乃至 3記載の楽譜読み取り方 法。 5. In the score reading method as set forth in claims 1 to 3, wherein the notation estimation step includes estimating a drum notation for a drum instrument other than a cymbal system, the notehead is below the first line of the staff. 4. The score reading method according to claim 1, wherein the drum note is a pedal hi-hat if it is not a black ball.
6 . 請求の範囲 1乃至 5記載の楽譜読み取り方法において、 前記表記法推定 工程によりシンバル系以外のドラム楽器に関するドラム表記法の推定を行う場合 に、 頭が黒玉で、 且つ第 3間を除くバスドラム、 タムとして表記される範囲に該 黒玉が検出された場合に、 最下段がある音高以下であればそれをバスドラムとし、 残りを複数の音高のタムに割り当て、 最下段がある音高より高い場合は、 全てを 複数の音高のタムに割り当てることを特徴とする請求の範囲 1乃至 5記載の楽譜 読み取り方法。 6. The score reading method according to any one of claims 1 to 5, wherein in the notation estimation step, the drum notation for drum instruments other than cymbals is estimated, and the head is a black ball and the third interval is excluded. If the black ball is detected in the range described as a bass drum or tom, if the lowest row is below a certain pitch, it is used as a bass drum, and the rest is assigned to multiple pitch toms, and the bottom row is 6. The score reading method according to claim 1, wherein when the pitch is higher than a certain pitch, all the pitches are assigned to toms having a plurality of pitches.
7 . 請求の範囲 1乃至 3記載の楽譜読み取り方法において、 前記表記法推定 工程によりシンバル系のドラム楽器に関するドラム表記法の推定を行う場合に、 黒玉以外のドラム符頭が第 4間以上の五線位置にあることを条件として、 ドラム 符頭の五線位置が 1つの場合と 2つの場合とに応じて場合分けし、 またドラム符 頭の種類に応じて上記場合分けを細分化し、 更にドラム音符の旗により定まる音 長、 該旗により求められた他のドラム音符の音長があることで符頭種類により定 まる別の音長に応じて上記場合分けをより細分化しておくと共に、 これらの場合 分けに応じて変換テーブルを作成しておき、 ドラム符頭の五線位置、 ドラム符頭 の種類、 ドラム音符に係るハイハットオープンの記号、 ドラム音符に係るハイハ ッ 卜クローズの記号、 ドラム音符に係るアクセント記号、 音符のドラム音指定の ための文字列に応じて、 推定されるシンバル系のドラム楽器の種類を変換テープ ル中に特定しておき、 該変換テーブルに基づいてドラム表記法の推定を行うこと を特徴とする請求の範囲 1乃至 3記載の楽譜読み取り方法。 7. The score reading method according to any one of claims 1 to 3, wherein, in the notation estimation step, the drum notation of the cymbal-based drum musical instrument is estimated to have drum heads other than black balls in the fourth or longer interval. Provided that the staff is at the staff position, the cases are divided according to the case where the staff of the drum notehead is one and two, and the above cases are further subdivided according to the type of the notehead of the drum. In addition to the duration determined by the flag of the drum note, and the duration of the other drum note determined by the flag, the above case division is further subdivided according to the different duration determined by the notehead type. A conversion table is created according to these cases, and the staff positions of the drum note heads, the type of drum note heads, the hi-hat open symbol for drum notes, and the hi-hat close for drum notes are closed. The estimated cymbal-type drum instrument type is specified in the conversion table according to the symbol, the accent symbol related to the drum note, and the character string for designating the drum sound of the note, and based on the conversion table. 4. The score reading method according to claim 1, wherein a drum notation is estimated.
8 . 請求の範囲 7記載の楽譜読み取り方法において、 前記表記法推定工程に
より推定されたドラム表記法に従って、 認識されたドラムパートの記号に実際の 発音楽器を割り当てる際に、 推定前に 4分音符として認識されたドラム音符に対 し、 前記変換テーブルの値が 2分音符を指定している場合は、 これらのドラム音 符を 2分音符に変換することを特徴とする請求の範囲 7記載の楽譜読み取り方法。 8. The score reading method according to claim 7, wherein the notation estimation step is performed. When assigning the actual pronunciation instrument to the recognized drum part symbol in accordance with the estimated drum notation, the value of the conversion table for the drum note recognized as a quarter note before the estimation is set to 2 minutes. 8. The score reading method according to claim 7, wherein when a note is specified, the drum note is converted into a half note.
9 . 楽譜読み取りプログラムを記録したコンピュータ読み取り可能な記録媒 体であって、 音符を含む楽譜の全ての記号を認識する記号認識機能と、 該機能に よって得られた情報に基づいて楽譜のドラムパートにおけるドラム表記法の推定 を行う表記法推定機能と、 該機能により推定されたドラム表記法に従って、 認識 されたドラムパートの記号に実際の発音楽器を割り当てる楽器割り当て機能と、 演奏及び Z又は表示可能な楽譜データ形式に変換するデータ変換機能とを実行さ せるための楽譜読み取りプログラムを記録したコンピュータ読み取り可能な記録 媒体。 9. A computer-readable recording medium storing a score reading program, a symbol recognition function for recognizing all symbols of a score including musical notes, and a drum part of the score based on information obtained by the function. Notation estimation function for estimating the drum notation in, an instrument assignment function for assigning the actual pronunciation instrument to the recognized drum part symbol in accordance with the drum notation estimated by the function, performance and Z or display A computer-readable recording medium that stores a score reading program for executing a data conversion function for converting the data into a simple score data format.
1 0 . 請求の範囲 9記載の楽譜読み取りプログラムを記録したコンピュータ 読み取り可能な記録媒体において、 前記記号認識機能により認識される楽譜のド ラムパートにおける記号として、 ドラム音符の符頭 '符尾 ·旗、 ドラム音符に係 る記号、 ドラム譜に特徴的な文字列を含み、 前記ドラム音符に係る記号の認識に 当たっては、 ドラム音符に係る記号と該ドラム音符との係りも一緒に検出するこ とを特徴とする請求の範囲 9記載の楽譜読み取りプログラムを記録したコンビュ ータ読み取り可能な記録媒体。 10. A computer-readable recording medium recording the score reading program according to claim 9, wherein the symbols in the drum part of the score recognized by the symbol recognition function are: It includes a symbol related to a drum note and a character string characteristic of a drum score, and in recognizing the symbol related to the drum note, the relationship between the symbol related to the drum note and the drum note is also detected. A computer-readable recording medium storing the musical score reading program according to claim 9.
1 1 . 請求の範囲 9乃至 1 0記載の楽譜読み取りプログラムを記録したコン ピュータ読み取り可能な記録媒体において、 前記表記法推定機能により ドラム表 記法の推定を行う場合に、 記号認識機能によって得られた、 少なくとも、 ドラム 符頭の五線位置、 ドラム符頭の種類、 ドラム音符に係るハイハットオープンの記 号、 ドラム音符に係るハイハットクローズの記号、 ドラム音符に係るアクセント 記号、 ドラム音符の符尾、 ドラム音符に付く旗、 音符のドラム音指定のための文 字列、 前記ドラム音符の旗により定まる音長、 該旗により求められた他のドラム 音符の音長があることで符頭種類により定まる別の音長を含むこれらの情報に基 づいて行うことを特徴とする請求の範囲 9乃至 1 0記載の楽譜読み取りプロダラ ムを記録したコンピュータ読み取り可能な記録媒体。
11. In a computer-readable recording medium on which a score reading program according to claims 9 to 10 is recorded, when the notation estimating function is used to estimate the drum notation, it is obtained by a symbol recognition function. , At least the staff position of the drum note head, the type of drum note head, the hi-hat open symbol for the drum note, the hi-hat close symbol for the drum note, the accent symbol for the drum note, the suffix of the drum note, the drum A flag attached to the note, a character string for designating the drum sound of the note, a note length determined by the flag of the drum note, and a note length determined by the type of notehead given the length of the other drum note determined by the flag The score reading program according to any one of claims 9 to 10, characterized in that the score reading program is performed based on such information including the pitch of the music. Computer readable recording medium.
1 2 . 請求の範囲 9乃至 1 1記載の楽譜読み取りプログラムを記録したコン ピュータ読み取り可能な記録媒体において、 前記表記法推定機能によりシンパノレ 系以外のドラム楽器に関するドラム表記法の推定を行う場合に、 符頭が五線の第 3間にあり且つ黒玉とそれ以外の種類が検出されるのであれば、 黒玉をスネアド ラム、 (R)又は黒玉以外をリムショットとし、 符頭が五線の第 3間にあり且つ黒 玉のみが検出され、 更にリムショットを表現する文字列が検出されるのであれば、 該文字列により指定された黒玉をリムショットとし、 それ以外の黒玉をスネアド ラムとすることを特徴とする請求の範囲 9乃至 1 1記載の楽譜読み取り'プロダラ ムを記録したコンピュータ読み取り可能な記録媒体。 12. A computer-readable recording medium on which the musical score reading program according to claims 9 to 11 is recorded, wherein the notation estimation function estimates a drum notation for a drum instrument other than a symphonore. If the notehead is between the third staff and a black ball and other types are detected, the black ball is a snare dram, (R) or a non-black ball is a rim shot, and the notehead is a staff. If only the black ball is detected and a character string representing the rim shot is detected, the black ball specified by the character string is set as the rim shot, and the other black balls are detected. A computer-readable recording medium recording a score reading program according to any one of claims 9 to 11, wherein the program is a snare program.
1 3 . 請求の範囲 9乃至 1 1記載の楽譜読み取りプログラムを記録したコン ピュータ読み取り可能な記録媒体において、 前記表記法推定機能によりシンパノレ 系以外のドラム楽器に関するドラム表記法の推定を行う場合に、 符頭が五線の第 1線以下にあり且つ黒玉以外であれば、 該ドラム音符をペダルハイハツトとする ことを特徴とする請求の範囲 9乃至 1 1記載の楽譜読み取りプログラムを記録し たコンピュータ読み取り可能な記録媒体。 13. A computer-readable recording medium on which the score reading program according to claims 9 to 11 is recorded, wherein the notation estimation function estimates a drum notation for a drum instrument other than a symphonore. The musical score reading program according to any one of claims 9 to 11, wherein the drum note is a pedal hi-hat if the note head is below the first line of the staff and is not a black ball. Computer-readable recording medium.
1 4 . 請求の範囲 9乃至 1 3記載の楽譜読み取りプログラムを記録したコン ピュータ読み取り可能な記録媒体において、 前記表記法推定機能によりシンパノレ 系以外のドラム楽器に関するドラム表記法の推定を行う場合に、 頭が黒玉で、 且 つ第 3間を除くバスドラム、 タムとして表記される範囲に該黒玉が検出された場 合に、 最下段がある音高以下であればそれをバスドラムとし、 残りを複数の音高 のタムに割り当て、 最下段がある音高より高い場合は、 全てを複数の音高のタム に割り当てることを特徴とする請求の範囲 9乃至 1 3記載の楽譜読み取りプログ ラムを記録したコンピュータ読み取り可能な記録媒体。 14. In a computer-readable recording medium recording the score reading program according to claims 9 to 13, wherein the notation estimation function estimates a drum notation for a drum instrument other than a sympanore-based drum instrument. If the head is a black ball, and the black ball is detected in the range indicated as a tom, excluding the third period, and a tom, if the bottom row is below a certain pitch, it is regarded as a bass drum, The score reading program according to any one of claims 9 to 13, wherein the remainder is assigned to toms of a plurality of pitches, and if the lowest row is higher than a certain pitch, all of the notes are assigned to toms of a plurality of pitches. A computer-readable recording medium on which is recorded.
1 5 . 請求の範囲 9乃至 1 1記載の楽譜読み取りプログラムを記録したコン ピュータ読み取り可能な記録媒体において、 前記表記法推定機能によりシンバル 系のドラム楽器に関するドラム表記法の推定を行う場合に、 黒玉以外のドラム符 頭が第 4間以上の五線位置にあることを条件として、 ドラム符頭の五線位置が 1 つの場合と 2つの場合とに応じて場合分けし、 またドラム符頭の種類に応じて上 記場合分けを細分化し、 更にドラム音符の旗により定まる音長、 該旗により求め
られた他のドラム音符の音長があることで符頭種類により定まる別の音長に応じ て上記場合分けをより細分化しておくと共に、 これらの場合分けに応じて変換テ 一ブルを作成しておき、 ドラム符頭の五線位置、 ドラム符頭の種類、 ドラム音符 に係るハイハツトオープンの記号、 ドラム音符に係るハイハツトクローズの記号、 ドラム音符に係るァクセント記号、 音符のドラム音指定のための文字列に応じて、 推定されるシンバル系のドラム楽器の種類を変換テーブル中に特定しておき、 該 変換テーブルに基づいてドラム表記法の推定を行うことを特徴とする請求の範囲15. In a computer-readable recording medium on which the musical score reading program according to claims 9 to 11 is recorded, when the notation estimation function estimates a drum notation for a cymbal-based drum instrument, the black notation is used. Provided that the drum note head other than the ball is at the staff position at or above the fourth interval, the drum note head is divided into one staff position and two staff members, and the drum note head The above case division is subdivided according to the type, and the pitch determined by the flag of the drum note, and the pitch determined by the flag Given the length of the other drum notes, the above case is further subdivided according to the different note length determined by the notehead type, and a conversion table is created according to these cases. In addition, the staff position of the drum note head, the type of the drum note head, the hi-hat open symbol related to the drum note, the hi-hat closed symbol related to the drum note, the accent symbol related to the drum note, and the designation of the drum sound of the note The type of cymbal-based drum instrument to be estimated is specified in a conversion table according to a character string used for the estimation, and the drum notation is estimated based on the conversion table.
9乃至 1 1記載の楽譜読み取りプログラムを記録したコンピュータ読み取り可能 な記録媒体。 A computer-readable recording medium that records the score reading program according to any one of items 9 to 11.
1 6 . 請求の範囲 1 5記載の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体において、 前記表記法推定機能により推定されたドラ ム表記法に従って、 認識されたドラムパートの記号に実際の発音楽器を割り当て る際に、 推定前に 4分音符として認識されたドラム音符に対し、 前記変換テープ ルの値が 2分音符を指定している場合は、 これらのドラム音符を 2分音符に変換 することを特徴とする請求の範囲 1 5記載の楽譜読み取りプログラムを記録した コンピュータ読み取り可能な記録媒体。 16. A computer-readable recording medium on which the score reading program according to claim 15 is recorded, wherein a symbol of the recognized drum part is actually added to the symbol of the recognized drum part in accordance with the drum notation estimated by the notation estimation function. When assigning pronunciation instruments, if the conversion table value specifies a half note for a drum note that was recognized as a quarter note before estimation, these drum notes are converted to half notes. A computer-readable recording medium storing the musical score reading program according to claim 15, which is converted.
1 7 . 楽譜のイメージを読み取ってその音楽記号を認識し、 演奏及び/又は 表示可能な楽譜形式に変換する楽譜読み取り方法において、 符尾情報を用いて符 頭のラベルを分離し、 符尾候補を走査して検出された該符尾候補周辺にある分離 ラベルを辞書とマッチングして、 ドラム符頭記号を認識し、 符尾と符頭の結合処 理を行うことを特徴とする楽譜読み取り方法。 17 7. In a score reading method of reading an image of a score and recognizing the musical symbol and converting it into a musical form that can be played and / or displayed, a note head label is separated using stem information, and a stem candidate is used. A music label reading method comprising matching a separation label around the stem candidate detected by scanning with a dictionary, recognizing a drum head symbol, and performing a stem-note head combining process. .
1 8 . 請求の範囲 1 7記載の楽譜読み取り方法において、 分離ラベルと辞書 とのマツチングに失敗した場合、 符尾候補の走査を続けて次に検出された符頭ラ ベルと前記分離ラベルとの結合処理を行つた後、 辞書とのマツチングを再度行う ことを特徴とする請求の範囲 1 7記載の楽譜読み取り方法。 18. In the score reading method according to claim 17, when matching between the separation label and the dictionary fails, scanning of stem candidates is continued and the next detected note head label and the separation label are compared. 18. The score reading method according to claim 17, wherein after performing the combining process, matching with the dictionary is performed again.
1 9 . 請求の範囲 1 8記載の楽譜読み取り方法において、 次に検出され結合 処理に使用された符頭ラベル自体についても辞書とマッチングさせ、 該マッチン グ結果の方が優先度が高い場合、 その認識結果を優先させることを特徴とする請 求の範囲 1 8記載の楽譜読み取り方法。
19. The score reading method according to claim 18, wherein the notehead label itself detected next and used in the combining process is also matched with the dictionary, and if the matching result has a higher priority, the The score reading method according to claim 18, wherein the recognition result is prioritized.
2 0 . 請求の範囲 1 8記載の楽譜読み取り方法において、 ラベル結合を繰り 返して行い、 その結合中にマッチングして認識された夫々の認識結果に優先度を つけ、 優先度の高い順に該認識結果を決定することを特徴とする請求の範囲 1 8 記載の楽譜読み取り方法。 20. In the score reading method according to claim 18, the label combining is repeatedly performed, and priorities are given to respective recognition results recognized and matched during the combining, and the recognition is performed in descending order of priority. 19. The score reading method according to claim 18, wherein the result is determined.
2 1 . 請求の範囲 1 7乃至 2 0記載の楽譜読み取り方法において、 符頭に接 触するタイを消去してラベル分離を行い、 該タイが接触している符頭を含むドラ ム音符の認識を行うことを特徴とする請求の範囲 1 7乃至 2 0記載の楽譜読み取 り方法。 21. In the score reading method as set forth in claims 17 to 20, the tie in contact with the note head is erased to perform label separation, and the drum note including the note head in contact with the tie is recognized. The score reading method according to any one of claims 17 to 20, wherein the score reading method is performed.
2 2 . 請求の範囲 1 7乃至 2 1記載の楽譜読み取り方法において、 符頭同士 が上下に接触した結合符頭自体を辞書に登録しておき、 この辞書と該結合符頭と のマッチングを行って、 結合符頭の認識を行うことを特徴とする請求の範囲 1 7 乃至 2 1記載の楽譜読み取り方法。 22. In the score reading method according to claims 17 to 21, the combined noteheads whose noteheads touch each other up and down are registered in a dictionary, and the dictionary is matched with the combined noteheads. The musical score reading method according to any one of claims 17 to 21, wherein a combined notehead is recognized.
2 3 . 請求の範囲 1 7乃至 2 2記載の楽譜読み取り方法において、 トレモロ 記号を辞書に登録しておき、 該トレモ口記号の認識を行ってそれを消去した後、 トレモ口記号を含んで表示されていた他のドラム音符の認識を行うことを特徴と する請求の範囲 1 7乃至 2 2記載の楽譜読み取り方法。 23. In the score reading method according to claims 17 to 22, the tremolo symbol is registered in a dictionary, and the tremolo mouth symbol is recognized and deleted, and then displayed including the tremolo mouth symbol. The score reading method according to any one of claims 17 to 22, wherein the other drum notes that have been read are recognized.
2 4 . 請求の範囲 1 7乃至 2 3記載の楽譜読み取り方法において、 符尾を分 断する符頭を有するドラム音符の認識時に、 符尾を分断する符頭とその上下の符 尾候補との結合を行って、 該符頭を共有する符尾逆向きのドラム音符を認識した 後、 符尾が下向きの音符を削除して、 上下の符尾を結合したものを符尾候補とし、 残りの符頭と結合させることを特徴とする請求の範囲 1 7乃至 2 3記載の楽譜読 み取り方法。 24. In the score reading method according to claims 17 to 23, when recognizing a drum note having a note head that divides a stem, a note head that divides a stem and candidate stems above and below it are recognized. After recognizing drum notes with opposite stems that share the note head by combining them, delete notes with lower stems and combine upper and lower stems as candidates for stems. The score reading method according to any one of claims 17 to 23, wherein the score reading method is combined with a note head.
2 5 . 請求の範囲 1 7乃至 2 3記載の楽譜読み取り方法において、 符尾上端 が五線より上に出ており且つ符尾下端が五線より下に出ていない場合に、 符尾は 上向き、 符尾下端が五線より下に出ており且つ符尾上端が五線より上に出ていな い場合に、 符尾は下向きと判断して、 先頭符頭と該符尾候補とを結合させること を特徴とする請求の範囲 1 7乃至 2 3記載の楽譜読み取り方法。 25. In the score reading method according to claims 17 to 23, when the upper end of the stem is above the staff and the lower end of the stem is not below the staff, the stem is directed upward. If the lower stem is below the staff and the upper stem is not above the staff, the stem is determined to be downward and the first note head is combined with the candidate stem. The musical score reading method according to any one of claims 17 to 23, wherein the musical score is read.
2 6 . 請求の範囲 2 4記載の楽譜読み取り方法において、 符尾を分断する符 頭を有する音符を含むドラム音符の認識時に、 これらのドラム音符の先頭符頭と
符尾候補の結合処理を行い、 符尾を分断する符頭を有するドラム音符については、 該符頭を共有する符尾逆向きのドラム音符を認識した上で、 符尾が下向きの音符 を削除して、 上下の符尾を結合したものを符尾候補として残りの先頭符頭と結合 させると共に、 他のドラム音符については、 符尾上端が五線より上に出ており且 っ符尾下端が五線より下に出ていない場合に、 符尾は上向き、 符尾下端が五線よ り下に出ており且つ符尾上端が五線より上に出ていない場合に、 符尾は下向きと 判断して、 該符尾候補と残りの符頭と結合させ、 これらの条件に合わないものは、 元の符尾候補に戻した後、 該符尾候補と残りの符頭とを結合させることを特徴と する請求の範囲 2 4記載の楽譜読み取り方法。 26. In the score reading method according to claim 24, when a drum note including a note having a note head that divides a stem is recognized, a leading note head of these drum notes is recognized. For a drum note having a notehead that divides a stem by performing the process of combining stems, a note with a stem that is downward is deleted after recognizing a drum note with an opposite stem that shares the notehead. Then, the combination of the upper and lower stems is combined with the remaining first noteheads as stem candidates, and for other drum notes, the upper end of the stem is above the staff and the lower end of the stem is If the stem is not below the staff, the stem is upward, if the bottom of the stem is below the staff and the upper stem is not above the staff, the stem is downward. Is determined, the candidate is combined with the remaining noteheads, and those that do not meet these conditions are returned to the original candidate, and then the candidate is combined with the remaining noteheads. The score reading method according to claim 24, wherein the score is read.
2 7 . 楽譜のイメージを読み取ってその音楽記号を認識し、 演奏及び/又は 表示可能な楽譜形式に変換する楽譜読み取りプログラムを記録したコンピュータ 読み取り可能な記録媒体において、 符尾情報を用いて符頭のラベルを分離するラ ベル分離機能と、. 符尾候補を走査する走査機能と、 該走査で検出された該符尾候 補周辺にある分離ラベルを辞書とマッチングして符頭の認識を行いドラム符頭を 認識する認識機能と、 認識された符頭と符尾候補とを結合する結合機能とを実行 させるための楽譜読み取りプログラムを記録したコンピュータ読み取り可能な記 録媒体。 27. On a computer-readable recording medium that stores a score reading program that reads an image of a score, recognizes the music symbol, and converts it into a playable and / or displayable score format, it uses the stem information to add noteheads. A label separation function for separating the labels of the characters, a scanning function for scanning the stem candidates, and matching the separation labels detected around the candidate stems detected by the scanning with the dictionary to recognize the note head. A computer-readable recording medium that stores a score reading program for executing a recognition function of recognizing a drum notehead and a combining function of combining a recognized notehead and a stem candidate.
2 8 . 請求の範囲 2 7記載の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体において、 分離ラベルと辞書とのマッチングの成否を 判定するマッチング判定機能と、 該マッチングに失敗した場合、 前記走査機能に より符尾候補の走査を続けさせて、 次に検出された符頭ラベルと前記分離ラベル との結合処理を行うラベル結合機能とを実行するプログラムを更に有し、 ラベル 結合後、 前記認識機能に対し、 結合されたラベルと辞書とのマッチングを再度行 わせることを特徴とする請求の範囲 2 7記載の楽譜読み取りプログラムを記録し たコンピュータ読み取り可能な記録媒体。 28. In a computer-readable recording medium recording the score reading program according to claim 27, a matching judgment function for judging success or failure of matching between the separation label and the dictionary; The program further includes a program that causes the scan function to continue scanning for stem candidates, and executes a label combining function of performing a combining process of the next detected note head label and the separation label. 28. A computer-readable recording medium storing a musical score reading program according to claim 27, wherein a matching function is performed again on the combined label and the dictionary for the recognition function.
2 9 . 請求の範囲 2 8記載の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体において、 次に検出され結合処理に使用された符頭ラ ベル自体についても、 前記認識機能により辞書とのマッチングを行わせ、 該マツ チング結果の方が優先度が高い場合、 その認識結果を優先させることを特徴とす
る請求の範囲 2 8記載の楽譜読み取りプログラムを記録したコンピュータ読み取 り可能な記録媒体。 29. In a computer-readable recording medium recording the score reading program according to claim 28, the note head label itself detected and used next for the combining process is also converted to a dictionary by the recognition function. Matching is performed, and if the matching result has a higher priority, the recognition result is given priority. A computer-readable recording medium storing the musical score reading program according to claim 28.
3 0 . 請求の範囲 2 8記載の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体において、 前記符頭認識及ぴラベル結合を繰り返して 行わせる間に、 その符頭認識中にマッチングして認識された夫々の認識結果に優 先度をつける優先度付加機能を実行させるためのプログラムを更に有し、 前記認 識機能で、 優先度の高い順に該認識結果を修正することを特徴とする請求の範囲 2 8記載の楽譜読み取りプログラムを記録したコンピュータ読み取り可能な記録 媒体。 30. In a recording medium readable by a computer recording the music score reading program according to claim 28, the notehead recognition and the label combination are repeatedly performed during the notehead recognition while the notehead recognition and label combination are repeatedly performed. It further comprises a program for executing a priority adding function for assigning priority to each of the recognized recognition results, wherein the recognition function corrects the recognition results in descending order of priority. A computer-readable recording medium recording the musical score reading program according to claim 28.
3 1 . 請求の範囲 2 7乃至 3 0記載の楽譜読み取りプログラムを記録したコ ンピュータ読み取り可能な記録媒体において、 符頭に接触するタイを消去するタ ィ消去機能を実行するプログラムを更に有し、 該消去後にラベル分離機能でラベ ル分離を行い、 前記認識機能で、 該タイが接触している符頭の認識を行うことを 特徴とする請求の範囲 2 7乃至 3 0記載の楽譜読み取りプログラムを記録したコ ンピュータ読み取り可能な記録媒体。 31. A computer-readable recording medium on which the score reading program according to claims 27 to 30 is recorded, further comprising: a program for executing a type erasing function for erasing a tie contacting a notehead, The musical score reading program according to any one of claims 27 to 30, wherein label separation is performed by a label separation function after the erasure, and the note head to which the tie is in contact is recognized by the recognition function. A computer-readable recording medium on which the data is recorded.
3 2 . 請求の範囲 2 7乃至 3 1記載の楽譜読み取りプログラムを記録したコ ンピュータ読み取り可能な記録媒体において、 符頭同士が上下に接触した結合符 頭自体を辞書に登録しておき、 前記認識機能でこの辞書と該結合符頭とのマッチ ングを行って、 結合符頭の認識を行うことを特徴とする請求の範囲 2 7乃至 3 1 記載の楽譜読み取りプログラムを記録したコンピュータ読み取り可能な記録媒体。 32. In a computer-readable recording medium on which a score reading program according to claims 27 to 31 is recorded, a combined note head in which note heads vertically contact each other is registered in a dictionary, and the recognition is performed. 31. A computer-readable recording recording a score reading program according to any one of claims 27 to 31, wherein the dictionary is matched with the combined notehead by a function to recognize the combined notehead. Medium.
3 3 . 請求の範囲 2 7乃至 3 2記載の楽譜読み取りプログラムを記録したコ ンピュータ読み取り可能な記録媒体において、 トレモロ記号を辞書に登録してお き、 前記認識機能で該トレモロ記号の認識を行うと共に、 該トレモロ記号を消去 する記号消去機能を実行するプログラムを更に有し、 消去後トレモ口記号を含ん で表示されていた他のドラム音符の認識を行うことを特徴とする請求の範囲 2 7 乃至 3 2記載の楽譜読み取りプログラムを記録したコンピュータ読み取り可能な 記録媒体。 33. In a computer-readable recording medium storing the score reading program according to claims 27 to 32, a tremolo symbol is registered in a dictionary, and the tremolo symbol is recognized by the recognition function. 27. A program according to claim 27, further comprising a program for executing a symbol erasure function for erasing said tremolo symbol, and performing recognition of another drum note displayed including the tremolo mouth symbol after erasure. 33. A computer-readable recording medium on which the musical score reading program according to any one of to 32 is recorded.
3 4 . 請求の範囲 2 7乃至 3 3記載の楽譜読み取りプログラムを記録したコ ンピュータ読み取り可能な記録媒体において、 符尾を分断する符頭を有するドラ
ム音符の認識時に、 前記結合機能によって符尾を分断する符頭とその上下の符尾 候補との結合を行って、 該符頭を共有する符尾逆向のドラム音符を前記認識機能 により認識した後実行される、 符尾が下向きの音符を削除する下向き音符削除機 能と、 上下の符尾を結合する符尾結合機能との実行プログラムを有しており、 結 合されたものを符尾候補として、 前記結合機能により残りの符頭と結合させるこ とを特徴とする請求の範囲 2 7乃至 3 3記載の楽譜読み取りプログラムを記録し たコンピュータ読み取り可能な記録媒体。 34. In a computer-readable recording medium having recorded the score reading program according to claims 27 to 33, a driver having a note head for dividing a stem. At the time of recognizing a note, a notehead that divides a stem by the combining function is combined with a candidate for a stem above and below the notehead, and a drum note having a notehead opposite to that sharing the notehead is recognized by the recognition function. It has an execution program of a down note deletion function that deletes notes with lower stems and a stem combination function that combines upper and lower stems, which are executed later. 34. A computer-readable recording medium storing a musical score reading program according to claim 27, wherein the remaining noteheads are combined by the combining function as candidates.
3 5 . 請求の範囲 2 7乃至 3 3記載の楽譜読み取りプログラムを記録したコ ンピュータ読み取り可能な記録媒体において、 符尾上端が五線より上に出ており 且つ符尾下端が五線より下に出ていない場合に、 符尾は上向き、 符尾下端が五線 より下に出ており且つ符尾上端が五線より上に出ていない場合に、 符尾は下向き と判断する符尾向き判定機能を実行するプログラムを更に有しており、 該判定を 行った後、 前記結合機能により先頭符頭と該符尾候補とを結合させることを特徴 とする請求の範囲 2 7乃至 3 3記載の楽譜読み取りプログラムを記録したコンビ ユータ読み取り可能な記録媒体。 35. In a computer-readable recording medium storing the score reading program according to claims 27 to 33, the upper end of the stem is above the staff and the lower end of the stem is below the staff. If not, the stem is upward, and if the lower stem is below the staff and the upper stem is not above the staff, the stem is judged to be downward. The method according to any one of claims 27 to 33, further comprising a program for executing a function, wherein after performing the determination, the leading notehead and the stem candidate are combined by the combining function. A computer-readable recording medium that stores a score reading program.
3 6 . 請求の範囲 3 4記載の楽譜読み取りプログラムを記録したコンビユー タ読み取り可能な記録媒体において、 符尾を分断する符頭を有する音符を含むド ラム音符の認識時に、 前記結合機能によりこれらのドラム音符の先頭符頭と符尾 候補の結合処理を行い、 符尾を分断する符頭を有するドラム音符については、 前 記認識機能により、 該符頭を共有する符尾逆向きのドラム音符を認識した上で、 前記下向き音符削除機能により、 符尾が下向きの音符を削除して、 前記符尾結合 機能により上下の符尾を結合したものを符尾候補として、 更に前記結合機能によ り残りの先頭符頭と結合させると共に、 他のドラム音符については、 前記符尾向 き判定機能により、 符尾上端が五線より上に出ており且つ符尾下端が五線より下 に出ていない場合に、 符尾は上向き、 符尾下端が五線より下に出ており且つ符尾 上端が五線より上に出ていない場合に、 符尾は下向きと判断して、 前記結合機能 により該符尾候補と残りの符頭と結合させる他、 これらの条件に合わないものは、 元の符尾候補に戻す符候補復帰機能を実行するためのプログラムを更に有してお り、 元の符尾候補に復帰後、 結合機能により該符尾候補と残りの符頭とを結合さ
せることを特徴とする請求の範囲 3 4記載の楽譜読み取りプログラムを記録した コンピュータ読み取り可能な記録媒体。
36. In a computer-readable recording medium recording the score reading program according to claim 34, when a drum note including a note having a note head that divides a stem is recognized, the combining function is used to recognize these notes. For a drum note having a note head that divides a stem by performing a process of combining the first note head and the stem candidate of the drum note, the above-mentioned recognition function is used to generate a note note in the opposite direction that shares the note head. After recognition, the downward note deletion function deletes notes with lower stems, and the upper and lower stems combined by the stem combination function are used as stem candidates, and further by the combination function. In addition to combining with the rest of the first notehead, for the other drum notes, the above-mentioned stem-steering function determines that the upper end of the stem is above the staff and the lower end of the stem is below the staff. Absent In this case, if the stem is upward, the lower end of the stem is below the staff and the upper end of the stem is not above the staff, it is determined that the stem is downward and the combining function determines that the stem is downward. In addition to combining the stem candidates with the rest of the noteheads, those that do not meet these conditions also have a program to perform a note candidate recovery function that restores the original stem candidates, After returning to the tail candidate, the combining function links the stem candidate with the remaining noteheads. A non-transitory computer-readable recording medium storing the musical score reading program according to claim 34.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/254,282 US6137041A (en) | 1998-06-24 | 1998-06-24 | Music score reading method and computer-readable recording medium storing music score reading program |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19796997A JP3597343B2 (en) | 1997-07-09 | 1997-07-09 | Method of reading musical score and computer-readable recording medium recording musical score reading program |
JP9/197969 | 1997-07-09 | ||
JP27495297A JP3597354B2 (en) | 1997-09-24 | 1997-09-24 | Music score recognition method and computer readable recording medium recording music score recognition program |
JP9/274952 | 1997-09-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2004088630A1 true WO2004088630A1 (en) | 2004-10-14 |
Family
ID=33133300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP1998/002806 WO2004088630A1 (en) | 1997-07-09 | 1998-06-24 | Method of reading music and computer-readable recording medium having music-reading program recorded therein |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2004088630A1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129159A (en) * | 1993-11-05 | 1995-05-19 | Yamaha Corp | Sheet of music recognition device |
JPH07225817A (en) * | 1994-02-15 | 1995-08-22 | Yamaha Corp | Musical score reader |
JPH0997061A (en) * | 1995-09-29 | 1997-04-08 | Kawai Musical Instr Mfg Co Ltd | Musical score recognition device |
-
1998
- 1998-06-24 WO PCT/JP1998/002806 patent/WO2004088630A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07129159A (en) * | 1993-11-05 | 1995-05-19 | Yamaha Corp | Sheet of music recognition device |
JPH07225817A (en) * | 1994-02-15 | 1995-08-22 | Yamaha Corp | Musical score reader |
JPH0997061A (en) * | 1995-09-29 | 1997-04-08 | Kawai Musical Instr Mfg Co Ltd | Musical score recognition device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6137041A (en) | Music score reading method and computer-readable recording medium storing music score reading program | |
US7626109B2 (en) | Performance teaching apparatus and program for performance teaching process | |
US7847175B2 (en) | Musical score recognition device and computer program thereof | |
US5864631A (en) | Method and apparatus for musical score recognition with quick processing of image data | |
JP3597343B2 (en) | Method of reading musical score and computer-readable recording medium recording musical score reading program | |
US6414231B1 (en) | Music score display apparatus with controlled exhibit of connective sign | |
JP4738135B2 (en) | Music score recognition apparatus and music score recognition program | |
JP2734340B2 (en) | Music score recognition device | |
JP2682382B2 (en) | Music score recognition device | |
WO2004088630A1 (en) | Method of reading music and computer-readable recording medium having music-reading program recorded therein | |
JP2003242438A (en) | Musical score recognizing device | |
JP3608674B2 (en) | Score recognition device | |
JP3597354B2 (en) | Music score recognition method and computer readable recording medium recording music score recognition program | |
JP5770445B2 (en) | Music score recognition apparatus and computer program | |
JP2682383B2 (en) | Music score recognition device | |
JP3835456B2 (en) | Automatic composer and storage medium | |
JP3558835B2 (en) | Music score recognition method and computer readable recording medium recording music score recognition program | |
JP2979409B2 (en) | Music score recognition method and apparatus | |
JP3812836B2 (en) | Score recognition device | |
JP5189952B2 (en) | Music score recognition apparatus and computer program | |
JP2867844B2 (en) | Music score recognition device | |
JP3649886B2 (en) | Music score recognition method and computer readable recording medium having recorded music score recognition program | |
JP2650605B2 (en) | Music score recognition device | |
JP3613356B2 (en) | Score recognition device | |
JPH0997060A (en) | Musical score recognition device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WWE | Wipo information: entry into national phase |
Ref document number: 09254282 Country of ref document: US |
|
AK | Designated states |
Kind code of ref document: A1 Designated state(s): US |