JPS6072087A - Music sheet recognizing device - Google Patents

Music sheet recognizing device

Info

Publication number
JPS6072087A
JPS6072087A JP58179019A JP17901983A JPS6072087A JP S6072087 A JPS6072087 A JP S6072087A JP 58179019 A JP58179019 A JP 58179019A JP 17901983 A JP17901983 A JP 17901983A JP S6072087 A JPS6072087 A JP S6072087A
Authority
JP
Japan
Prior art keywords
processor
dedicated
histogram
peak
density distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58179019A
Other languages
Japanese (ja)
Other versions
JPH051513B2 (en
Inventor
Akira Toda
明 戸田
Masa Saito
斉藤 雅
Makoto Nagao
真 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP58179019A priority Critical patent/JPS6072087A/en
Publication of JPS6072087A publication Critical patent/JPS6072087A/en
Publication of JPH051513B2 publication Critical patent/JPH051513B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations

Abstract

PURPOSE:To execute a music sheet recognition at a high speed and in parallel by using the respective exclusive processors for processings such as generation of a histogram, segmenting of a peak, matching, etc. which are required for recognizing a music sheet. CONSTITUTION:A density distribution in the horizontal axis direction of a density data of every one record of a music sheet, and a density distribution in the vertical axis direction are derived by an X histogram generating exclusive processor 2 and a Y histogram generating exclusive processor 3, respectively. A peak position of the density distribution is detected by a peak segmenting exclusive processor 5. From the density distribution in the vicinity of a segmented peak position, a black circle note and a bar line, and a music symbol and a white circle note are recognized by a one-dimensional matching exclusive processor 6 and a two-dimensional matching exclusive processor 7, respectively. An optical scanner 1 and the whole exclusive processor are controlled by a main processor 8.

Description

【発明の詳細な説明】 この発明は楽譜の認識に必要なヒストグラムの作成、ピ
ークの切り出し、マツチング等の処理?それぞれIJj
用のプロセンサを用いることによって高速に並列して行
なうことが可能な楽譜認識装置に関する。
[Detailed Description of the Invention] This invention performs processing such as creating histograms, extracting peaks, and matching necessary for musical score recognition. IJj respectively
This invention relates to a music score recognition device that can perform high-speed parallel recognition by using a professional sensor.

楽譜の認識は、ルーコード分の濃度データを光学的に読
取り、横セ11方向の濃度分布(Xヒストグラム)をめ
た後に縦軸方向の濃度分布(Yヒストグラム)に変換し
、縦軸方向の濃度分布の最大値に対する所定率をスレン
ショルドとして定め、このスレンショルトで横軸方向の
e 度分布ヲカント(ゲタI)J ’J )することに
より楽譜の−Ji線の濃度影響を除去すると共に、五線
の幅の所定率によりカントされた横軸方向の濃度分布か
らピークイ)装置を検出しくピーク切出し)、ピーク位
置の面積とピーク位置の左右所定幅の面積との比率から
黒丸のγY符(四分音符、残分音符等)及び小節線を識
別する(1次元マツチング)ようにし、楽譜記号(#、
し、−等)及び白丸のi’l?、T (全音符、三方8
名1)の認識には、例えば対象記号等に対して1°°及
び“−1°″のデータで成る辞書r゛と、“1゛°及び
“0°′のデータで成る辞書f°とを用意しておき、認
識対象領域からマンチングの対象記時を“・l ”及び
O″のデータ名で抽出すると共に、fX、3=b又はf
’Xg=cをめ、認識対象菌1歳の°゛じ領域をβとし
、た場合、Sfg= b#又はSrg=cQ7なる式で
類似度をめる(2次元マツチング)ようにしたものであ
る。
Music score recognition involves optically reading the density data for the lou chord, determining the density distribution in the 11 horizontal directions (X histogram), converting it to the density distribution in the vertical axis direction (Y histogram), and converting it to the density distribution in the vertical axis direction (Y histogram). A predetermined ratio with respect to the maximum value of the density distribution is determined as Threnskjöld, and by using this Threnskjöld to count the e degree distribution in the horizontal axis direction (Geta I)J'J), the density influence of the -Ji line of the musical score is removed, and the staff From the concentration distribution in the horizontal axis direction canted by a predetermined ratio of the width of the peak, the device detects the peak and extracts the peak), and from the ratio of the area of the peak position and the area of the predetermined width on the left and right of the peak position, the γY mark of the black circle musical notes, residual notes, etc.) and bar lines (one-dimensional matching), and musical notation symbols (#,
shi, -, etc.) and white circle i'l? , T (whole note, three-way eight
Name 1) requires, for example, a dictionary r゛ consisting of data of 1°° and "-1°" for the target symbol, etc., and a dictionary f° consisting of data of "1゛° and "0°''. is prepared, and the target time of munching is extracted from the recognition target area with the data names "・l" and "O", and fX, 3=b or f
If 'Xg=c' is taken, and the difference region of the 1-year-old bacterium to be recognized is β, then the similarity is calculated using the formula Sfg=b# or Srg=cQ7 (two-dimensional matching). be.

第1図はこのような一連の処理を示すフロー壬ヤードで
あり、従来ルーコートに対して一連の処理を終1′シて
から次のレコー1の処理を行なっており楽譜の認識に多
くの11ν間を要していた。そこで、行処理をそれぞれ
専用のプロセンサを用いることによって、1r列処理す
れば高速の楽譜認識が11目赴となる。よって、この発
明の目的は楽譜の認識に必要な各処理をそれぞれ専用の
プロセンサで高速に並列処理する楽譜認識装置を提供す
ることにある。
Figure 1 shows a flowchart showing such a series of processing. Conventionally, the next record 1 is processed after completing the series of processing for the roux court, and many 11ν are required for musical score recognition. It took a while. Therefore, by using dedicated processors for row processing and performing 1r column processing, high-speed musical score recognition can be achieved by 11 steps. Therefore, an object of the present invention is to provide a musical score recognition device that performs each process necessary for musical score recognition in parallel at high speed using dedicated processors.

以下にこの発明を説明する。This invention will be explained below.

第2図はこの発明の実施例の概略構成を示す図であり、
楽譜のルコードごとの濃度データを読み取る光学スキャ
ナ1と、濃度データの横軸方向の濃度分!1をめるXヒ
ストグラム作成専用プロセッサ2と、縦軸方向の濃度分
布をめるYヒストグラ1、作成r/、f用プロセッサ3
と、Xヒスドグラド作成tt/用プロセッサ2又はYヒ
スI・グラム作成専用プロセンサ3によって作成された
濃度分布から一定値を差し引いて新しい濃度分布とする
ゲタリノリ専用プロセンサ4と、濃度分41のピーク位
置を検出干るピーク切出し専用プロセンサ5と、ピーク
ジノ出し「」♂用プロセッサによって切り出されたピー
ク位置・1・j近の濃度分布から黒丸のγを符(四分1
′?符、残分音符等)及び小節線を認識する1次元マツ
チング専用プロセッサ6と、楽譜記号(#。
FIG. 2 is a diagram showing a schematic configuration of an embodiment of the present invention,
An optical scanner 1 that reads the density data for each code of the musical score, and the density of the density data in the horizontal axis direction! 1, a processor 2 dedicated to creating an X histogram, a Y histogram 1, creating a density distribution in the vertical axis direction, and a processor 3 for creating r/, f.
and a processor 4 dedicated to Getari Nori, which subtracts a certain value from the density distribution created by the processor 2 for creating X Hisdog Grad or a processor 3 dedicated to creating YHis I/gram to create a new density distribution, and a processor 4 dedicated to Getari Nori that creates a new density distribution. From the density distribution near the peak position, 1, j, which is extracted by the professional sensor 5 for extracting the detected peak and the processor for extracting the peak, the black circle γ is marked (quarter 1
′? A processor 6 dedicated to one-dimensional matching recognizes musical score symbols (#, etc.) and bar lines.

b雰、)及び白丸の音符(全音省、三方音符)を認識す
る2次元マンチング専用プロセンサ7と、光学スキャナ
lと専用プロセッサ全体を制御するメインプロセンサ8
とによって構成され、−律の処理を同時平行し、て行な
うことによって高速な楽譜1認識か可能なように1〜だ
ものである。
A two-dimensional munching-dedicated professional sensor 7 that recognizes notes (b atmosphere, ) and white circles (whole notes, three-way notes), and a main professional sensor 8 that controls the optical scanner l and the entire dedicated processor
It is configured by 1 to 1 to enable high-speed musical score recognition by performing the -temperament processing simultaneously and in parallel.

このような構成において、先ずメインプロセッサ8の指
示によって光学スキャナ1は第3図(A)に示すように
楽、、ff 9の最初のレコードつまりレコ−1・lの
濃lWデータを読み珈るとこれをXヒストグラ1、作成
専用プロセンサ2に送り、次のレコ−I・つまりレコ−
1・2の濃度データの読み取りを始める。
In such a configuration, the optical scanner 1 first reads the dark lW data of the first record of ff9, that is, record 1.l, as shown in FIG. 3(A), according to instructions from the main processor 8. and send this to
Start reading the concentration data of 1 and 2.

×ヒスI・グラム?′1″成専用プロセンサ2はレコー
ドJ、 +7)濃度データから第2図(B)に示すよう
に横+111+方向Xの濃度分布曲線(Xヒストグラム
)10をめる。この場合、第3図(八)にボすようなざ
将のある場所間、 N2では、H符の打針の濃度データ
がその+11+に沿って累積されることになるので、同
図(B)に;iie −f !tn <濃度データのピ
ークイii P I 、 P 2 、 P 3として出
力されることになる。XヒスI・グラム作成専用プロセ
ンサ2はこのようにしてレコードlのXヒストグラムl
Oをめると、これをYヒストグラム作成専用プログセッ
サ2及びゲタ切り専用プロセンサ4に送り、既に光学ス
キャナ1で読み取られているレコード2のXヒストグラ
ムを作成し始める。
×His I Gram? The professional sensor 2 dedicated to the '1'' generation calculates the density distribution curve (X histogram) 10 in the horizontal +111+ direction X from the record J, +7) density data as shown in Figure 2 (B). 8) Between the places where there is a stroke like a stroke, at N2, the concentration data of the H mark needle is accumulated along the +11+, so in the same figure (B); iie -f !tn <Peak II of concentration data will be output as P I , P 2 , P 3. The X-Hist I/gram creation processor 2 will thus create the
When O is entered, it is sent to the Y histogram creation dedicated processor 2 and gap cut dedicated processor 4, and the creation of the X histogram of the record 2 that has already been read by the optical scanner 1 is started.

Yヒストグラム作成専用プロセッサ3はレコード1のX
ヒストグラム10を第3図(C)に示すように縦軸方向
Yの濃度分布曲線(Yヒストグラム)IIに変換する。
Processor 3 dedicated to Y histogram creation is X of record 1
The histogram 10 is converted into a density distribution curve (Y histogram) II in the vertical axis direction Y as shown in FIG. 3(C).

すなわち、第3図(B)のXヒストグラム10の(1ス
(をそれぞれ横軸方向に累積し、その累積動作を順次−
■三方(又はド方)に移動して行くことにより、同図(
C)に示すようにXヒストグラム10に対するXヒスト
グラム11か得られる。次にYヒストクラム作成専用プ
ロセッサ3はこのYヒストグラム、、11の最大4fj
 X maのたとえば80χをスレンショルトxoとし
、これに対応する墨Y0をめてこれをゲタ切り専用プロ
セ5.す4に送った後。
That is, (1 step) of the X histogram 10 in FIG. 3(B) is accumulated in the horizontal axis direction, and the cumulative operation is sequentially
■ By moving to three directions (or two directions), the same figure (
As shown in C), X histogram 11 is obtained for X histogram 10. Next, the Y histogram creation processor 3 generates a maximum of 4 fj of this Y histogram, , 11.
For example, 80χ of X ma is taken as Thrensholt xo, the corresponding ink Y0 is set, and this is cut by a dedicated process5. After sending it to Su4.

既にXヒストグラム作成専用プロセ、す2で作成されて
いるレコード2のXヒストグラムのYヒスi・グラムを
作成し始める。
Start creating the Y histogram of the X histogram of record 2, which has already been created by the X histogram creation dedicated process, S2.

ゲタ切り専用プロセッサ4はXヒストグラム作成専用プ
ロセンサ2の作成したレコード1のXヒストグラムlO
からYヒストグラム作成専用プロセ、す3のめた量Y0
を第3図(D)に示すようにカフ・トする。このことに
よっ−(、五線の濃度データ分か除去された音符(休符
を含む)や小節線で59の音楽情報のみの濃度分布曲線
12が第31図(E)のようにめられる。これは、楽譜
9の濃度分布を第31Δ(A)、(B)のようにして縦
方向の累積値でめた場合、!j°線は常に楽譜9の走査
範囲にあり、その11線の濃度データが常に累積されて
楽譜9の濃度分4jとして表われることを考慮したもの
てあり、そのh−線の濃度データ分だけを全体から除去
することにより、五線上に記載されている音′l、7や
小rrJ1線等の音楽情報のみの濃度データを抽出する
ようにしたものである。クータリノリ専用ブロセ・ンサ
4はこのようにしてレコードlの音楽情報のみの濃度分
布曲線12を作成すると、これをピーク切出し専用プロ
セッサ5.1次元マツチング専用プロセッサ6及び2次
元専用プロセンサ7に送った後、レコード2に対する同
様の処理を開始する。
The processor 4 dedicated to gap cutting generates the X histogram lO of the record 1 created by the processor 2 dedicated to creating the X histogram.
Dedicated process for creating Y histogram from Y0
cuff as shown in Figure 3(D). As a result, a density distribution curve 12 containing only 59 pieces of music information at the notes (including rests) and bar lines, which have been removed from the staff density data, can be seen as shown in Figure 31 (E). .This means that when the density distribution of score 9 is determined by the cumulative value in the vertical direction as shown in the 31st Δ(A) and (B), the !j° line is always within the scanning range of score 9, and the 11th line This method takes into account the fact that the density data of the music score 9 is always accumulated and appears as the density 4j of the score 9, and by removing only the density data of the h-line from the whole, the notes written on the staff are The density data of only the music information such as 'l, 7 and small rrJ1 line is extracted.The brosé sensor 4 dedicated to Kutarinori creates the density distribution curve 12 of only the music information of record l in this way. Then, after sending this to a processor dedicated to peak extraction 5, a processor dedicated to one-dimensional matching 6, and a processor dedicated to two-dimensional processing 7, similar processing for record 2 is started.

ピーク切出し専用プロセッサ5は、−レコード1の楽譜
情報のみの濃度分布曲線12を、五線の幅のたとえば8
0%の高さxIでその大小を比較することにより、第4
図に示すように濃度分布曲線12のピークPC,及びP
O2を検出する。このことによって¥r符の打針又は小
節線が検出されたことになり、ピーク切出し専用プロセ
、す5は、これらのピークの位置を1次元マンチング専
IT、Iプロセッサ6に送った後、レコード2に対する
同様の処理を開始する。
The peak extraction dedicated processor 5 converts the density distribution curve 12 of only the musical score information of the record 1 into the width of the staff, for example, 8.
By comparing the size at 0% height xI, the fourth
As shown in the figure, the peaks PC and P of the concentration distribution curve 12
Detect O2. This means that the striking needle or bar line of the ¥r mark has been detected, and the peak extraction dedicated process 5 sends the positions of these peaks to the one-dimensional munching dedicated IT, I processor 6, and then records 2. Start similar processing for .

■次元マツチング専用プロセンサ6は、ゲタ切り+J、
j川プロ用ッサ4の作成したレコー1゛lの音楽情報の
みの濃度分布曲線12のうちピークジノ出し専 ・用プ
ロセッサ5で検出されたピークを持つ部分について、そ
の部分の濃度パターンから黒丸の音符及び小#線を認識
する6まず、■次元マ・ンチング専用プロセッサ6はピ
ークPC1及びPO2についてその中心から左右に対し
て所定@D+の範囲内にある分布曲線の面積S2を第5
図(A)、(B)のようにしてそれぞれめる。さらに、
範囲Dlからそれぞれ左右外側に距#dだけ離れた位4
から、距M 07の範囲内にある分布曲線の面積S1及
びSjをそれぞれめる。このようにして、ピークpc、
 、 PO2に対する濃度分布曲線の中央部D1の面積
S2 と、中心から所定圧111(tD 4 DI)の
範囲り、にある濃度分布曲線の面積S、、S:I とを
メル。ソシテ、面積S2トII’i口J’j(St +
s3.)との大小を比較し。
■Prosensor 6 dedicated to dimensional matching has gap cut +J,
Of the density distribution curve 12 of only the music information of the record 1 created by the professional processor 4, for the part with the peak detected by the dedicated processor 5, the black circle is determined from the density pattern of that part. Recognizing musical notes and small # lines 6 First, the ■dimensional machining processor 6 calculates the area S2 of the distribution curve within a predetermined range @D+ from the center to the left and right for the peaks PC1 and PO2.
Set them as shown in Figures (A) and (B). moreover,
Place 4 away from range Dl by distance #d to the left and right outside respectively
Then, find the areas S1 and Sj of the distribution curves within the range of distance M07, respectively. In this way, peak pc,
, the area S2 of the central portion D1 of the concentration distribution curve for PO2, and the area S, , S:I of the concentration distribution curve in the range of a predetermined pressure 111 (tD 4 DI) from the center. area, area S2 to II'i mouth J'j (St +
s3. ) compared in size.

s、 + SA> s、 ノ20% −・−・−(1)
の場合には当該ピーク位置にド丁符があると認識し、 S、+33 ≦82の20z・・・・・・・・・(2)
の場合には当該ピーク位置が小節線であると認識する。
s, + SA> s, ノ20% −・−・−(1)
In the case of , it is recognized that there is a dot mark at the peak position, and 20z of S, +33 ≦82... (2)
In this case, the peak position is recognized as a bar line.

これは小節線の近傍には符頭他の音楽情報が存在するこ
とがなく、音符の近傍には特定ゆ特恵等の音楽情報が存
在することに基づくものである。なお、第5図(A)は
5I=S3=Oで上記(2)式を満足するので小節線の
場合を示し、同rA(B)は上記(1)式を満足するの
で音符があると認識される。以Hのようにして音符と小
節線とを識別すると、1次元マツチング専用プロセンサ
6は第6図(A)に示すように音符の符頭H及び打針F
を含み領域に長形状の読出用ウィンドWを設定し、この
ウィンドW内の横軸方向の濃度分布を同図(B)に示す
ようにめると共に、同図(G)に示すような縦軸方向の
濃度分布をめる。ここにおいて、種々の音符(四分音符
、へ分音符、付点四分音♀″J等)の横軸方向の濃度分
布曲線及び縦軸方向の谷濃度分4月111はtめ1次元
マンチング専用プロセ、す6のメモリ内の辞書に登録さ
れており、この辞書のデータと第6図(A) 、 ((
1:)のようにしてめられた音符の各濃度データとを比
較し、第6図(A)、(B)の濃度データがどの音符に
最も類似しているかをrl+断する。なお、三方音符の
場合には、打針部分がピーク9ノ出し専用ブロセ・ンサ
5によつて検出されこの1次元マツチング専用プロセン
サ6の処理の対象となるが符頭部分が濃度データとして
は鮮明にfl)られないので認識不可とし、次の2次元
マツチング専用プロセンサ7で処理する。
This is based on the fact that there is no music information such as noteheads near the bar line, and there is music information such as special privileges near the notes. Note that Figure 5 (A) shows the case of a bar line because 5I = S3 = O and satisfies the above formula (2), and rA (B) satisfies the above formula (1), so if there is a note, Recognized. When a note and a bar line are identified as shown in H below, the one-dimensional matching processor 6 identifies the note head H and strike F of the note as shown in FIG. 6(A).
A rectangular readout window W is set in the region including Calculate the concentration distribution in the axial direction. Here, the concentration distribution curves of various notes (quarter note, half note, dotted quarter note ♀''J, etc.) along the horizontal axis and the valley concentration along the vertical axis (April 111) are tth one-dimensional munching. It is registered in the dictionary in the memory of the dedicated process 6, and the data in this dictionary and Figure 6 (A), ((
1:) are compared with each density data of the notes determined as shown in FIG. 6(A) and (B), and it is determined which note the density data of FIGS. In the case of a three-way note, the striking part is detected by the professional sensor 5 dedicated to peak 9 note detection and processed by the one-dimensional matching professional sensor 6, but the note head part is clearly defined as density data. fl) cannot be recognized, and is processed by the next professional sensor 7 dedicated to two-dimensional matching.

このようにして、1次元→ッチング専用プロセッサ6は
レコードlの黒丸の音符及び小節線を認識した後、レコ
ード2に対する同様の処理を開始する。
In this way, the one-dimensional → touching processor 6 recognizes the notes and bar lines of the black circles in the record 1, and then starts similar processing for the record 2.

2次元マツチング専用プロセンサ7は ゲタ切り専用プ
ロセンサ4の作成したレコード1の音楽情報のみの濃度
分布曲線12のうち、ピーク切出しI17川プロセンサ
5で検出されない部分、つまり#、b等の楽譜記号及び
全音符と、1次元マツチング専用プロセンサ6では認識
できない74分音符とを認識する。
The two-dimensional matching professional sensor 7 extracts the peaks of the density distribution curve 12 of only the music information of the record 1 created by the gap-cutting professional sensor 4, and detects the portions that are not detected by the peak cutting I17 river professional sensor 5, that is, musical score symbols such as #, b, etc. To recognize musical notes and 74th notes that cannot be recognized by the one-dimensional matching dedicated prosensor 6.

まず#、シ等の楽譜記号及び全音符の場合には2軟元マ
ンチング専用プロセ、す7は第7図に示ずようなIj−
tJa等を消去した画像エリア13からマ・ンチングを
行なうための対象物(この例では#)をジノ出すための
ジノ出し範囲14を定め、切出し範囲14で定められた
切出し画像をマツチングを行なうエリア15に移動する
。なお、このマツチングエリア15は切出し画像よりも
少し大きくなっている。そして、別に2次元マンチング
専用プロセ、す7のメモリ内に予め用意しておいたマツ
チング川の辞書を、マツチングエリア15内で動かして
両者のマツチングを行なうようにしている。
First, in the case of musical score symbols such as # and B, and whole notes, there is a special process for 2 soft element munching, and S7 is a process for Ij-
An area 14 for extracting a target object (# in this example) for machining is determined from an image area 13 in which tJa etc. have been deleted, and the cutout image defined by the cutout range 14 is matched. Move to 15. Note that this matching area 15 is slightly larger than the cutout image. Then, a dictionary of matching rivers previously prepared in the memory of a separate two-dimensional munching dedicated process 7 is moved within the matching area 15 to perform matching between the two.

ここにおいて、7tIjB図(A)に示す画像(#)を
、辞書に登録されている同図(B)に示すような記号(
−)とマ・ンチングを行なう場合、その形状の異なる部
分はp及びQにおいて顕著である。そして、画像に関し
ては第9図(A)に示すように画像部分を“1″とし、
その他の領域を“0°°とすると共に、辞書には第9図
(B)に示すような画像部分をl”として周囲を全て0
゛°とするデータと、同図(C)に示すように画像部分
を“1′′として周囲を全て“−1″とするデータとを
用意しておき、第8図(A)の2部分と同図(B)のQ
部分とを論理演算により比較するようにしている。すな
わち、第9図(A)に示すp、、p、と同図(8)に示
すQ+ +’ Q3及び同図(C)に示すQ2.Q4と
の画素データ毎の論理積をめ、後述する類似度からその
積f〆iを減算するようにして類似程度を判断するよう
にしている。つまり、第9図(A)と(B)どの場合に
は、 P1×QI+P2×Q3=0であるから類似度に
影響はない。これに対して、第9図(A)ト(C)との
場合には、P、XQ2+P、 X Q4=−6であるか
ら類似度から「6」を減算し、その減算値を類似度とす
る。したがって、前記の場合には画像が辞書より大きく
ても類似度(−は変化かなく、形状の違いが評価されな
い。これに対し、後者の’t)合には画像が大きいと七
の分だけ類(μ度から差苦に基つ〈値が減算されるので
、辞書との違いが強調され−C評価されることになる。
Here, the image (#) shown in 7tIjB diagram (A) is replaced with the symbol (#) shown in the same diagram (B) registered in the dictionary.
-), the difference in shape is noticeable at p and Q. As for the image, as shown in FIG. 9(A), the image part is set to "1",
The other areas are set to "0°°," and the image part shown in Figure 9 (B) is set to "l" in the dictionary, and all surrounding areas are set to 0°.
8 (C), and data where the image part is set to "1'' and the surrounding area is all set to "-1" are prepared. and Q in the same figure (B)
The parts are compared using logical operations. That is, p, , p shown in FIG. 9(A), Q+ +' Q3 shown in FIG. 9(8), and Q2. shown in FIG. 9(C). The degree of similarity is determined by calculating the logical product with Q4 for each pixel data and subtracting the product f〆i from the degree of similarity described later. That is, in both cases of FIG. 9 (A) and (B), since P1×QI+P2×Q3=0, there is no influence on the degree of similarity. On the other hand, in the case of Figure 9 (A) and (C), since P, XQ2+P, do. Therefore, in the above case, even if the image is larger than the dictionary, the similarity (- does not change and the difference in shape is not evaluated. On the other hand, in the latter case 't), if the image is larger, the similarity is 7 times larger than the dictionary. Since the value based on the difference is subtracted from the class (μ degree), the difference from the dictionary is emphasized and it is evaluated as -C.

ここで、第9図(A)の画像をgとし、第9図(B)に
示すような゛′lパ及び0°゛のデータの記taで成る
辞書をfとし、同図(C)に示すような1”及び−1“
°のデータで成る辞書をr′とした場合、 fXgによ
る#のマツチング方式では、#と#で高い類似度を得、
#と鵡では形状の差が現われる。これにより#との区別
ができる。これに対し、f’Xgのマッシング方式では
、#と#において画像gのずれに敏感となり、類似度は
低く、#と−の類似度と同じになり、#と鵡の区別かし
にくい。また、l:Iのマツチングにおいて、 fXg
のマツチングでは−と#で−は#に毛なってしまい、類
似度が高くなり、−と−の類似度と同りになり、#と−
の区別ができない。これに大して、f’Xgのマツチン
グ方式においては、−と#で形状の違いが強調されて類
似度が小さくなるので、#との区別ができるのである。
Here, the image in FIG. 9(A) is designated as g, the dictionary consisting of the data entry ``'l'' and 0°'' as shown in FIG. 9(B) is designated as f, and the image in FIG. 9(C) is 1" and -1" as shown in
If r′ is a dictionary consisting of data of
There is a difference in shape between # and parrot. This allows it to be distinguished from #. On the other hand, in the f'Xg mashing method, # and # are sensitive to the deviation of images g, and the degree of similarity is low and is the same as that between # and -, making it difficult to distinguish between # and a parrot. Also, in l:I matching, fXg
In the matching of - and #, - becomes #, the similarity becomes high, and it becomes the same as the similarity between - and -, and # and -
I can't tell the difference. On the other hand, in the f'Xg matching method, the difference in shape between - and # is emphasized and the degree of similarity is reduced, so that they can be distinguished from #.

次に、類19度の91算方法を説明する。第10図に示
すように対象画像gの黒の部分を“じとし、白の部分を
“0゛°とし、黒(“1゛)の総、−1を!とすると、
記号#については fXg = b ・・・・・・・・・ (3)の辞書を
用い、類似度S4gを S、g、=b/、f X 100 (%〕 ・・・叫・
・ (4)でめる。そして、記号#以外の記号、たとえ
ばす、−等の楽譜記号に関しては f“Xg=c ・・・・・・・・・ (5)を用い、そ
の類似度Srgを S r g= c/ (! X l 00 (%〕・・
・・旧・・(6)なるλ1算でめるようにしている。な
お、上記画像と辞書とのマツチングは構成画素毎に行な
うようにしているので、結局上記(3)及び(5)式は
画素データをG(i、j’l及びF(i、j)とすると
、次の式のようになる。
Next, we will explain how to calculate 91 for class 19 degrees. As shown in Fig. 10, if the black part of the target image g is "the same", the white part is "0°", and the total black ("1") is -1!, then
For the symbol #, fXg = b ...... Using the dictionary in (3), calculate the similarity S4g as S, g, = b/, f X 100 (%)...
・(4) Decide. For symbols other than symbol #, for example, musical score symbols such as -, use f"Xg=c (5), and calculate the similarity Srg by !X l 00 (%)...
...Old...It can be determined by the λ1 calculation (6). Note that since the above image and dictionary are matched for each constituent pixel, the above equations (3) and (5) can be used to convert pixel data into G(i, j'l and F(i, j)). Then, the formula becomes as follows.

fXg −ΣΣF(i、j)拳G(i、j) ・・・・
・・ (7)J f’Xg−Σ′j、F’(i、j)・G(i、j) ・
旧・・(8)J 一方、三方子f符の認識は次のようにして行なう。すな
わち、」−述した1次元マツチング専用プロセンサ6に
おいて符頭が不鮮明で認識下n丁の場合には、二″分音
符の可能性があるので2次元マツチング専用プロセッサ
7は第11図に示すように打針の左右のエリア21及び
22に切出しエリアを設ける。そして、左右のエリア2
1及び22毎に白丸の辞書データを」二から下に向って
動かすことにより、前述した類似度を計算する。この場
合、辞書データは0,0の2つで行なうようにする。上
述の類似度の計算から三方音符等の判定を行なうが、0
は五線間でマツチングが正しいか否かを判断し、Oは五
線上でマツチングが正しいか否かを判断する。このよう
にして、2次元マツチング専用プロセンサ7はレコード
lの楽譜記号及び白丸の音符を認識した後、レコード2
に対する同様の処理を開始する。
fXg −ΣΣF(i, j) Fist G(i, j) ・・・・
・・(7) J f'Xg−Σ′j, F'(i, j)・G(i, j)・
Old... (8) J On the other hand, recognition of the three-sided f sign is performed as follows. In other words, if the note head is unclear and is recognized by the one-dimensional matching processor 6 as described above, there is a possibility that it is a half-note, so the two-dimensional matching processor 7 processes the note head as shown in FIG. Cutting areas are provided in areas 21 and 22 on the left and right of the driving needle.
By moving the white circle dictionary data downward from ``2'' every 1 and 22, the above-mentioned similarity is calculated. In this case, two dictionary data, 0 and 0, are used. Trigon notes, etc. are determined from the above similarity calculation, but 0
determines whether the matching is correct between the staves, and O determines whether the matching is correct on the staff. In this way, the two-dimensional matching dedicated processor 7 recognizes the musical score symbols and white circle notes of record l, and then
Start similar processing for .

以」−のような各専用プロセッサの処理のタイミングを
メインプロセンサ8は制御しており、全体のフローチャ
ートは第12図に示すように各専用プロセンサは同時平
行して処理を行なうことになる。ただし、各専用プロセ
ッサはそれぞれl処理前の専用プロセッサの結果を用い
るから、i13図のタイムチャートに示すように例えば
レコードHについて注目すればXヒストグラム作成専用
プロセッサ2の処理を示す同図(A)から2次元マツチ
ング専用プロセンサ7の処理を示す同図(F)迄の一連
の処理はシーケンシャルに行なわれる。そして、十〜で
のレコードに対してに一連の処理力完了すると、メイン
プロセッサ8はその結果を集計して楽譜認識を完rする
The main processor 8 controls the processing timing of each dedicated processor, as shown in the overall flowchart of FIG. 12, so that each dedicated processor performs processing simultaneously and in parallel. However, since each dedicated processor uses the result of the dedicated processor before l processing, for example, if we pay attention to record H, as shown in the time chart in Figure i13, we can see (A) in the same figure showing the processing of processor 2 dedicated to creating the X-histogram. A series of processes from 1 to 2 (F) showing the process of the two-dimensional matching dedicated prosensor 7 are performed sequentially. Then, when a series of processing power is completed for the records from 10 onwards, the main processor 8 totals the results and completes musical score recognition.

以にのようにこの発明によれば楽譜の認識に必要な各処
理をそれぞれ専用のプロセッサで並列処理するから高速
で能率の良い楽譜の認識が可能となる。
As described above, according to the present invention, each process necessary for musical score recognition is processed in parallel by a dedicated processor, so that high-speed and efficient musical score recognition is possible.

なお、上記実施例では各専用プロセッサの処理分担をそ
れぞれXヒストグラム作成、YヒスI・グラト作成、ゲ
タνJす、ピーク切出し、1次元マツチング及び2次元
マツチングとしたが必ずしもこれに限定されるものでは
なく、各専用プロセンサの処理屯を等量化するような処
理分担であれば、さらに一層高能率かつ高速な楽譜の認
識を行なうことができる。
In the above embodiment, each dedicated processor is assigned to create an X histogram, create a Y histogram, create a getter νJ, peak cut out, one-dimensional matching, and two-dimensional matching, but it is not necessarily limited to this. Rather, if the processing is divided so that the processing capacity of each dedicated processor is equalized, even more efficient and faster musical score recognition can be achieved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は一般的な楽譜認識方法のフローチャー1・、第
2図はこの発明の実施例の概略構成を示す図、第3図(
A)は楽譜のルーコードの例、同図(B)はXヒストグ
ラム作成を説明するだめの図、同図(C)はXヒストグ
ラム作成を説明するための図、同図(D) 、 (E)
はゲタ!、7Jりを説明するための図、第4図はピーク
切出しを説明するだめの図、第5,6図は1次元マツチ
ングを説明するだめの図、第7〜第11ドは2次元マツ
チングを説明するだめの図、第12図はこの発明の実施
例の処理のフローチャート、第13図は実施例の各処理
のタイミングを示すタイムチャー1・である。 ■・・・光学スキャナ、2・・・Xヒストグラム専用プ
ロセッサ、3・・・Yヒストグラム専用プロセッサ。 4・・・ケタ切り専用プロセ、す、5・・・ピークレノ
出し111用プロセンサ、6・・・1次元で、チング「
γ用プロセンサ、7・・・2次元マツチング専用プロセ
ンサ、8・・・メインプロセンサ、9・・・楽譜、10
・・・Xヒストグラム、11・・・Yヒストグラム。 藝 l 図 佑 2 図
Fig. 1 is a flowchart 1 of a general musical score recognition method, Fig. 2 is a diagram showing a schematic configuration of an embodiment of the present invention, and Fig. 3 (
A) is an example of a lou chord for a musical score, (B) is a diagram to explain the creation of an X histogram, (C) is a diagram to explain the creation of an X histogram, (D) and (E) )
Ha geta! , 7J, Figure 4 is a diagram to explain peak extraction, Figures 5 and 6 are diagrams to explain one-dimensional matching, and Figures 7 to 11 are diagrams to explain two-dimensional matching. FIG. 12 is a flowchart of the processing of the embodiment of the present invention, and FIG. 13 is a time chart 1 showing the timing of each processing of the embodiment. ■...Optical scanner, 2...X histogram dedicated processor, 3...Y histogram dedicated processor. 4...Process for digit cutting, 5...Pro sensor for peak reno output 111, 6...One-dimensional, cutting "
Pro sensor for γ, 7...Pro sensor dedicated to two-dimensional matching, 8...Main pro sensor, 9...Music score, 10
...X histogram, 11...Y histogram. Gei l Figure 2 Figure

Claims (1)

【特許請求の範囲】[Claims] 楽a!tのルコーI・ごとの濃度データを読み取る光学
スキャナと、 +iij記濃度データの横軸方向の第1
の濃度分布をめるXヒストクラム専用プロセンサと、縦
軸方向の第2の6度分布をめるYヒストグラムi、l、
j用プロセ・ンサと、 jiii記第1の濃度分11j
から−Wi (fiを差し引いて第3の濃度分布をめる
ゲタレノリ[17用プロセツサと、+tFj記第3の濃
度分/)Jのピーク位置を検出するピーク切出し専用プ
ロセンサと、このピーク切出し専用プロセッサによって
νJり出された前記第3の濃度分布のピーク(、l、置
(=1近から黒丸の隙符及び小節線を認識する1次元マ
ンシングi、l、f用プロセッサと、楽譜記号及び白丸
のざ符を認識する2次元マンシノグ専用プロセンサと、
111j記光学スキヤナ及び谷専用プロセッサ全体のタ
イミングを制御するメインプロセンサとによって構成さ
れ、楽譜の認識に必要な処理を前記各専用プロセッサで
分担し、並列処理することを特徴とする楽譜認識装置。
Easy a! an optical scanner that reads density data for each Luco I·t;
X histogram dedicated processor that calculates the density distribution, and Y histogram i, l, that measures the second 6 degree distribution in the vertical axis direction.
the processor for j, and the first concentration 11j of jiii.
-Wi (Processor for 17 to calculate the third concentration distribution by subtracting fi, and a processor dedicated to peak extraction to detect the peak position of +tFj/)J, and a processor dedicated to this peak extraction. A one-dimensional Munsing i, l, f processor that recognizes gap marks and bar lines in black circles from near the peak (, l, position (=1) of the third density distribution extracted by νJ, and a processor for musical score symbols and white circles. A professional sensor dedicated to 2D Manshinog that recognizes the Noza mark,
111j A musical score recognition device comprising an optical scanner and a main processor that controls the timing of the entire valley-dedicated processor, and is characterized in that processing necessary for musical score recognition is shared among the dedicated processors and processed in parallel.
JP58179019A 1983-09-27 1983-09-27 Music sheet recognizing device Granted JPS6072087A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58179019A JPS6072087A (en) 1983-09-27 1983-09-27 Music sheet recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58179019A JPS6072087A (en) 1983-09-27 1983-09-27 Music sheet recognizing device

Publications (2)

Publication Number Publication Date
JPS6072087A true JPS6072087A (en) 1985-04-24
JPH051513B2 JPH051513B2 (en) 1993-01-08

Family

ID=16058685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58179019A Granted JPS6072087A (en) 1983-09-27 1983-09-27 Music sheet recognizing device

Country Status (1)

Country Link
JP (1) JPS6072087A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988010483A1 (en) * 1987-06-15 1988-12-29 Victorian Economic Development Corporation Device for the display of musical information
US5467411A (en) * 1991-09-26 1995-11-14 Mitsubishi Denki Kabushiki Kaisha System with approximation mechanism for recognizing graphical elements in a drawing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988010483A1 (en) * 1987-06-15 1988-12-29 Victorian Economic Development Corporation Device for the display of musical information
US5467411A (en) * 1991-09-26 1995-11-14 Mitsubishi Denki Kabushiki Kaisha System with approximation mechanism for recognizing graphical elements in a drawing

Also Published As

Publication number Publication date
JPH051513B2 (en) 1993-01-08

Similar Documents

Publication Publication Date Title
JP3445394B2 (en) How to compare at least two image sections
JP2008259156A (en) Information processing device, information processing system, information processing method, program, and storage medium
JP2008040693A (en) Line noise removal device, line noise removal method and line noise removal program
JPH0467234B2 (en)
Calvo-Zaragoza et al. Avoiding staff removal stage in optical music recognition: application to scores written in white mensural notation
JP4437756B2 (en) Information extraction method, information extraction apparatus, information extraction program, and storage medium
JP2008011484A (en) Apparatus and method for extracting character and graphic string, program for executing the method, recording medium with the program stored therein
JPS6072087A (en) Music sheet recognizing device
JPS62254282A (en) Method and apparatus for separating overlapped pattern
JP3798179B2 (en) Pattern extraction device and character segmentation device
Chen et al. An optical music recognition system for skew or inverted musical scores
JP2722549B2 (en) Optical character reader
JP4083723B2 (en) Image processing device
JP2580976B2 (en) Character extraction device
JP4930288B2 (en) Image processing apparatus and image processing program
JP2925270B2 (en) Character reader
JPH10154191A (en) Business form identification method and device, and medium recording business form identification program
JP3763966B2 (en) Image recognition method, apparatus and recording medium
JPS6154578A (en) Character reader
JPH01234985A (en) Character segmenting device for character reader
JPS6394386A (en) Printed character pitch detection device
JP2004280530A (en) System and method for processing form
JPH11242716A (en) Image processing method and storage medium
JP2002230481A (en) Optical character reader
JPH0550785B2 (en)