JPH01304497A - 楽譜認識方法及び装置 - Google Patents

楽譜認識方法及び装置

Info

Publication number
JPH01304497A
JPH01304497A JP63134475A JP13447588A JPH01304497A JP H01304497 A JPH01304497 A JP H01304497A JP 63134475 A JP63134475 A JP 63134475A JP 13447588 A JP13447588 A JP 13447588A JP H01304497 A JPH01304497 A JP H01304497A
Authority
JP
Japan
Prior art keywords
note
image
staff
musical
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63134475A
Other languages
English (en)
Inventor
Hiroichi Ishikawa
博一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP63134475A priority Critical patent/JPH01304497A/ja
Publication of JPH01304497A publication Critical patent/JPH01304497A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] この発明は記録シートに記録された楽譜のイメージを読
み取って楽譜を自動的に認識する楽譜認識方法及び装置
に関し、特に楽譜の自動認識における音符の棒の認識技
術に関する。
C従来技術] 印刷された楽譜を自動的に認識する楽譜認識技術は既知
である。これらの楽譜認識装置では楽譜の要素(音符そ
の他の記号)を認識するために、楽譜の画像データを記
憶する画像メモリに対し、広範囲で莫大な回数のアクセ
スを試みる。このため、処J!!!量が非常に多くなり
、装置の規模も大がかりになるという問題があった。
[発明の目的〕 この発明は楽譜に含まれる音符の棒(符幹)を少ないデ
ータ処理量で認識することのできる楽譜認識方法及び装
置を提供することを目的とする。
[発明の構成1作用] 上記の目的を達成するため、この発明による楽譜認識方
法は、読み取られた楽譜のイメージから、音符のイメー
ジを抽出する工程と、抽出されたt)符のイメージを7
7符の棒の方向とほぼ平行な方向に走査して音符のイメ
ージの射影プロフィールを生成する工程と、生成された
射影プロフィールから、f″?符の棒が存在しそうな範
囲を限定する工程と、この限定された範囲における音符
のイメージを分析して音符の棒の存在範囲を確定する[
、程とを有することを特徴とする。
ここに、音符のイメージ(音符候補のイメージ)は、そ
のサイズが楽譜のイメージのサイズに比へ十分小さいの
で、射影プロフィールを生成するのに要するデータ処理
量は格段に低減される。
さらに、範囲を限定する工程により、得られる音符の棒
の存在しそうな範囲(棒存在可濠領域)はrf符のイメ
ージのご°〈一部であるので、棒の存M=範囲を確定す
るのに要するデータ処理量も非常に少なくて足りる。し
たがって、音符の棒の認識をするための全体のデータ処
理量は少なくなり、高速で認識が町山となる。
yらにに記の楽譜認識方法を実施するこの発明の楽譜認
識装置にあっては、装置の規模(プログラムメモリの容
量、データメモリの容量、プロセッサの処理能力など)
を小さくすることができる。
[実施例] 以下図面を参照してこの発明の詳細な説明する。
く全体構成〉 第1図に本実施例に係る楽譜認識装この全体構成を示す
0図中、lは楽譜(図示せず)が印刷された楽譜シート
であり、このシー)11の楽譜のイメージはイメージ入
力装置により読み取られる。イメージ人力装置としては
、密着型のイメージスキャナー、あるいはテレビカメラ
(例CCDカメラ)等が使用できる。イメージ入力装置
lにより読み取られたイメージデータは2値化され、イ
メージ記憶装置3に記憶される。記憶されたイメージは
楽譜解読装置4により解読され、その解読結果はM I
 D I (Musical Instrument 
DigitalInterface)変換装置5により
MIDIコ−1”に9換され、音源を含む出力装置6を
通じて放音される。後述の説明から明らかとなるが、楽
譜解読装:114がイメージ記憶装置3に対してアクセ
スする回数は、可及的に最小化されている。したがって
、楽譜解読装置4をマイクロコンピュータで実現するこ
とができる。
くゼネラルフロー〉 第2図は実施例の全体の動作のフローを示している。2
−1でシー)1上の楽譜をイメージ入力装置2によって
読み取って、イメージ記憶装置3に記憶する。その後、
楽譜解読装置4が動作して、記憶された楽譜のイメージ
を認識する(2−2)、認識結果はMIDIID型置5
によってMIIOコードにデータ変換され、出力装置6
より楽1キとして出力される(2−3)。
く楽譜認識〉 楽譜解読装置4によって実行される楽譜認識(第2図の
2−2)のフローを第3図に示す。入力データはイメー
ジ記憶装置3上の楽譜のイメージデータであり(3−1
)、出力データは楽譜の認識結果である(3−9)。
3−2で楽譜解読装に4は楽譜のイメージデータから五
線の幅と間隔を測定し、3−3で五線の方程式を決定し
て五線の位置を検出し、3−4で楽譜のイメージデータ
から五線を他の記号と連なる部分を除いて消去する。こ
の結果、楽譜の各記号は黒の連結要素に分解することが
できる。そこで、この分解された連結要素にラベル(名
前)を付けて連結要素ごとのデータに分離する(3−5
)、この時点では、情報の形式はイメージデータのまま
であるが、その大きさは各連結要素のイメージサイズで
あるので元の楽譜のイメージデータに比べ格段に小さく
なっている。そこで、分離された個々の連結要素のイメ
ージから特徴データを取り出し、それによって、連結要
素が音符であるとか)−Ff記号であるかというように
、記号の大の類を行う(3−6)、この時点で形の確定
しているもの(例えば、#、b)は、分類(記号認識)
が完了する。ただし、音符のような記号では、連結要素
の複数の異なる部分(セグメント)が明らかにならなけ
れば、その意味を特定することができない1例えば、4
分音符の場合に、旗(打圧)が1つ付けば8分音符に変
化する。そこで、記号の認識3−7において、これらの
記号(意味プリミティブ)を連結要素内の局所的な検索
を通じて特定するとともに、意味プリミティブ相ゲの帰
属関係(例えば#の臨呼記号が作用する音高の音符)等
を決定して音符の音長、音高を決定する。最後に認識さ
れた音長データと音高データを出現順に従って並びかえ
る(3−8)。
以下、楽譜認識の個々の処理を詳細に説用する。
く五線の幅と間隔の測定〉 楽譜認識のフロー(第3図)の3−2で実行される五線
の幅と間隔の測定処理の詳細を第4図に示す。
楽譜のイメージのなかで圧倒的に大量な記号は五線であ
る。したがって、楽譜の五線とほぼ垂直な方向における
黒のランレングスを検出し、この黒のランレングスのヒ
ストグラムを作成すれば、最大頻度のランレングスが五
線の幅となり、同様にして白のランレングスを検出し、
この白のランレングスのヒストグラムを作成すれば、最
大頻度の白のランレングスが五線の間隔を表わすはずで
ある1例えば第5図では黒のランレングスの最大頻度は
ランレングス=3で発生しているので五線の幅は3であ
り、白のランレングスの最大頻度はランレングス=15
で発生しているので、五線の間隔は15である。
第4図のフローはこの原理に従って五線のtIR隔と幅
を測定している。
4−3のスキャンでは、実行の都度、別のX座標値にお
いてy方向(五線にほぼ垂直な方向)に楽譜のイメージ
データをスキャンする。このスキャンを所定回数(例え
ば15回)行った時点で、終7(4,−2)となり、4
−4で作成した白と黒のランレングスのヒストグラムか
ら、五線の11fl隔と幅の情報を得ている(4−5.
4−6)。
く五線の検出〉 楽譜認識のフロー(第3図)の3−3で実行される五線
検出処理の詳細を第6図に示す。この処理では、五線の
すべての位置を直接に求めているわけではなく、実際に
得ているのは、五線の左の方(始端部)における五線の
方程式(a、b)である。五線のすべての位置は次の五
線の消去処理の際に検出される。これは、五線の湾曲を
考慮するとともに、五線認識の速度向上を図ったもので
ある。
第6図に従うと、処理6−3で、五線の左の方における
X座標値において、y方向に楽譜のイメージデータを走
査し、五線の幅と間隔の情報を用いて、五線の候補の座
標(x’、y’)を見つける。6−4で候補の座標(x
′、y′)を通る全ての可1駈な直線y=ax+bの(
a、b)の組を作成する(aの値は−1< a < 1
の範囲で十分である)、そして、6−5において、各(
a、b)に対する頻度Q(a、b)をQ(a、b)=Q
 (a、b)+1により計算してヒストグラム(Q (
a、b)lを作成する。その後6−2に戻り、X座標値
を少しずらしなから6−3.6−4.6−5の処理を所
定回数繰り返す、この結果、Q(a、b)の値は、直M
Ay=ax+b上に、五線の候補の点が何個含まれてい
るかを表わす。
したがって、五線の方程式となる(a、b)の組は、ヒ
ストグラムにおける頻度が大きいはずである。また、五
線の性質上、aの値は互にほぼ等しく、bの値はほぼ等
しいはずである。これに従い、第6図では、6−6でヒ
ストグラムのなかから、Q (a、b)の大きい(a、
b)の組を100組見つけ、6−7で、上記の条件に合
う、(a、b)の組を5×段数分選択している。
< 11−線の消去〉 楽譜認識のフロー(第3図)の3−4で実行される圧線
の消去処理の詳細を第7図に示す。
7−3から7−7までのループは五線の1本分の消去で
あり、1本の五線は左から右へと順次消去される。1本
分の消去後は、下の五線の消去作業に移り(7−2)、
全ての五線が消去されるまで7−2〜7−7のループ処
理が繰り返される。
7−4で、(a、b)の値すなわち、五線検出処理で得
た五線方程式と1つ左の五線の中心位置から今回の五線
の中心位置を予測する。7−5で予測位lを中心にして
、五線の間隔分だけ上から下(y方向)に楽譜のイメー
ジデータを走査する。そして、7−6で、いままでの状
態と今回のスキャンデータより、次の状態を決定すると
ともに、今回のスキャンデータに含まれる五線の部分を
消去してよいかどうかを決定する。続いて、7−7で今
回の五線の中心位置をリストに記録する。
上記処理7−6は五線消去の要部であり、ここで、五線
とそれ以外の記号とを識別し、五線とそれ以外の記号と
が重なる部分では、五線を消去しないこととし、これに
より、記号が五線によって切断される事態を防いでいる
この処理7−6で実行される五線消去オートマトンの状
態遷移を表1に示す0表1において人力xxpt+t=
 (“スキャンデータの正規表現”、B、  y)で表
わされる。ここに、スキャンデータの正規表現に含まれ
る記号(w、b、+、本、Δ、$)のうち、Wは白のビ
クセルを表わし、bは黒のビクセルを表わす、また1個
以北同じビクセルが続く記号は十であり1例えばW+は
白のビクセルが1回置上続いたことを表わす、また、0
回以上同じビクセルが続く記号は本であり、例えばb木
はO回置1黒のビクセルが続いたことを表わす、△は始
めを表わし1例えば−bはy方向にスキャンしたデータ
が黒のビクセルから開始することを表わす、また、$は
終りを表わし1例えばW$はy方向にスキャンしたデー
タの終端が白のビクセルで終っていることを表わす0例
として、“b*w+b+w+b零$を説明すると、この
スキャンデータは1個以上の黒のビクセルの後に1個以
上の白のビクセルが続き、その後に1個以上で黒のビク
セルが続き、その後に1個以上の白のビクセルが続き、
その後に0個以上の黒ビクセルが続いて終っているデー
タである。入力のなかのBは黒すのビクセルのなかに五
線の中心位置の予測ポイントが入っていたかどうかを示
すデータであり、表1において、Bは入っていることを
示し、IBは入っていないことを表わす、また、入力の
なかのyはBの幅が五線にふされしい幅かどうかを示す
データ〒あり、表において、yはふされしい幅であるこ
とを表わし、lyはふされしくない幅であることを表わ
している。
−・方、内部状態は次のように表わされる。
S丁ATE=  (mode 、bcnt  、wbw
cut 、went)ここにmodeは状態モード、b
entは黒が続いたことを示すカウンタ、wbwcnt
は五線が記号と重なったことを示すカウンタ、wcn 
tは白が続いたことを示すカウンタである。
表1に従うと、例えば内部状fムが(start、。、
)のときに、スキャンの結果、入力として(Awbw!
、)が与えられたときには、次の内部状態は(wBw、
、、、 )に移行する。また、内部状態が(WOW、、
、)の下で、(八wbw$、B、y )が入力されたと
き、すなわち、白のビクセルで始まり、その抜用のビク
セルが続き、そして白のビクセルで絆わるスキャンデー
タであって、その黒のビクセルのなかに五線の予測位置
が入っており、かつその幅が五線の幅にふされしいとぎ
には、次の内部状態を同じ(w、B、w、、、、 )に
するとともに、五線に相当するところを消去(del 
)する、一方1人力が(Awbw寞、B、!y)のとき
には、五線の幅がふされしくないので(その他の点では
前と同じ入力であるが)、これは五線とその他の記号と
が重なっていると考えられる。したがって、五線を消去
せずに次の内部状態を(wBBw、0.、、 )へ進め
る。なお、表1において、1つの内部状態に複数の入力
候補が示されているものがあるが、これは七から表1 11貝消火オートマトンの状態品移(+記号は省略)内
部状態      人力        次の内部状1
B   行動(start、 、 、)      (
^wbw$、 、)       (vBw、 、 、
 、)(、、、wcnt、Iv/2)    (w、+
)         (、、、wcnt+1)(、、、
wcnb=1w/2)   (w、、)       
  stop(yBw、、、)       (〜1m
jB、y)      (iiBw、、、、)    
 del(’wbw$、E、!y)     (wBB
w、0.、、)(t+tvbwbt、B、y)    
 (bwBwb、、、、)    del(btwbw
b本、B、!y)    (bwBwb、、、、)(^
lll$、B、)       (B、 、、 、)(
^vbv$、!B、y)     (wow、、、、)
     del(^w間、!B、!y)    (w
BBw、0.、、)(wGn+t、B、)      
(w”Bw”、、、、)(bwBwb、 、 、)  
    (Awbw$、B、y)      (wBw
、 、、 、)     del(^wbi+$、B、
!y)     (wBBw、0.、、)(Awbw、
!B、y)      (wow、、、、)(Awty
w、!B、!y)     (i+BBw、O,、、)
(^btwbvbt$、B、y)   (bwBwb、
、、、)    del(Abtwbwbt$、B、!
y)     (bwBwb、、、J(vtb軸bwb
本wt、B、y)  (wbwBwbw、0.、、) 
 del(wtb匈bwb享−、B、!y)  (wb
wBwbw、O,、、)(Abj、B、)      
 (B、、、、)(賢姉−,B、)      (−B
w*、、、、)(b、B、y)        (wb
wBwbw、0.、、)  del(b、H,!り  
    (wbwBwbw、0.、、)(wbwBwb
w、、、)    (〜−9B、y)     (wB
w、、、、)    del(〜団、B、!y)   
 (wbBbv、、O,、)(’ybi+、!B、y)
     (wBy、、、、)    del(Awb
w、 ! B 、 ! y )    (wbhw* 
、02.)(^Mwbwbz$、B、y)   (bw
Bwb、、、、)   del(^bswbwb$$、
B、!y)   (bvBwb、、、、)(vtbtw
bwb本−、B、y)  (whwBvbv、、、、)
   del(w柿zwbwb鞠寡、B、!7)  (
wbBbw、、O,、)(^b$、B、)      
 (vBw、、、、)(vbBbw、bcnt)1w、
 、)  (^wbd、 、y)     (wBv、
 、 、 、)(wbEthw、 、wbwcnbO,
)  (^wbir$、、y)     (vBBw、
、、、)(wbBbw、bent)0.、)   (^
vbw$、 + !y)     (、、wbwcnt
+1 、 、)(wbBbw、、、)        
   (八す零vbwb*g、B、y)      (
bwBwb、、、、)       del(Ab鞠b
vbt$、B、!y)   (bwBwb、、、、)(
wtbtwbwbtwt、B、y)  (vbwBwb
w、、、、)   del(wtbtwbwbtwt、
B、!y)  (wbwBwbw、、、、)(、b、 
、B、)       (wb膓町19.)(^目、B
、)       (wBw、、、、)(w柿−、B、
)      (wtBvz、 、 、 、)(wBB
w、、、)      (^wbJ、、y)     
(wow、、、、)    del(^vbw$、、!
y)     (wBBw、0.、、)(、b、、B、
y)      (wElw、、、、)     de
l(、b、、B、!y)      (wBBw、、、
、)(b、B、)        (B、 、、 、)
CB、、、、)        (^wbws、B、y
)      (wow、、、、)     del(
〜−$、B、!y)     (B、O,、、)(bt
wbwb本、B、y)    (bwBvb、、、、)
    del(btwbwb本、B、!y)    
(bwBwb、、、、)(Abs、B、)      
 (B、 、、 、)(Awbw!、B、y)    
  (wBw、、、、)     del(〜膿!、!
B、!y)     (B、0.、、)(vtBw本9
. 、 、)     (’vbw$、B、y)   
  (wBw、 、 、 、)     del(^吐
w$、B、!y)     (yt〜も0.、、)(b
twbwbt、B、y)    (bwBwb、、、、
)    del(b軸bwb寡、B、 !y)   
 (bv〜b、、、、)(Abj:、B、)     
  (B、、、、)(’wbd、!B、y)     
(wBw、、、、)     del(Awbw$、!
B、!y)     (wtBvz、O,、、)記号の
説IJII:でないとき 〜:始め $:おわり del:五線に相当するところを消去する順に優先順位
の付けられた入力候補である(上から順番に入力のマツ
チングテストが実行される)。例えば、(wBw、、、
)の内部状態の下で、(Ab$、B、!y)が入力され
たとすると、最初に、(Awbw$、B、y )とのマ
ツチングが不成功に終り、以下、(^vbw$、B、!
y) 、  (btwbvbt、B、y )、(btw
bvbt、E、!y)との各マー、チングも不成功に終
り、(^b$8. )とのマツチングで初めて成功する
表1かられかるように、五線消去では、それまでの五線
と記号との間の関係を表わす内部状態と、今回の五線と
記号との関係を表わすスキャンの結果(入力)とから1
次の内部状態を決定するとともに、今回のスキャンにお
ける五線の部分の消去可否を決定している。
これにより、第8図に示すように、楽譜のイメージのう
ち、五線が他の記号と重なる部分を除いて消去されるこ
とになる。この結果1次に説明するラベル付けの処理す
なわち、連結要素ごとのイメージデータの分離処理が可
能となる。。
さらに、fi−線消去(第7図)では、7−4.7−7
の処理により、五線の位置が決定され、記録される。こ
の五線の位置情報は後で記号の大分類や、By符の音高
データを得るのに利用される。
くラベル伺け〉 認識処理のフロー(第3図)の3−5で実行されるラベ
ル付は処理の詳細を第9図に示す、この処理の目的は、
五線が消去されたイメージデータから、連結要素(黒画
素が連続している領域)ごとに名前を付けて、連結要素
ごとの小さなサイズのイメージデータに分離することで
ある。さらに、副次的目的として、分離された個々の連
結要素から、後の認識作業に必要なデータを抽出する処
理が含まれている。ラベル付は処理は、大量のイメージ
データ(楽譜サイズのデータ)を取り扱わなければなら
ない最後の処理である。
第9図のフローに従うと、陽はラベル(名前)を表わし
、9−2で最初の名前陽=1が作成される。その後、五
線の消去されたイメージデータに対し、左上から右下ヘ
スキャンしていく(9−3)。このスキャンのサンプリ
ング点はイメージデータのすべての点である必要はなく
、認識すべき最小サイズの記号(付点)のイメージに対
するサンプリングが保証される程度であれば十分である
。9−4でサンプリング点(スキャニング点)のビクセ
ルが黒画素かどうかをチエツクし、黒画素であるならば
、9−5でそのビクセルにまだラベルが付いていないか
どうかをチエツクし、9−4と9−5のチエツクが共に
成立しないかぎり、9−3に戻って次のスキャニング点
に移動する。
両方のチエツクが成立するときには、9−6へ進み、こ
の黒画素に連結しているすべての黒画素に同じ名前陽を
付ける。このラベリング処理9−6は次々と自己のサブ
ルーチンを呼び出すtI■帰的な処理である。1つのサ
ブルーチン内では、現在の座標のビクセルにラベルを付
けるとともに、その座標の周囲にある8つの隣接座標を
、所定の順番でアクセスし、アクセスの途中で、黒画素
であってラベルが伺いていない隣接座標を見つけたとき
には、サブルーチンを呼び出し、呼び出されたサブルー
チンは先に見つけ出された隣接座標を現在の座標として
同様の処理を行う、1つのサブルーチン内で、現在の座
標の周囲にある8つの隣接座標のすべてについて、ラベ
ル付けの条件を満たす点(いまだラベルの付いていない
黒いビクセルの点)がないときには、そのサブルーチン
は終rし、そのサブルーチンを呼び出したサブルーチン
(親のサブルーチン)が残りのプロセスを実行する。結
果として与に連結されているすべての黒画素に同じ名前
南が付けられる0次にラベル付けされた領域を分離した
イメージデータとする(9−7)。これにより、後の認
識処理では、この分離された小さなサイズのイメージデ
ータを増り扱えばよいことになる。さらに、分離された
イメージデータに対して後の認識作業に必要なデータの
テーブルを作成する(9−8)。例えば、次のようなデ
ータが得られる。
連結要素の座標 高さ 面積 9−9で名前陽を変更し、9−3に戻り、五線の消去さ
れた楽譜のイメージデータの走査が完了するまで、上記
の処理を続ける。
く大分類〉 認識処理のフロー(第3図)の3−6で実行される大分
類処理の詳細を第10A図に示す。
この処理では、上述のラベル付けによって分離された個
々のイメージデータに対して記号の大分類を行う、この
分類のために、最初に個々のイメージデータから特徴デ
ータを抽出して対応するテーブルに古き込む、これは、
第10A図の1O−2、l O−3,10−4で行われ
ている。この例では、特徴データとして、縦棒の数、五
線との交わりの状態、縦方向と横方向に対して最も長い
黒の連続の長さを調べている。算出例を第10B図に示
す、五線との交わりの状態を調べているときには、上述
の五線消去処理で得ている五線の位置情報がノ、(準デ
ータとして参照される。
これらの特徴データ及びラベル付け(第9図)の9−8
で得ている高さ、幅その他のテーブルデータを用いて、
それぞれの分類項目について、イメージデータが分類項
目である確率を算出し、テーブルに古き込む(l O−
5,1O−6)。分類項[1には全音符、全音符以外の
音符、シャープ、フラット、ト音記号、へ音記号等10
数種類程度の項目がある。
く記号認識〉 楽譜認識のフロー(第3図)の3−7で行われる記号の
認識処理のフローを第11図に示す、この処理では上述
した大分類の結果である記号の確率に従って、対応する
記号の認識を行う、すなわち、全音符らしさが高いとき
には全音符の認識を実行り、全音符以外の音符らしさが
高いときには全音符以外の音符の認識を行い、その他の
記号らしさが高いときには対応する記号の認識を行う(
11−1〜1l−4)。
以下、全音符以外の音符の認識11−4と全音符の認識
について詳細に説明する。
く全音符以外の音符の認識〉 第12図に全音符以外の音符の認識のフローを示す、1
2−1で棒(符幹)の存在範囲を認識する。この認識は
対応するイメージデータ、すなわち、分離された小さな
サイズのイメージデータを走査することによって行われ
る0次に、符頭(魚頭、自照)の位置をエッセンシャル
パターンマッチングによって認識する。ここに、エッセ
ンシャルパターンとは記号(この場合、自照、魚頭)パ
ターンが必ず満たすまたは満たす可能性の高い点のパタ
ーンであり、既に得ている五線間の間隔と五線の幅をモ
ジュールとした数値データから作成される。この符頭の
認識は、棒のまわりのイメージデータに対して行われる
。12−3では旗または桁の個数と位置が認識される。
この認識におけるイメージデータの走査範囲は棒の符頭
が付いていない方の周辺に限定して行うことができる。
ここまでで解明していることは、音符の連結要素の構造
である。音符の音長や音高を特定するためには、他の連
結要素からの作用を考慮する必要があるし、誤認識の対
策としての楽曲知識の利用を図るべきである。その手始
めとして、12−4で臨昨記号(シャープやフラット)
や付点を符頭に帰属させている。12−5ではその他の
情報をも考慮して音符の音高と音長を決定している。
く棒の位置、長さの認識〉 L記12−1で行われる棒の位置と長さの認識のフロー
を第13図に示す。処理の目的は、第15図に示すよう
に、棒のX座標(xbar)と、棒の端点のX座標(y
s 、  ’5’e )を求めることである。
13−1では、分離されたイメージデータに対し、Y方
向の条件付き射影(プロジェクション)がとられる(第
14図)、その詳細を第16INに示す、同図において
、座標Xは分離されたイメージデータの左端から右端ま
で動かされる。各X座標において、イメージデータ(連
結要素)をY方向にスキャンし、黒の連続(ランレング
ス)ノ最大を求め(16−2)、その値aが所定の値以
」−であれば、リストの要素proj(z)にその値を
入れ(16−4)、所定の値に達していなければpro
j(りにOを入れる(16−5)、この結果、リスト(
proj(x) )の内容は第14図の下に例示される
ようになる。
次に棒の存在可能位aが抽出される(13−2)。詳細
を第17図に示す。ここではりスト(praj(x) 
 lが順にアクセスされ、差分(proj(z+) −
proj(gしり)が計算され、差分が大きくプラスへ
変化したときのX座標(X、)と大きくマイナスへ変化
したときのX座標(X−)とが見つけ出され(17−1
)、領域のエツジを表わす両X座標の差が棒の最大幅以
下かどうかを調べ(17−2)、以下の場合にのみ両X
座標の中間値(x、+x−/2)を棒のX座標(xba
r)の候補としてリストに登録する(17−3)、チエ
ツク17−2により、幅の大きすぎる85素(例えば符
頭)は有効に除去される。
最後にr¥符の棒の判定が行われる(13−3)。詳細
を第18図に示す、ここでは、棒のX座標の候補のリス
ト(13−2で得ている情報)から各候補を読み出しく
18−1.18−5)。
各候補のX座標において、イメージデータをy方向に走
査して棒の最大幅以下の連続した長さとその長さの上端
のX座標と下端のX座標を得る(18−2)、そして、
測定した長さが棒の最小の長さ以にかどうかを判別しく
1g−3)、成立するときにのみ、そのときのX座標と
上端のX座標及び下端のX座標を音符の棒の存在範囲と
して登録する(18−4)、チエツク18−3により、
棒としての長さに達していない要素は有効に除去される
く魚頭・自照の位置の認識〉 第12図の12−3で行われる魚頭、自照の位置の認識
処理の詳細を第19図に示す、上述したように、棒の位
置は12−1で既に得られているので、符頭の認識のた
めのイメージデータの走査範囲は棒のまわりの領域に限
定できる。さらに、五線間隔も既知であるので、この情
報を利用することにより、さらに走査範囲を符頭の存在
しそうなエリアに限定ηf能である。第19図のフロー
はこれらの点を考慮している。さらに、第19図のフロ
ーでは、符頭のパターンマツチングのために、上述した
エツセンシャルパターンを参!兇データとして用いてい
る。第20図にエフセノシャルパターンの例を示す。同
図(a)の左側に示すのハ魚頭に対するエツセンシャル
パターンであり、(b)の左側のパターンは2分音符の
自照に対するエッセンシャルパターンである。さらに、
同図(C)の左側に示すパターンは全音符の自照に対す
るエツセンシャルパターンであり、こh If 全tf
符を認識するときに利用される(第22図)。
第19図のフローに沿って説明すると、まず、19−1
で五線の幅と間隔から、魚頭と自照のエツセンシャルパ
ターンを作成する(第20図の(a)と(b))、その
後、棒の中心線と下行で中心線から魚頭と自照の横幅(
これは五線の間隔から算出される)の展の距離だけ離れ
た直線に沿ってイメージデータを走査する(19−2、
第21図参照)、そして、走査した点が図から(符頭)
の内部の点のときは(19−3)、その座標を基H6と
して、エツセンシャルパターンの検査座標におけるイメ
ージデータのビクセルを読み出し、エンセンシャルパタ
ーン(自照と1ll)、!:マッチングを行う(19−
4)、マツチングが成功したときは、その位lの符頭が
登録ずみかどうかをチエツクしく19−5)、登録ずみ
でない場合に符頭の0録を行う(19−6)、そして、
走査する点を五線間隔だけスキップさせ(19−7)、
棒のまわりの走査が終るまで(19−8)、19−2に
戻って処理を続ける。
以J:のように、符頭の認識は分離されたイメージデー
タの局所的な領域を調べることによって行われる。また
、エツセンシャルパターンマッチングの採用により、マ
ツチングの処理速度が速くなり、これにより符頭認識処
理時間が一層短縮されることになる。
く音高、音長の認識〉 第12図の12−5で実行される音高、音長の認識処理
12−5の詳細を第22図に示す、まず、22−1で音
符の符頭の位置と五線の位置との関係から、ハ調の音高
を付与する0例えば、−番丁の五線上に符頭が位置する
ときには、第5オクターブのEの音高が与えられる0次
に、22−2で音部記号(ト音記号、へ音記号)、調性
記号、臨時記号等、背高に作Inをケえる要素によって
、音高を修正する0例えば、音部記号がト音記号であり
、W性記号がハ長調であり(実際には記号なし)、臨時
記号はシャープであり、他の音高作用要素がないときは
、上記の一番下の五線、Lに符頭なもつ音符の音高は第
5オクターブのEシャープとなる。22−3では音符の
旗または桁の数や打点の個数により音符に音長を付与す
る0例えIf、符頭が魚頭で旗を1つもち、符頭の近く
に1つの付点が付いている音符は灯点8分音符の長さと
なる。さらに22−4では小m1tt位の楽典知識によ
り、認識している小節内の音符の音長合計等を検査し、
楽典知識に一致するように修正する。
22−5では、タイの結合関係により結合している2つ
の音符のデータを1つに統合する。
く全音符の認識〉 第11図の11−3で行われる全音符の認識処理のフロ
ーを第23図に示す、23−1で全音符の位置をエッセ
ンシャルパターンマ−7チングにより決定する。以降は
第12図の1−4に示す帰属関係の決定、第12図の1
2−5に示す音高、音長の認識を行う(第23図では、
23−2.23−3で示しである)、なお、各記号の構
造解析(第12図では12−1から12−3まで、第2
3図では23−1)において、a造が解析できなかった
ときにはその連結要素に対する次の確らしい記号につい
ての構造解析に移行する(図示せず)。
く音符の並びかえ〉 ここまでで、各音符の音高と音長のデータが決定された
。しかし、このままでは楽譜を再現することができない
。楽譜を再現するためには、各音符を時間の流れに従っ
て並びかえる処理が必要である。この処理は楽譜認識の
フローの最後3−8で行われる。詳細を第24図に示す
、24−2でハート数を調べる0例えば、ピアノ楽譜の
ような場合には五線の2段分が対となっていて、上段が
第1パート、下段が第2パートで同時に演奏されるべき
ものである。一方、Qi音楽器用の楽譜は通常lパート
である。これを24−2で区別したわけである。2バー
トか6かは小節線の長さによって判別される。そして、
24−4でパート別に音符をその出現順位(音符の座標
から判別される)に従って並べかえている。
くデータ変換及び出力〉 楽譜認識処理の結果はゼネラルフローの2−3及び第2
5図に示すようにデータ変換されて出力される。−1−
述した音部の並びかえで得た情報が認識の最終結果であ
るが、これと比較的1対工対応がとれた型(中間コード
)にファイルされる。中間コードの例を表2に示す。
表2 表2において、+24は1小節を24とするという意味
である。アドレスの小数点より上は現在が細小節目なの
かを表わす。アドレスの小数点以下はl−の場合θ〜2
3までの値をとることができる小節の中の位置を表わし
ている0%から後が音符に対応し、第60/6はMID
Iコード60のi′f高を6/24小箇演奏するという
意味である。
”1”記号はチャンネル(パート)を区別する記号であ
る。
この中間コードにファイルLまた後、MIDIコードに
変換して出力装置6に出力することにより、演奏を行っ
ている(25−2.25−3)。
以]二で実施例の説明を終るが本発明の範囲を逸脱する
ことなく種々の変形、変更が容易である。
[発明の効果] この発明の楽譜認識方法にあっては、読み取られた楽譜
のイメージから音符のイメージを抽出する工程によって
、音符の棒の認識のためのイメージ検索範囲を狭くする
とともに、音符のイメージの射影プロフィールを生成す
る工程と、そのプロフィールから音符の棒の存在回旋範
囲を限定する工程とによって、音符の棒の存在範囲を確
定する〕−程が分析しなければならないイメージの領域
をさらに絞り込んでいるので、音符の棒を認識するため
に必要なデータ処理量はわずかでよい。
また、上記楽譜認識方法を実施するこの発明の楽譜認識
装置にあってはその構成を簡単で規模の小さなものにす
ることができる。
【図面の簡単な説明】
第1図はこの! iJの実施例に係る楽譜認識装置の全
体構成図、第2図は実施例の全体の動作を表わすフロー
チャート、第3図は楽譜認識のためのフローチャート、
第4図は五線幅測定のためのフローチャート、第5図は
第4図の処理において生成きれるランレングスのヒスト
グラムの例を示す図、第6図は五線の検出のためのフロ
ーチャート、第7図は五線の消去のためのフローチャー
ト、第8図は五線消去前の楽譜のイメージと五線消去後
の楽譜のイメージを例示する図、第9図はラベル付けの
ためのフローチャート、第10A図は記号の大分類のた
めのフローチャート、第1OB図は第10A図の処理に
おいて抽出される特徴データの例を示す図、第11図は
記号の認識のためのフローチャート、第12図は全音符
以外の音符の認識のためのフローチャート、第13図は
音符の棒の位l、長さの認識のためのフローチャート、
第14図は音符とその条件付射影プロフィールを示す図
、第15図は音符と音符の棒の位置どを示す図、第16
図は条件付きの射影をとるためのフローチャート、第1
7図は棒の存在可能位行を抽出するためのフローチャー
ト、第18図は音符の棒を判定するためのフローチャー
ト、第19図は魚頭、自照の位置を認識するためのフロ
ーチャート、第20図は魚頭、自照とエッセンシャルパ
ターンとを示す図、第21図は魚頭、自照に対する検索
範囲を説明するのに用いた図、第22図は音高、音長の
認識のためのフローチャート、第23図は全音符の認識
のためのフローチャート、第24図は音符のならべかえ
のためのフローチャート、第25図は楽譜認識結果をデ
ータ変換して出力するためのフローチャートである。 1・・・・・・記録シート、2・・・・・・イメージ入
力装置、3・・・・・・イメージ記憶装置、4・・・・
・・楽譜解読装置。 第1図 金 イ本 第1ks又・ 第8図 第2図 1=°オラノし70 − 第3図 第4図 第5図 第6図 第7図 第10A図 (a’)  線環つ勝 #□2 、l□1 1□2 (b) ニイLメミ* Yr>ぞシトトM つンし大−
1噴さ−(C) 窮廼乃藺tオ戸右藺Oうも題いラルレ
レクス−@←1 ”二 土 沁 第108図 第71 Pi!J ζ’)、84Q7y+Lり’XS’Fイm LY tl
lにつ0スキイン1でよ3 第12図 第13図 第14図   第15図 第16図 第17 図 第18  図 第20図 第21図 第22 図 第23図 第24図

Claims (2)

    【特許請求の範囲】
  1. (1)記録シートに記録された楽譜のイメージを読み取
    って楽譜を自動的に認識する楽譜認識方法において、 読み取られた楽譜のイメージから音符のイメージを抽出
    する工程と、 抽出された音符のイメージを音符の棒の方向とほぼ平行
    な方向に走査して音符のイメージの射影プロフィールを
    生成する工程と、 生成された射影プロフィールから、音符の棒が存在しそ
    うな範囲を限定する工程と、 限定された範囲における音符のイメージを分析して音符
    の棒の存在範囲を確定する工程と、を有することを特徴
    とする楽譜認識方法。
  2. (2)記録シートに記録された楽譜のイメージを読み取
    って楽譜を自動的に認識する楽譜認識装置において、 読み取られた楽譜のイメージから音符のイメージを抽出
    する抽出手段と、 上記抽出手段により抽出された音符のイメージを音符の
    棒の方向とほぼ平行な方向に走査して音符のイメージの
    射影プロフィールを生成する生成手段と、 上記生成手段により生成された射影プロフィールから、
    音符の棒が存在しそうな範囲を限定する範囲限定手段と
    、 上記範囲限定手段により限定された範囲における音符の
    イメージを分析して音符の棒の存在範囲を確定する工程
    と、 を有することを特徴とする楽譜認識装置。
JP63134475A 1988-06-02 1988-06-02 楽譜認識方法及び装置 Pending JPH01304497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63134475A JPH01304497A (ja) 1988-06-02 1988-06-02 楽譜認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63134475A JPH01304497A (ja) 1988-06-02 1988-06-02 楽譜認識方法及び装置

Publications (1)

Publication Number Publication Date
JPH01304497A true JPH01304497A (ja) 1989-12-08

Family

ID=15129192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63134475A Pending JPH01304497A (ja) 1988-06-02 1988-06-02 楽譜認識方法及び装置

Country Status (1)

Country Link
JP (1) JPH01304497A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003090A1 (fr) * 1997-07-09 1999-01-21 Kabushiki Kaisha Kawai Gakki Seisakusho Procede servant a reconnaitre une partition musicale et support d'enregistrement lisible par ordinateur memorise avec un programme de reconnaissance de partition musicale
WO1999034352A1 (fr) * 1997-12-26 1999-07-08 Kabushiki Kaisha Kawai Gakki Seisakusho Procede de reconnaissance de la musique et support d'enregistrement lisible par un ordinateur sur lequel est enregistre un programme de reconnaissance de la musique
US6046394A (en) * 1998-06-24 2000-04-04 Kabushiki Kaisha Kawai Gakki Seisakusho Music score recognizing method and computer-readable recording medium storing music score recognizing program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003090A1 (fr) * 1997-07-09 1999-01-21 Kabushiki Kaisha Kawai Gakki Seisakusho Procede servant a reconnaitre une partition musicale et support d'enregistrement lisible par ordinateur memorise avec un programme de reconnaissance de partition musicale
DE19881155B4 (de) * 1997-07-09 2007-04-19 Kabushiki Kaisha Kawai Gakki Seisakusho, Hamamatsu Verfahren zur Erkennung von Musikpartituren und computerlesbares Aufnahmemedium zur Speicherung eines Programmes zur Erkennung von Musikpartituren
WO1999034352A1 (fr) * 1997-12-26 1999-07-08 Kabushiki Kaisha Kawai Gakki Seisakusho Procede de reconnaissance de la musique et support d'enregistrement lisible par un ordinateur sur lequel est enregistre un programme de reconnaissance de la musique
US6580805B1 (en) 1997-12-26 2003-06-17 Kabushiki Kaisha Kawai Gakki Seisakusho Method and recognizing music and computer-readable recording medium having music-recognizing program recorded therein
US6046394A (en) * 1998-06-24 2000-04-04 Kabushiki Kaisha Kawai Gakki Seisakusho Music score recognizing method and computer-readable recording medium storing music score recognizing program

Similar Documents

Publication Publication Date Title
Blostein et al. A critical survey of music image analysis
Bainbridge et al. The challenge of optical music recognition
Barman et al. Combining visual and textual features for semantic segmentation of historical newspapers
Raphael et al. New Approaches to Optical Music Recognition.
JPH05143707A (ja) 符号化画像データの処理方法および装置
JP2008148322A (ja) 文字符号化処理方法及びシステム
JPH08235341A (ja) ドキュメントファイリング装置および方法
JP2017507346A (ja) 光学的音楽認識のためのシステムおよび方法
Novotný et al. Introduction to Optical Music Recognition: Overview and Practical Challenges.
George Visual perception of music notation: on-line and off-line recognition
JPH01304497A (ja) 楽譜認識方法及び装置
JP2979409B2 (ja) 楽譜認識方法及び装置
TWI285849B (en) Optical character recognition device, document searching system, and document searching program
JP4738135B2 (ja) 楽譜認識装置および楽譜認識プログラム
CN111242060B (zh) 一种文档图像关键信息提取方法及系统
JP2000029983A (ja) 文書読取装置
JPH01304496A (ja) 楽譜認識方法及び装置
JPS6162983A (ja) 楽譜読取装置
CN115146649A (zh) 一种架子鼓乐谱识别方法及装置
JP5189952B2 (ja) 楽譜認識装置、及びコンピュータプログラム
US10515297B2 (en) Recognition device, recognition method, and computer program product
Torras et al. The Common Optical Music Recognition Evaluation Framework
JPS6037479B2 (ja) 連符演奏可能な自動演奏装置
Wallner A system for optical music recognition and audio synthesis
López Staff and graphical primitive segmentation in old handwritten music scores