JP3147846B2 - 楽譜自動認識装置 - Google Patents

楽譜自動認識装置

Info

Publication number
JP3147846B2
JP3147846B2 JP03300098A JP3300098A JP3147846B2 JP 3147846 B2 JP3147846 B2 JP 3147846B2 JP 03300098 A JP03300098 A JP 03300098A JP 3300098 A JP3300098 A JP 3300098A JP 3147846 B2 JP3147846 B2 JP 3147846B2
Authority
JP
Japan
Prior art keywords
note
data
image data
staff
axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03300098A
Other languages
English (en)
Other versions
JPH10228519A (ja
Inventor
菊池  健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP03300098A priority Critical patent/JP3147846B2/ja
Publication of JPH10228519A publication Critical patent/JPH10228519A/ja
Application granted granted Critical
Publication of JP3147846B2 publication Critical patent/JP3147846B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、楽譜を2次元画
像データに変換し、この画像データから音符および記号
を認識する楽譜自動認識装置に関する。
【0002】
【従来の技術】活字のように変形のない記号で印刷され
た楽譜をイメージスキャナで画像データに変換し、この
画像データに基づいて楽譜情報を認識して、例えばMI
DI(Musical Instrument Digital Interface)コード
を自動的に作成しようとする試みがある。
【0003】このような場合の処理は、まず、画像デー
タ中の音符の情報を得るために邪魔になる五線および小
節線のデータを除去して、残った音符や記号を認識して
MIDIコードを作成する。その際、認識し終わった音
符や記号のデータは、次に認識する音符や記号の認識の
邪魔にならないように逐次除去していく。
【0004】すなわち、具体的な処理の流れは次のよう
になる。 (1) 楽譜データ取り込み。 (2) 五線検出。 (3) 五線除去。 (4) 小節線検出。 (5) 小節線除去。 (6) 音符検出。 (7) 音符認識。 (8) 音符除去。 (9) 記号検出。 (10)記号認識。 (11)記号除去。
【0005】なお、(10)の記号認識まででMIDIコー
ドは作成することができるので、必ずしも(11)の記号除
去をする必要はない。しかし、処理の便宜等のために記
号を除去してもよい。
【0006】次に、(2) の五線検出の従来の一例につい
て説明する。五線は、音符の位置情報(音程)はもちろ
ん、記号の存在領域の指標をも与えてくれる。記号は楽
譜の全面にわたって存在するのではなく、歌詞や題を除
けば五線の内部とその周囲に存在領域が限定される。こ
の性質を利用することにより、記号の探索範囲を狭め、
認識時間を短くすることができる。五線は他の記号と比
べて、一見検出が容易そうであるが、実際には他記号と
の重なり・切れ・傾き・湾曲が存在し、しかも、記号検
出の際にはノイズの要因になるので、多くの場合予め五
線を除去する。なお、加線は数本、例えば五線の上下3
本ずつ予測する。
【0007】計算機内に取り込まれた2次元楽譜画像に
おいては、五線の水平性は保証されておらず、ある程度
傾きをもっているものと考えられる。また、五線の線間
隔や1ページに書かれる段数も特に決まっていない。そ
こで、五線の各々においてその始点と終点を求め、それ
らの2点を結ぶ直線として五線をあらわす。このような
五線を検出するには、楽譜画像を縦方向に等間隔に10
箇所走査して、黒画素および白画素のラン長を測定し、
それぞれヒストグラムをとって、これらのヒストグラム
において最大値をとるラン長をそれぞれ五線の線幅およ
び線間隔と考えることができる。
【0008】次に、画像を再度縦方向に10箇所走査
し、先に求めた線幅・線間隔の値をもとに各走査毎に五
線候補を選ぶ。全ての走査における五線候補をまとめ、
その頻度の高いところに一定の大きさのウィンドウをか
ける。そして、そのウィンドウを左右に動かし、横方向
の投影を利用し、始点と終点の正確な位置を求める。
【0009】また、音符は一般に図21に示すように符
頭1に必要に応じて符棒2が付加されさらに必要に応じ
て符尾3が付加されて構成されているが、(7) の音符認
識において、既に音符の符頭1と符棒2が認識されてい
る場合の符尾の位置および数を認識する方法の従来の一
例が特公平2−59510号公報に示されている。次に
この方法について説明する。
【0010】符尾の探査にあたり、符棒近傍にウィンド
ウを設定し、ウィンドウ内で縦軸方向のヒストグラムを
求める。ヒストグラムの連続が五線間隔の1/2以上で
且つ五線間隔以下のとき符尾と判断する。すなわち、こ
の場合画素の有無のみで判断している。また、単独の音
符の符尾の場合と連符の符尾の場合とで符尾の処理が異
なる。
【0011】すなわち、連符の場合は、図22に示すよ
うに注目している符棒F1、F2に対して横軸方向のヒ
ストグラムから各隣接するピーク間の距離を調べる。そ
して、ピークの間隔が符頭の幅よりも広い場合には符頭
1個分だけ離れた位置にウィンドウを設定するが、図2
2ではウィンドウW1、W1′およびW2がこれに相当
する。また、ピーク間隔が符頭の幅よりも狭い場合に
は、図22のウィンドウW2′のように符棒F2のすぐ
横に設定する。こうして符尾の探査を行うためのウィン
ドウW1、W1′、W2およびW2′が設定されると、
各ウィンドウの内部で縦軸方向のヒストグラムを求め、
ヒストグラムの連続が五線間隔GPの1/2以上で且つ
五線間隔GP以下のときに符尾と判断する。
【0012】また、単独の音符の場合は、図23に示す
ように符尾の長さ相当分だけ短くしたウィンドウW5、
W6を符棒の右側に設定する。これは、横方向のヒスト
グラムのピーク位置から符棒の位置を識別することがで
き、符尾は右側に付せられることからピーク位置から所
定距離だけ右側に沿って長形状のウィンドウW5、W6
を設定する。このウィンドウW5、W6を、さらに右方
向に所定距離だけ移動することによりウィンドウW5、
W6に重畳する符尾を探査することができる。すなわち
横方向のヒストグラムより単独音の切り出しを行って音
の高さを求め、符頭部分を除去した後に、符棒の右側に
符頭の横軸方向の幅の1/2の位置にウィンドウW5、
W6を設定し、このウィンドウW5、W6内で縦軸方向
のヒストグラムを求め、ヒストグラムの連続が五線間隔
GPの1/2以上から五線間隔GP以下のときに、符尾
該当部分の計数を行うことにより符尾を探査することが
できる。
【0013】特公平2−59510号公報には、(8) の
音符除去等の従来の一例についても記載されている。次
に、この音符等の除去の従来の一例について説明する。
認識できた対象物を楽譜データ上から除去するが、この
場合、小節線は長形状のウィンドウによって行い、五線
はテンプレートの移動によって順次一線ずつ除去し、単
独音は全体を包含するウィンドウを用いて除去する。ま
た、連符の符頭および符棒は符尾を含まないウィンドウ
を用いて除去し、連符の符尾は逆に符頭、符棒を含まな
いウィンドウを用いて除去する。このようにして、小節
線、五線、単独音、連符の符頭および符棒、連符の符尾
がそれぞれに対応するウィンドウで切り出されて除去さ
れると、楽譜上に残っているデータは記号のみとなる。
【0014】先に述べたように、楽譜の画像データの認
識におけるデータ処理の順番は五線、小節線、音符、記
号の順に行われ、記号が一番最後であるから記号の除去
は必ずしも行う必要はないが、音符と記号には同様の除
去法を利用することができる。音符は記号よりも先に認
識されるので、音符は記号の検出認識に先立って除去す
る。
【0015】次に、(9) の記号検出としての記号の矩形
位置検出について説明する。記号の矩形位置の検出と
は、記号図形が存在するx軸、y軸の範囲に対応する矩
形領域の座標データを得ることである。このように、矩
形位置すなわち記号位置を検出した後に、記号の認識、
すなわち記号種類の判別を行う。この記号の認識の際、
矩形座標内において認識処理を行う。そのために記号検
出の際に記号の矩形位置検出を行う必要がある。
【0016】なお、矩形位置検出は、シャープ(#)、
フラット( )、休止符、ト音記号、ヘ音記号等の記号
の検出に使用され、この記号検出より先行して行われる
音符の検出には、矩形位置検出でなく他の方法が用いら
れる。ちなみに、音符の検出には、例えば、x軸投影し
て得られるピークの位置が符棒の位置であり、そこに音
符が存在すると認める方法が用いられる。
【0017】
【発明が解決しようとする課題】上述したように、 (7)
の音符認識における符尾の認識の従来の方法では、ヒ
ストグラムをとるウィンドウ領域の設定が複雑であり、
単独の音符の符尾の場合と連符の符尾の場合とで符尾の
処理が異なるという問題がある。例えば、MIDIコー
ドを作成するための楽譜認識のように、楽譜に示された
実質的な音楽情報が認識できればよい場合には、符尾の
数がいくつか、すなわち何分音符か、さらに言い換えれ
ばその音符が示す音の長さがわかればよく、符尾の形状
の厳密な認識は不要である。このような場合には、特公
平2−59510号公報のように単独の音符の符尾の場
合と連符の符尾の場合とを区別する必要がなく、それよ
りも簡単な処理で符尾の数を確実に認識できることが望
ましい。
【0018】そして、(8) の音符除去についても従来の
方法では、音符を画像データから除去するのに多くの処
理と時間を必要としていた。特に高速処理を可能とする
ためには、簡単な処理で音符を画像データから除去する
ことができるようにすることが望ましい。
【0019】次に、(9) の記号検出のための記号の矩形
位置検出の従来の方法では、記号位置の厳密な検出は容
易ではなく、特に複数の画像データが近接して存在する
場合、言い換えればある矩形中に記号の画像データが分
離して存在する場合、これらを確実に分離して記号位置
を個別に検出することは困難であった。(10)の記号の認
識を確実に行えるようにするには、記号を囲む矩形中に
分離している画像データをもらすことなく検出すること
が重要である。
【0020】この発明は、上述のような事情に鑑みてな
されたもので、楽譜情報を簡単で高速且つ的確に認識す
ることが可能な楽譜自動認識装置を提供することを目的
としている。
【0021】さらに具体的には、この発明の目的は、単
独の音符の符尾の場合と連符の符尾の場合とで共通の処
理を行って、実質的な音符が示す音の長さの判定に必要
な符尾の数を容易に認識することができる楽譜自動認識
装置を提供することにある。
【0022】この発明のその他の具体的な目的は、簡単
且つ高速に音符部分のみを画像データから除去してその
他の記号認識を容易にする楽譜自動認識装置を提供する
ことにある。
【0023】この発明のさらにその他の具体的な目的
は、楽譜中の複数の記号データが近接して存在する場合
にも、それらを確実に分離して記号位置を個別に検出す
ることを可能とする楽譜自動認識装置を提供することに
ある。
【0024】
【課題を解決するための手段】この発明に係る楽譜自動
認識装置は、楽譜を2次元画像データに変換し、この画
像データから五線データおよび小節線データを除去し、
音符および記号を認識する楽譜自動認識装置において、
符頭と符棒の位置が認識されている音符に対し、前記符
棒を中心として単独の音符の符尾と連符の符尾とを同様
に扱い得る所定の幅をもった矩形領域の横軸方向に存在
する画素数の縦軸方向についての分布データを求める画
素分布検出手段と、前記分布データについて符尾のピー
クを検出できる程度の大きさの所定値を連続的に超える
縦軸方向の長さに基づいて符尾数を検出する符尾数検出
手段とを具備し、前記符尾数を用いて音符認識を行うこ
とを特徴としている。
【0025】この発明の他の楽譜自動認識装置は、楽譜
を2次元画像データに変換し、この画像データから五線
データおよび小節線データを除去し、音符および記号を
認識する楽譜自動認識装置において、前記五線データ及
び小節線データが除去された画像データから音符の符頭
及び符棒の位置を認識する音符認識手段と、この音符認
識手段によって符頭と符棒の位置が認識されている音符
に対し、前記符頭のない方の端点から符頭に向かって連
結する画像データを走査軸に沿って逐次除去する画像除
去手段を更に備えたことを特徴としている。
【0026】この発明のより具体的態様においては、前
記画像除去手段によって音符が除去された画像データ中
の記号図形を横軸および縦軸に投影し、画素が連続して
存在する各軸の範囲からなる矩形座標を検出する第1の
矩形座標検出手段と、上記矩形座標内について横軸およ
び縦軸への投影による矩形座標の検出を行い得られた矩
形座標について同様の処理を繰り返す第2の矩形座標検
出手段と、上記第2の矩形座標検出手段により矩形座標
を分割することができなくなったことを判別する最終矩
形判定手段とを更に具備し、最終的に分割することがで
きなくなった矩形座標内に検出すべき記号図形が存在す
ると判断することを特徴としている。
【0027】この発明の楽譜自動認識装置においては、
符頭と符棒の位置が認識されている音符に対し、符棒を
中心として所定の幅をもった矩形領域の横軸方向に存在
する画素数データについての所定値を超える連続する縦
軸方向の長さに基づいて符尾の数を決定するので、単独
の音符の符尾の場合と連符の符尾の場合とで共通の処理
を行って、実質的な音符が示す音の長さの判定に必要な
符尾の数を容易に認識することが可能となる。
【0028】この発明の他の楽譜自動認識装置において
は、前記音符認識によって符頭と符棒の位置が認識され
ている音符に対し、前記符頭のない方の端点から符頭に
向かって連結する画像データを走査軸に沿って逐次除去
する画像除去手段を更に備え、音符の符頭、符棒及び符
尾のみを除去するようにしているので、例えば付点八分
音符等の付点、連符中の付点やシャープ、フラット記
号、休止符等を音符とは分離して残すことができ、その
後の記号認識処理が極めて楽になる。
【0029】そして、このようにして音符が除去された
画像データ中の記号図形を横軸および縦軸に投影し、画
素が連続して存在する各軸の範囲からなる矩形座標内に
記号図形が存在するものとみなし、さらに上記矩形座標
内についての同様の矩形座標の検出を繰り返し、最終的
に分割することができなくなった矩形座標内に検出すべ
き記号図形が存在すると判断するように処理すると、楽
譜中の複数の記号データが近接して存在する場合にも、
それらを確実に分離して記号位置を個別に検出すること
が可能となる。
【0030】
【発明の実施の態様】以下、図面を参照して、この発明
の実施例を説明する。図1には、この発明の実施例に係
る楽譜自動認識装置において、楽譜画像の五線の位置を
検出するための構成が示されている。楽譜自動認識装置
において音符や記号を認識する際に邪魔になる五線を除
去するために、この構成により五線の最上線すなわち第
5線のy座標と五線の間隔wを求める。
【0031】この構成では、楽譜画像のx軸方向の黒画
素数の分布をy軸に沿ってとった1次元情報を信号処理
により分析して五線を検出する。すなわち、楽譜画像の
x軸方向の黒画素数の分布をy軸に投影した1次元情報
に信号処理の手法である自己相関法を用いて、この信号
の最小周期を求めて、五線の各線の間隔とする。この五
線の間隔に対応する投影1次元情報の合計値が最大とな
る位置を探索して五線の位置を推定する。
【0032】図1には、画像メモリ11、五線間隔検出
手段12、および五線位置検出手段13が示されてい
る。五線間隔検出手段12は、画素分布検出部14、自
己相関処理部15、および第1ピーク検出部16を有
し、楽譜の2次元画像データから横軸方向に存在する画
素数の縦軸方向の分布データについて縦軸方向の自己相
関をとり、その第1ピークを求めて五線間隔とする。五
線位置検出手段13は、5点加算部17、シフト制御部
18、フィルタ部19、ピーク点検出部20、および位
置検出部21を有し、五線間隔検出手段12で得られた
五線間隔に基づいて、前記画素数の縦軸方向の分布デー
タの縦軸方向に各々前記五線間隔ずつずれた5点のデー
タを加算し且つこの5点を逐次縦方向にシフトして、最
大の加算データが得られたときの前記5点の位置より五
線の位置を検出する。
【0033】次に、図2に示すフローチャートを参照し
て、この五線検出部の具体的な動作を説明する。 《ステップS1》:画像メモリ11には、楽譜をイメー
ジスキャナ等により撮像して得た図3のような2次元楽
譜画像データが格納される。この場合、画像メモリ11
に格納される楽譜画像データは、予め適宜なる手段を用
いて楽譜の傾きを修正しておく。
【0034】《ステップS2》:画素分布検出部14
は、画像メモリ11に格納された楽譜の2次元画像デー
タのx軸方向の画素数をy軸に投影して、y軸方向につ
いての画素分布データを求める。このy軸投影により得
られる画素分布データは、楽譜画像のx方向の黒画素数
をy軸にとっていったものである。図3に示す楽譜画像
データのy軸投影は図4のようになる。すなわち、楽譜
画像データを数1に示すp(i,j)を要素とする2次
元配列とする。
【0035】
【数1】
【0036】この楽譜画像データのy軸投影y(t)
(0≦t≦Y)は数2であらわされる。
【0037】
【数2】
【0038】数2のy(t)はy座標の点tにおけるx
軸方向に並ぶ黒画素の和を示している。
【0039】《ステップS3》:自己相関処理部15
は、前記y軸方向の画素分布データの自己相関をとる。
図4の画素分布データの自己相関値のデータを図5に示
す。第1ピーク検出部16は、前記自己相関の第1ピー
クを検出し、この第1ピークをとるy軸の偏倚の値を五
線間隔w(図6参照)とする。すなわち、まず、ステッ
プS2で画素分布検出部14により得られたy軸投影y
(t)の自己相関をとる。y軸投影y(t)の自己相関
a(τ)は数3であらわされる。
【0040】
【数3】
【0041】この自己相関a(τ)が第1ピークをとる
ときのτの値を五線間隔wと推定する。こうして五線間
隔検出手段12による五線間隔wの検出が行われる。
【0042】《ステップS4》:5点加算部17は、画
素分布検出部14により得られたy軸投影y(t)を、
第1ピーク検出部16により得られた五線間隔w毎の5
箇所について加算する。シフト制御部18は、5点加算
部17により加算される5点の位置をy軸方向に逐次シ
フトする。
【0043】5点加算部17は図7に示すような遅延加
算フィルタで構成することができる。遅延加算フィルタ
は、例えば、y軸投影y(t)データを順次シフトする
とともに、五線間隔w毎の5箇所にデータ出力点を有す
るシフトレジスタSRと、前記五線間隔w毎の5箇所の
出力点のデータを加算する加算器ADとで構成される。
この場合、シフトレジスタSRのデータシフトを制御す
るシフトクロックの制御手段がシフト制御部18とな
る。図7のようなそれぞれw遅延させた5点を加算する
遅延加算フィルタにy軸投影y(t)を入力する。加算
器ADで得られる5点和s(t)は数4であらわされ
る。
【0044】
【数4】
【0045】このようなw遅延させた5点を逐次y軸方
向にシフトしていって、w遅延させた5点がちょうど五
線に対応するとき、五線のy軸投影データが全部加算さ
れるので、結果は当然最も大きい値となる。このように
して得られる図4の画素分布データの5点和データは図
8のようになる。図8において矢印↓が付された個所が
それぞれ5線の位置に対応する。
【0046】《ステップS5》:フィルタ部19は、図
8において矢印↓が付された5線の位置に対応する各点
の検出を容易にするために、各種のフィルタリング処理
を行う。フィルタ部19は、例えば差分フィルタ、絶対
値フィルタ、およびローパスフィルタにより構成され
る。ローパスフィルタとしては、例えば移動平均フィル
タが用いられる。5点加算部17の出力s(t)を差分
フィルタに入力し、その出力を絶対値フィルタに、さら
に移動平均フィルタに入力する。これら各フィルタによ
る処理をそれぞれステップS6〜S8とする。
【0047】《ステップS6》:入力をq(t)、出力
をr(t)とすると、差分フィルタの出力r(t)は数
5であらわされる。
【0048】
【数5】
【0049】《ステップS7》:入力をq(t)、出力
をr(t)とすると、絶対値フィルタの出力r(t)は
数6であらわされる。
【0050】
【数6】
【0051】《ステップS8》:入力をq(t)、出力
をr(t)とし、移動平均幅を4wと定めれば、ローパ
スフィルタである移動平均フィルタ出力r(t)は数7
であらわされる。
【0052】
【数7】
【0053】5点加算部17の出力s(t)に基づいて
移動平均フィルタによって最終的に得られる出力z
(t)は数8であらわされる。
【0054】
【数8】
【0055】図8の5点和データに対して得られる移動
平均フィルタの出力z(t)は図9に示すようになる。
【0056】《ステップS9》:ピーク点検出部20
は、フィルタ部19の最終出力、すなわち移動平均フィ
ルタの出力z(t)のピーク点を検出する。位置検出部
21は、シフト制御部18と関連して動作し、ピーク点
検出部20で検出されたピーク点をもとに、五線の位置
を検出する。すなわち、フィルタ部19の最終出力であ
る移動平均フィルタの出力z(t)がピークをとるtの
値の近傍において、5点和s(t)が最大となるtの値
を探索し、ここを五線の基準位置(例えば、第5線のy
座標)とする。
【0057】このようにして、五線の基準位置および先
に求められた五線間隔wから、第1線から第5線までの
y座標を計算することができ、五線位置を検出すること
ができる。検出された五線位置は、楽譜画像データから
五線データを順次除去するのに用いられ、さらに、その
後の音符の認識に際しての音階判定にも利用される。
【0058】図10には、楽譜自動認識装置において楽
譜画像の既に符棒と符頭が認識されている音符の符尾の
数を検出するための構成が示されている。符棒と符頭が
既に認識されている音符の示す音の長さを認識するため
に、この構成により符尾の数を検出する。
【0059】この構成では、符頭と符棒の位置が既に認
識されている音符に対して、符棒を中心として、所定の
幅、例えば(五線間隔×0.5)、をもった矩形領域の
黒画素のヒストグラムをy軸上にとる。そしてこのヒス
トグラムのパターンを追跡して実質的なピークの個数を
判定し、符尾の数を推定する。
【0060】図10には、画像メモリ31、画素分布検
出手段32、および符尾数検出手段33が示されてい
る。画像メモリ31には、2次元楽譜画像データから既
に五線および小節線が除去された楽譜画像データが格納
されており、楽譜画像データ中の音符の符頭と符棒の位
置が既に認識されている。画素分布検出手段32は、既
に認識されている音符の符頭と符棒の位置に基づいて、
音符に対し、符棒を中心として所定の幅をもった矩形領
域を定め、その矩形領域の横軸方向に存在する画素数の
縦軸方向についての分布データを求める。符尾数検出手
段33は、データ値判別部34、および符尾数判定部3
5を有し、前記分布データについて連続して所定値を超
える縦軸方向の長さに基づいて符尾数を検出する。
【0061】次に、この構成の具体的な動作を説明す
る。画像分布検出手段32は、符頭と符棒の位置が既に
認識されている音符に対して、図11のように、符棒を
中心として、所定の幅、例えば(±五線間隔×0.
5)、をもった矩形領域の黒画素数のy軸方向について
の分布を示すヒストグラムをとる。符尾数検出手段33
は、前記分布パターンに基づいて符尾の数を推定する。
符尾数検出手段33のデータ値判別部34は、ヒストグ
ラムprjを以下の手順に従って追跡する。
【0062】[1] 3変数の初期化 status=0 len=0 n=0 ここで、statusはヒストグラムprjの状態を示す
変数(0のとき低レベル、1のとき高レベル)、len
はヒストグラムprjが所定値以上の高レベルを保ってい
るy軸方向の長さ、nは符尾数である。
【0063】[2] y軸走査変数をiとして、i=0〜Y
について次の処理を繰り返す。 if status=1 if prj(i)>θ then len=len+1 else (len から符尾の数を推定してnに加える), status=0, len=0 else if prj(i)>θ then status=1, len=len+1 この場合、所定値θは符尾のピークを検出できる程度の
大きさであり、例えば(五線間隔×0.3)に相当する
値である。符尾数判定部35は、lenに基づいて符尾
の数を推定する。すなわち、 w1=五線間隔×0.8 w2=五線間隔×0.4 とおいて、符尾数は次の数9で推定することができる。
【0064】
【数9】
【0065】この数9による符尾の数の推定は、例えば
図12のように、ノイズ等で符尾間がつぶれている音符
において、単にピークの数より符尾数を1とすることを
回避するために有効である。このようにすれば、単独の
音符の符尾と連符の符尾とを同様に扱って符尾の数を有
効に判定することが可能となる。
【0066】図13には、楽譜自動認識装置において、
五線および小節線が既に除去されている画像から音符が
検出され認識された後、次に行われる記号の認識を阻害
する要素を減弱するために、既に検出され認識された音
符を除去するための構成が示されている。
【0067】この構成では、既に位置のわかっている符
頭と符尾およびそれらと接続している点を高速に除去す
る。すなわち、音符を、x軸方向の線分がy軸方向上に
積み重なったものとして考え、符棒の符頭のないほうの
端点から符頭に向かって、順次これらの線分を除去して
ゆく。除去すべき線分は、1つ前のステップで除去した
線分と接続している線分である。
【0068】図13には、画像メモリ41、音符認識手
段42、連続データ検出手段43、および画像除去手段
44が示されている。音符認識手段42は、画像メモリ
41に格納されている予め五線および小節線が除去され
た楽譜画像データから音符を認識する。連続データ検出
手段43は、除去すべき画像データである音符画像デー
タの所定走査軸のデータの除去範囲に基づいて、次の走
査軸に存在するデータのうち、前記所定走査軸のデータ
の除去範囲と座標が少なくとも一部重なる連続データを
求める。画像除去手段44は、連続データ検出手段43
で得られる連続データを画像メモリ41内の楽譜画像デ
ータから逐次除去する。
【0069】次にこの構成の具体的な動作を説明する。
記号の検出および認識を確実に行うためには、音符の位
置検出および認識は記号の検出の前に行い、さらに記号
の検出の前に楽譜画像データから音符の画像データを除
去する必要がある。画像メモリ41に格納されている楽
譜画像データは、従前の処理により五線および小節線が
除去されている。この五線および小節線が除去された楽
譜画像データから音符認識手段42が音符の検出および
認識を行う。音符認識手段42における音符の検出の方
法としては従来より用いられている方法を用いることが
できるので、特に説明しないが、この音符認識手段42
による音符の検出の際の音符の位置検出により音符の符
頭、符尾および符棒の位置が検出される。
【0070】既に位置のわかっている符頭と符尾および
それらと接続している点を高速に除去するため次のよう
な処理を行う。図14に付点八分音符の例を模式的に示
すように、音符を、x軸方向の線分がy軸方向上に積み
重なったものとして考え、これらの線分を順次除去す
る。開始点は、符棒の符頭のないほうの端点とし、この
点から始めて、符頭に向かって処理を進める。除去すべ
き線分は、1つ前のステップで除去した線分と接続して
いる線分である。連続データ検出手段43はこの線分デ
ータを逐次検出する。ここで、線分(x1 ,y1 )−
(x2 ,y1 )(ただし、x1 ≦x2 )と接続している
線分(x1 ′,y2 )−(x2 ′,y2 )(ただし、x
1 ′≦x2 ′)とは次の条件を満たす線分である。
【0071】
【数10】
【0072】この条件を満たす線分からなる連続データ
が除去すべき音符画像データに対応する。画像除去手段
44は、この連続データを画像メモリ41内の楽譜画像
データから逐次除去する。上述の操作により、音符をほ
ぼ完全に除去することができる。図14に示す付点4
は、八分音符の符頭、符棒、および符尾を除去した後
に、後述するように記号として検出し認識して、その後
に除去する。
【0073】また、この構成は、次に述べる記号を認識
後に除去するためにも上述とほぼ同様にして実施するこ
ともできる。
【0074】図15には、楽譜自動認識装置において、
五線、小節線、および音符が既に除去されている画像か
ら記号を検出するために記号の存在する厳密な位置を検
出するための構成が示されている。
【0075】この構成では、記号図形を包含する矩形位
置を検出する。図形を包含する矩形とは、図形の最小x
座標、y座標を一端、図形の最大x座標、y座標を他端
とする線分を対角線とする長方形である。図形のx軸お
よびy軸への投影情報を交互に且つ繰り返し得ることに
より前記矩形位置を検出する。
【0076】図15には、画像メモリ51、第1の投影
部52、第2の投影部53、および最終矩形判定手段5
4が示されている。第1の投影部52は、例えば楽譜画
像の全体またはy軸投影情報に対応する領域の図形のy
軸方向の黒画素数のx軸に沿う分布情報をとり、図形の
x軸投影情報を得る。第2の投影部53は、x軸投影情
報に対応する領域の図形のx軸方向の黒画素数のy軸に
沿う分布情報をとり、図形のy軸投影情報を得る。最終
矩形判定手段54は第1の投影部52および第2の投影
部53で得られるx軸投影情報またはy軸投影情報が前
回のx軸投影情報またはy軸投影情報と等しい場合に、
その図形についての矩形領域が確定したものと判定し、
そうでない場合には第1の投影部52で得られたx軸投
影情報を第2の投影部53に与え、第2の投影部53で
得られたy軸投影情報を第1の投影部52に与えて、さ
らにy軸投影情報およびx軸投影情報の探査を繰り返
す。
【0077】次にこの構成の具体的な動作を説明する。
記号図形を包含する矩形、すなわち記号図形の最小x座
標、y座標を一端、記号図形の最大x座標、y座標を他
端とする線分を対角線とする長方形の位置を的確に求め
るために、図形のxまたはy軸への投影情報を交互に求
める。図形のx軸およびy軸への投影とは、それぞれy
軸およびx軸方向の黒画素数の分布をx軸およびy軸に
沿ってとったものである。
【0078】例えば、実際の記号とは異なるが図16の
ような図形A、B、およびCが画像メモリ51に格納さ
れた画像データに含まれているものとする。これら図形
A、B、およびCをそれぞれ包含する矩形の位置の検出
を考える。
【0079】(1) まず、第1の投影部52によりx軸へ
の投影をとる。その結果、x軸に2つの領域RX1および
X2が得られ、図形Aと図形BおよびCとが分離され
る。 (2) 第2の投影部53によりこれら領域RX1およびRX2
の各領域区間内でそれぞれy軸への投影をとる。すなわ
ち、上記2つの領域RX1およびRX2について別々にy軸
投影する。その結果、領域RX1からはy軸に領域RY1
得られ、領域RX2からは領域RY2およびRY3が得られ、
図形Bと図形Cとが分離される。 (3) 同様にして、領域RY1、RY2およびRY3の各領域区
間内でx軸への投影をとる。最終矩形判定手段54は、
この結果として得られる領域区間が(1)で得られた結果
と同じか否かを判定し、同じであれば終了する。図16
の場合、図形Aについては処理を終了し、図形BとCに
ついては、x軸への投影領域が定まる。 (4) 以上の操作を繰り返す。
【0080】上述のアルゴリズムを用いた場合、矩形が
交わるような位置、すなわちx軸およびy軸投影したと
きに両方で重なり合うような位置関係にある図形の検出
は正しく行われない。しかし、楽譜の記号図形において
は、このようなものはほとんどなく、問題にはならな
い。ただし、音符の中には特別なものがあり、これは問
題となるおそれがある。例えば、付点八分音符等の付
点、連符中の付点、休止符等である。そこで、このよう
な検出できない部分を認識するために、前もって前述し
た手段により音符を除去しておく。このように音符を除
去しておくことにより、上記検出できない部分も検出す
ることが可能となる。
【0081】上述のような処理により、例えば図17に
示すような楽譜画像データから五線および小節線が検出
除去され、図18のような画像となり、この画像から音
符(符頭、符尾等)が検出され認識され除去されて、図
19のような画像となり、残った記号が検出され認識さ
れ除去されて、図20のような画像となり、残った記号
が認識される。なお、この発明におけるアルゴリズムで
は、五線、小節線、音符等の画像を認識し除去した後
に、若干の消し残りがでてしまうこともある。しかしな
がら、このような消し残りがあった場合には、予め登録
してある記号等の図形の矩形の大きさと異なるサイズの
データは認識しないようにすれば、前記消し残りが他の
記号の認識に与える影響を未然に防ぐことができるの
で、問題は生じない。
【0082】
【発明の効果】以上述べたように、この発明によれば、
楽譜を2次元画像データに変換し、この画像データから
五線データおよび小節線データを除去し、音符および記
号を認識する楽譜自動認識装置において、楽譜情報を簡
単で且つ高速化の容易な構成で的確に認識することを可
能とする楽譜自動認識装置を提供することができる。
【図面の簡単な説明】
【図1】 この発明にの実施例に係る楽譜自動認識装置
の五線検出のための構成を模式的に示すブロック図であ
る。
【図2】 図1の構成の処理動作を説明するためのフロ
ーチャートである。
【図3】 図1の構成の処理動作を説明するための楽譜
の一例を示す図である。
【図4】 図1の構成の処理動作を説明するためのy軸
投影ヒストグラムを示す図である。
【図5】 図1の構成の処理動作を説明するためのy軸
投影ヒストグラムの自己相関特性を示す図である。
【図6】 図1の構成の処理動作を説明するための図で
ある。
【図7】 図1の構成の処理動作を説明するための遅延
加算フィルタの構成を模式的に示すブロック図である。
【図8】 図1の構成の処理動作を説明するための5点
和特性を示す図である。
【図9】 図1の構成の処理動作を説明するための移動
平均フィルタ処理の施された結果を示す図である。
【図10】 同楽譜自動認識装置における符尾数検出の
ための構成を模式的に示すブロック図である。
【図11】 図10の構成の処理動作を説明するための
音符の一部およびy軸投影データを模式的に示す図であ
る。
【図12】 図10の構成の処理動作を説明するための
音符画像の一例の一部を模式的に示す図である。
【図13】 同楽譜自動認識装置における音符消去のた
めの構成を模式的に示すブロック図である。
【図14】 図13の構成の処理動作を説明するための
音符画像の一例の一部を模式的に示す図である。
【図15】 同楽譜自動認識装置における記号検出のた
めの構成を模式的に示すブロック図である。
【図16】 図15の構成の処理動作を説明するための
画像の一例を模式的に示す図である。
【図17】 この発明に係る楽譜自動認識装置の処理動
作を説明するための図である。
【図18】 この発明に係る楽譜自動認識装置の処理動
作を説明するための図である。
【図19】 この発明に係る楽譜自動認識装置の処理動
作を説明するための図である。
【図20】 この発明に係る楽譜自動認識装置の処理動
作を説明するための図である。
【図21】 音符の各部分の呼称を説明するための図で
ある。
【図22】 従来の楽譜自動認識処理の一例を説明する
ための図である。
【図23】 従来の楽譜自動認識処理の他の一例を説明
するための図である。
【符号の説明】
11,31,41,51…画像メモリ、12…五線間隔
検出手段、13…五線位置検出手段、14…画素分布検
出部、15…自己相関処理部、16…第1ピーク検出
部、17…5点加算部、18…シフト制御部、19…フ
ィルタ部、20…ピーク点検出部、21…位置検出部、
31…画素分布検出手段、33…符尾数検出手段、34
…データ値判別部、35…符尾数判別部、42…音符認
識手段、43…連続データ検出手段、44…画像除去手
段、52…第1の投影部、53…第2の投影部、54…
最終矩形判定手段。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−254574(JP,A) 特開 昭60−220479(JP,A) 特開 平1−213769(JP,A) 特公 平2−59510(JP,B2) 「電子通信学会技術研究報告 PRL 78−73」Vol.78 No.225 p. 41−50”音楽情報の入力とデータベース の作成" (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 G10G 3/04 G10H 1/00 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 楽譜を2次元画像データに変換し、この
    画像データから五線データおよび小節線データを除去
    し、音符および記号を認識する楽譜自動認識装置におい
    て、 符頭と符棒の位置が認識されている音符に対し、前記符
    棒を中心として単独の音符の符尾と連符の符尾とを同様
    に扱い得る所定の幅をもった矩形領域の横軸方向に存在
    する画素数の縦軸方向についての分布データを求める画
    素分布検出手段と、 前記分布データについて符尾のピークを検出できる程度
    の大きさの所定値を連続的に超える縦軸方向の長さに基
    づいて符尾数を検出する符尾数検出手段とを具備し、前
    記符尾数を用いて音符認識を行うことを特徴とする楽譜
    自動認識装置。
  2. 【請求項2】 楽譜を2次元画像データに変換し、この
    画像データから五線データおよび小節線データを除去
    し、音符および記号を認識する楽譜自動認識装置におい
    て、 前記五線データ及び小節線データが除去された画像デー
    タから音符の符頭及び符棒の位置を認識する音符認識手
    段と、 この音符認識手段によって符頭と符棒の位置が認識され
    ている音符に対し、前記符頭のない方の端点から符頭に
    向かって連結する画像データを走査軸に沿って逐次除去
    する画像除去手段を更に備えたことを特徴とする請求項
    1記載の楽譜自動認識装置。
  3. 【請求項3】 前記画像除去手段によって音符が除去さ
    れた画像データ中の記号図形を横軸および縦軸に投影
    し、画素が連続して存在する各軸の範囲からなる矩形座
    標を検出する第1の矩形座標検出手段と、 上記矩形座標内について横軸および縦軸への投影による
    矩形座標の検出を行い得られた矩形座標について同様の
    処理を繰り返す第2の矩形座標検出手段と、 上記第2の矩形座標検出手段により矩形座標を分割する
    ことができなくなったことを判別する最終矩形判定手段
    と、 を更に具備し、最終的に分割することができなくなった
    矩形座標内に検出すべき記号図形が存在すると判断する
    ことを特徴とする請求項2記載の楽譜認識装置。
JP03300098A 1998-02-16 1998-02-16 楽譜自動認識装置 Expired - Fee Related JP3147846B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03300098A JP3147846B2 (ja) 1998-02-16 1998-02-16 楽譜自動認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03300098A JP3147846B2 (ja) 1998-02-16 1998-02-16 楽譜自動認識装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP3216013A Division JPH0535924A (ja) 1991-07-31 1991-07-31 楽譜自動認識装置

Publications (2)

Publication Number Publication Date
JPH10228519A JPH10228519A (ja) 1998-08-25
JP3147846B2 true JP3147846B2 (ja) 2001-03-19

Family

ID=12374591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03300098A Expired - Fee Related JP3147846B2 (ja) 1998-02-16 1998-02-16 楽譜自動認識装置

Country Status (1)

Country Link
JP (1) JP3147846B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8889976B2 (en) 2009-08-14 2014-11-18 Honda Motor Co., Ltd. Musical score position estimating device, musical score position estimating method, and musical score position estimating robot

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025501B2 (ja) 2000-03-03 2007-12-19 株式会社ソニー・コンピュータエンタテインメント 楽音発生装置
JP2001318672A (ja) * 2000-03-03 2001-11-16 Sony Computer Entertainment Inc 楽音発生装置
JP5654897B2 (ja) 2010-03-02 2015-01-14 本田技研工業株式会社 楽譜位置推定装置、楽譜位置推定方法、及び楽譜位置推定プログラム
GB201805066D0 (en) * 2018-03-28 2018-05-09 Nkoda Ltd Musical notation system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「電子通信学会技術研究報告 PRL78−73」Vol.78 No.225 p.41−50"音楽情報の入力とデータベースの作成"

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8889976B2 (en) 2009-08-14 2014-11-18 Honda Motor Co., Ltd. Musical score position estimating device, musical score position estimating method, and musical score position estimating robot

Also Published As

Publication number Publication date
JPH10228519A (ja) 1998-08-25

Similar Documents

Publication Publication Date Title
JP3343864B2 (ja) 語体の分離方法
JP2951814B2 (ja) 画像抽出方式
JPH0535924A (ja) 楽譜自動認識装置
JPH05242298A (ja) 記号列の認識方法
US6947596B2 (en) Character recognition method, program and recording medium
JP3193240B2 (ja) 画像処理装置
JP3147846B2 (ja) 楽譜自動認識装置
JP3445039B2 (ja) 楽譜認識装置
JP2003022446A (ja) 署名照合装置、署名照合方法およびその方法をコンピュータに実行させるプログラム
JP2858530B2 (ja) エッジ強調装置
JP3812836B2 (ja) 楽譜認識装置
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
JPH1153539A (ja) 円形パターン判定方法および記録媒体
JP3077929B2 (ja) 文字切出し方式
JP5248074B2 (ja) 楽譜認識装置、楽譜認識方法、及びコンピュータプログラム
JP2963508B2 (ja) 文字切出し装置
JPH11143990A (ja) 文字認識方法及び装置及びその方法を記録した記録媒体
JPH1166230A (ja) 文書認識装置、文書認識方法及び媒体
JP2865703B2 (ja) 線画像データの認識方法
JP2587812B2 (ja) 図形抽出方法
JPH07120392B2 (ja) 文字パターン切り出し装置
JP3021708B2 (ja) 線画像解析装置
JP2002083296A (ja) 部分テンプレート生成装置
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JP2005242825A (ja) 帳票読取装置及び帳票読取装置による帳票方向判定方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees