JP2003187186A - 楽譜認識装置 - Google Patents

楽譜認識装置

Info

Publication number
JP2003187186A
JP2003187186A JP2003009571A JP2003009571A JP2003187186A JP 2003187186 A JP2003187186 A JP 2003187186A JP 2003009571 A JP2003009571 A JP 2003009571A JP 2003009571 A JP2003009571 A JP 2003009571A JP 2003187186 A JP2003187186 A JP 2003187186A
Authority
JP
Japan
Prior art keywords
staff
data
recognition
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003009571A
Other languages
English (en)
Other versions
JP3709991B2 (ja
Inventor
Seiji Nakano
誠至 中野
Ren Sumida
錬 澄田
Tetsuo Hino
鉄夫 日野
Atsushi Ooba
厚始 大場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawai Musical Instrument Manufacturing Co Ltd
Original Assignee
Kawai Musical Instrument Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawai Musical Instrument Manufacturing Co Ltd filed Critical Kawai Musical Instrument Manufacturing Co Ltd
Priority to JP2003009571A priority Critical patent/JP3709991B2/ja
Publication of JP2003187186A publication Critical patent/JP2003187186A/ja
Application granted granted Critical
Publication of JP3709991B2 publication Critical patent/JP3709991B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

(57)【要約】 【課題】 簡単に楽譜画像の取り込み状態を判別するこ
とができるようにする。 【解決手段】 楽譜画像データを五線と垂直方向に走査
し、連続する白および黒画素の長さを求めて、長さ毎の
頻度分布データを作成する頻度分布データ作成手段と、
頻度分布データ作成手段により作成された頻度分布デー
タから五線の線幅および間幅を求める幅検出手段と、幅
検出手段により求められた線幅および間幅のデータか
ら、入力された楽譜画像データの解像度および濃度の少
なくとも一方を算出して出力するとともに、楽譜画像デ
ータから五線認識を行い、認識された五線のデータから
五線の傾きを判別して出力する画質チェック手段とを備
える。従って、簡単な処理で、予め画像の読み込み状態
が判別でき、例えば解像度や濃度が範囲外である場合に
その旨を表示し、例えば利用者に画像データの再取り込
みを行わせることにより効率良く楽譜認識を行う事がで
きる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は楽譜認識装置に関
し、特に入力された楽譜画像データの解像度や濃度、お
よび五線の傾きをチェックすることが可能な楽譜認識装
置に関するものである。
【0002】
【従来の技術】従来の楽譜認識装置においては、例えば
スキャナによって読み込んだ楽譜画像データについて、
まず五線を認識し、これに基づいて音符や各種記号を認
識して、MIDIファイルデータ等の演奏データを生成
するものがあった。
【0003】
【発明が解決しようとする課題】楽譜をスキャナ等で読
み込み、認識する楽譜認識装置において、取り込む画像
の解像度や、白黒画像を取り込む際の2値化のしきい
値、原稿の傾き等は、認識率に重大な影響を及ぼす場合
が多い。しかし、これらの条件を全て良い状態に保って
画像の取り込みを行うのは難しく、様々な条件で画像デ
ータが取り込まれることになる。ところが、従来の楽譜
認識装置の演奏データ生成処理においては、これらの条
件を一切考慮せずに認識処理を行っていた。その結果、
時間のかかる楽譜認識処理を行った後に、認識率が非常
に悪いので、再度楽譜データを読み込ませる処理からや
り直さざるを得ないという事態が発生するという問題点
があった。本発明の目的は、前記のような従来技術の問
題点を解決し、時間のかかる楽譜認識処理を行う前に、
簡単に画像の取り込み状態を判別することが可能な楽譜
認識装置を提供することにある。
【0004】
【課題を解決するための手段】本発明は、入力された楽
譜画像データから各種記号を認識して、演奏情報に変換
する楽譜認識装置において、楽譜画像データを五線と垂
直方向に走査し、連続する白および黒画素の長さを求め
て、長さ毎の頻度分布データを作成する頻度分布データ
作成手段と、前記頻度分布データ作成手段により作成さ
れた頻度分布データから五線の線幅および間幅を求める
幅検出手段と、前記幅検出手段により求められた線幅お
よび間幅のデータから、入力された楽譜画像データの解
像度および濃度の少なくとも一方を算出して出力すると
ともに、楽譜画像データから五線認識を行い、認識され
た五線のデータから五線の傾きを判別して出力する画質
チェック手段とを備えたことを特徴とする。
【0005】本発明はこのような構成により、簡単な処
理で、予め画像の状態が判別できるので、例えば、楽譜
画像データの解像度や濃度、五線の傾きが、認識に必要
な所定の範囲から外れている場合に、それらの情報を表
示するなどして、利用者に画像データの再取り込みを行
わせることにより、時間のかかる楽譜認識処理を行った
後で、画質のせいで認識率が落ちていたことが判別する
といった無駄を防止でき、結果として処理時間が短縮さ
れ、認識率も向上し、効率良く楽譜認識を行う事ができ
る。
【0006】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して詳細に説明する。図1は本発明の楽譜認識装
置の一実施例の構成を示すブロック図である。この装置
は、パソコン等の一般的な計算機システムにスキャナや
MIDIインターフェース回路を付加したものである。
CPU1は、ROM2あるいはRAM3に格納されるプ
ログラムに基づき、楽譜認識装置全体の制御を行う中央
処理装置である。また、予め設定された所定の周期でC
PU1に割り込みをかけるタイマ回路を内蔵している。
RAM3はプログラムエリアの他、画像データバッフ
ァ、ワークエリア等として使用される。ハードディスク
装置HDD4およびフロッピディスク装置FDD5は、
プログラムおよび画像データ、演奏データ等を格納す
る。CRT6はCPU1の制御に基づき、CRTインタ
ーフェース回路7から出力される映像情報を表示し、キ
ーボード8から入力された情報は、キーボードインター
フェース回路9を経てCPU1に取り込まれる。プリン
タ10は、CPU1の制御に基づき、プリンタインター
フェース回路11から出力される印字情報を印字する。
【0007】スキャナ12は、(印刷された)楽譜を光
学的に走査して、2値あるいはグレイスケールの画像デ
ータに変換するものであり、フラットベッド型、ハンデ
ィ型、フィーダー型等任意のタイプのものを使用でき
る。スキャナ12によって読み取られた画像情報は、ス
キャナインターフェース回路13を介して、RAM3あ
るいはHDD4に取り込まれる。MIDIインターフェ
ース回路14は、音源モジュール等の外部のMIDI機
器との間でMIDIデータの送受信を行う回路である。
バス15は楽譜認識装置内の各回路を接続している。な
お、この他にマウス等のポインティングデバイス、RS
232C等のシリアルインターフェース回路等を備えて
いてもよい。
【0008】図3は、CPU1のメイン処理を示すフロ
ーチャートである。ステップS1においては、スキャナ
12によって楽譜の画像をRAM3に取り込む。画像は
2値の画像として取り込む。ステップS2においては、
かすれやドットノイズなどを軽減するために、図形融合
などの画質平滑化処理を行う。具体的には、例えば各黒
画素について、上下左右の4点(4連結)あるいは更に
斜め方向も含めた周囲の8点(8連結)を黒画素にする
膨張処理を行い、その後、各黒画素の内、上下左右の4
点あるいは周囲の8点が黒であるもののみを黒画素とし
て残す収縮処理を行うことにより、例えば黒領域中に1
画素だけ白が存在するような場合には全て黒画素に修正
され、また収縮処理を行った後に膨張処理を行うことに
より、1画素だけ黒であるような点が白に修正される。
【0009】ステップS3においては、解像度と濃度の
情報を得、それらの情報に基づいて画質チェック処理を
行うと共に五線認識の基準データを作成する。また、こ
の画質チェック処理S3では、前記五線認識の基準デー
タに基づき五線認識を行い、認識された五線の傾きを判
別しての画質チェックも行う。楽譜の認識処理において
は、解像度および濃度、五線の傾きが所定の範囲から外
れると認識率が低下してしまうので、ステップS3にお
いては、これらの値が、所定の範囲内に入っているか否
かがチェックされる。ステップS4においては、ステッ
プS3におけるチェック結果が画質OKであるか否かが
判定され、結果がOKでない場合にはステップS1に戻
って、解像度や濃度、原稿の傾きを変えて再取り込みを
行う。
【0010】ステップS3に含まれる五線認識処理およ
び五線の傾きの判別は、後段のステップS5と同様の処
理であるので、その詳細はステップS5の説明により明
らかになることであるが、概略は、五線を認識し、認識
された五線のうちの任意の1本の縦方向のシフト量(ず
れ)の最大幅に基づいて五線の傾きを判別するものであ
る。なお、ここで認識された五線やシフト量は、後段の
ステップS5で利用可能である。
【0011】ステップS5においては、五線認識を行
う。五線認識処理は、大きく五線走査開始位置検出処理
と、五線シフト量の検出処理に分かれる。五線走査開始
位置検出処理の概略を述べると、x軸方向のある位置
で、黒画素と白画素の幅を順に求め、求められた線幅と
間幅が五線状に並んでいる位置を、ある程度の誤差を考
慮して検出する。そして、加線(五線からはみ出した音
符を記載するために付加した横線)の影響を除くため
に、五線状の並びの両側に間幅より大きな白画素幅があ
るという条件を加える。この条件に合う白黒画素の並び
があるx位置の各黒ランの中点を五線走査開始位置とす
る。
【0012】つぎに、五線シフト量の検出処理の概略を
述べると、求められたx位置の五線走査開始位置(5点
の黒画素位置)から、1ドットずつ位置を左右に変えて
いき、5点の内、黒画素が所定の個数(例えば3あるい
は4個)以下になった場合に、y座標を黒画素の割合が
高くなる方向へシフトする。そして開始位置からのシフ
ト量を五線のシフト量とする。五線走査開始位置から左
右に、黒画素個数が0になる位置まで走査することによ
り五線の検出を行う。なお、ステップS3の五線認識処
理で結果が得られているものについては、ここで新たに
検出する必要がないことは前述したとおりである。
【0013】ステップS6においては、段落認識処理を
行う。この処理は、大きく、段落認識処理と、大かっこ
認識処理に分かれる。段落認識処理においては、画像全
体で五線を検出し、五線同士で左端がほぼ同じ場所にあ
る五線の組を探し、五線の端同士が、黒画素で結ばれて
いるかどうかを検査し段落を認識する。ステップS7に
おいては、段落の認識結果を表示して、段落認識結果が
正しいか否かを利用者にチェックさせることにより、O
Kか否かが判定され、結果がOKでない場合にはステッ
プS8に移行して、段落認識結果の修正が行われる。
【0014】なお、五線認識が失敗した場合には、その
後の処理が行えないので、倍率や濃度、五線の傾きを変
更して再度画像を取り込む必要がある。従って、ステッ
プS7においては、まず五線の認識結果を表示し、正し
いか否かを利用者に判定させ、もし正しくない場合に
は、S1に戻って画像の再取り込みを行い、また五線が
正しく認識されている場合には、段落認識結果を表示
し、チェックさせるようにしてもよい。
【0015】ステップS9においては、処理矩形の決定
処理が行われる。五線全体がある程度以上傾いている
と、ステップS9において矩形を切り出すことが困難と
なり、後述するステップS10の傾き補正では補正もで
きなくなる。認識された五線を含むある程度広い矩形を
採り、これを認識処理矩形とする。矩形の大きさは、そ
の五線に関係する音楽記号が存在する最大領域以上で、
かつ五線傾き補正により、必要な記号が消えない様な大
きさにする。これ以降の認識はこの矩形内で行う。
【0016】ステップS10においては、五線傾き補正
処理を行う。概略を述べると、先に求めた五線シフト量
に基づいて矩形画像の列ごとに画素列を上下にシフトす
る。この後、矩形の上下端に接した図形ラベル(独立し
た黒画素領域)は上下のパートの構成要素として削除す
る。最後に、上下端の空白部分を検出して、矩形を縮小
する。
【0017】ステップS11〜S15においては、各種
記号の認識処理が行われる。ステップS11において
は、五線に対して定位置にある記号として、音部記号と
拍子記号を認識する。該処理においては、まず、求めら
れた五線を含む矩形領域で縦に黒画素のヒストグラムを
取っていき、黒画素量があるしきい値以上の帯域を、記
号が存在する可能性のある場所としてマッチングの対象
とする。マッチングは、五線間の数箇所について横方向
のペリフェラル特徴によって行う。ペリフェラル特徴と
は、マッチング対象となる記号のみを含む矩形領域の左
右端から五線間の数箇所の白画素領域を内方向に走査
し、黒画素領域に達するまでの距離を1次(最初)ある
いは数次(2回目以降)まで求めたものである。認識さ
れた記号は画像データから削除する。
【0018】ステップS12においては音符認識を行
う。まず、矩形領域を横に走査して、所定の長さ以下の
黒ランを検出し、分離する。分離された画像データは、
横が細い部分であるので、ここから符尾や小節線の候補
になる縦線を検出する。次に、縦に所定の長さ以下の黒
ランを検出し分離する。分離された画像データは細い横
線を構成する部分なので、ここから加線やクレッシェン
ドなどの候補になる横線を検出する。最後に、元の画像
データから検出された縦横の細ランを消せば、画像中の
太い部分(以下太ラベル)が抽出できる。楽譜の場合、
4分音符より短い音符の符頭(以下黒玉符頭)や連鉤
(複数の音符をつなぐ帯)が分離できる。
【0019】黒玉符頭は、太ラベルの境界線についての
座標チェーンデータを求め、この座標データから公知の
方法により楕円式を計算し、この形や太ラベルとのマッ
チング度をとって認識する。2分音符、全音符の符頭
(以下白抜き符頭)は、画像の穴の座標チェーンから楕
円式を計算する。
【0020】最後に、先に求めた符尾候補と結合して音
符を検出する。連鉤は、これまでに求められた旗を考え
ない音符の符尾の周辺に存在する太ラベルを検出し、こ
れの形状から連鉤の本数を計算する。また、この連鉤に
連結している他の音符も検出する。連結する他の音符が
無い場合には単独の旗を持つ音符と考える。連鉤の本数
により、音符の情報を変更する。この後、分離した横線
を使って音の高さ(加線)やクレッシェンド、横線と縦
線を使ってくり返しかっこ等を認識する。残った縦線か
ら小節線を認識する。そして、認識された記号は画像か
ら削除する。
【0021】ステップS13においては、定型記号認識
が行われる。この処理においては、まず、公知の輪郭線
荷重方向指数を取り、辞書の各記号データについてラベ
ルのサイズと荷重方向指数のマッチング度を計算して、
各マッチング度を正規化し、統合した結果が最も高い記
号を出力する。認識された記号は画像から削除する。
【0022】ステップS14においては、文字列認識を
行う。速度記号などの文字列を認識するために、定型記
号認識で認識されたアルファベットその他の記号を使
い、その記号を囲む矩形が文字列状に並んでいるものを
抽出し、これと文字列辞書のマッチングをとることで、
文字列状の記号を、それぞれの構成文字が多少間違って
いても認識できるようにする。
【0023】ステップS15においては、スラー、タイ
認識を行う。この処理においては、残ったラベルのう
ち、検出された音符の周りのラベルに関して、これを細
線化し、これを多円弧近似する。そして、以前に消され
た記号により線が切れている場合があるので、求められ
た多円弧同士の連結を行う。最後に、求められた円弧の
形や元画像の図の太さ、音符との関係などからスラー、
タイを認識する。これが認識で最後のルーチンなので、
認識された記号は画像から削除しなくても良いが、認識
したスラー、タイを削除し、この後で再度定型記号認識
を行うようにすれば、スラー、タイと接触した記号を認
識することができるようになる。
【0024】ステップS16においては、例えば認識結
果に基づき、楽譜画像データを合成して表示し、正しい
か否かを利用者にチェックさせることにより、OKか否
かが判定され、結果がOKでない場合にはステップS1
7に移行して、マウス、キーボード等を用いて、手動に
より認識結果の修正が行われる。ステップS18におい
ては、演奏データ作成処理が行われる。該処理において
は、認識した各種の記号や音符情報に基づき、例えば公
知の演奏データ形式であるMIDIファイルデータを生
成する。
【0025】図2(a)は、図3のステップS3の画質
チェック処理における楽譜画像データの走査例を示す説
明図である。なお、楽譜の音符や各種記号は図示してい
ないが存在する。画質チェック処理においては、解像度
と濃度の情報を得、それらの情報に基づいて画質チェッ
ク処理を行うと共に五線認識の基準データを作成する。
また、この画質チェック処理S3では、前記五線認識の
基準データに基づき五線認識を行い、認識された五線の
傾きを判別しての画質チェックも行う。五線認識の基準
データを得るためには五線の線幅と五線の各線間の間幅
を検出する必要がある。そのために、画像上の横(x)
方向の数箇所(図2においては5箇所)において、画像
を縦(y)方向に走査し、黒ラン(連続する黒画素の長
さ)と白ランの長さを全て求めて、画素の種類ごとに頻
度分布(ヒストグラム)データを作成する。
【0026】図2(b)、(c)はそれぞれ黒ラン長お
よび白ラン長のヒストグラム例を示す説明図である。そ
れぞれのヒストグラムにおいて横軸はラン長(画素数)
であり、縦軸はランの個数である。楽譜上で最も多い記
号は五線であるので、作成された黒ラン長ヒストグラム
と、白ラン長ヒストグラムのピークを検出することで、
五線の線幅、間幅が推定できる。例えば図2の例におい
ては、黒ラン長のピークは4であり、また白ラン長のピ
ークは30である。従って、五線の線幅は4画素長であ
り、間幅は30画素長であることが推定できる。そし
て、画像データの解像度は、例えば間幅、間幅+線幅、
あるいは五線幅等から推定可能であり、また、濃度は線
幅と間幅の比から推定することができる。
【0027】図4は、ステップS3の解像度と濃度につ
いての画質チェック処理の詳細を示すフローチャートで
ある。ステップS20においては、図2(a)に示すよ
うに、画像上の数カ所において、五線と直角方向に画像
データを走査し、白画素および黒画素のラン長データを
求める。ステップS21においては、図2(b)、
(c)に示すように、白および黒画素のラン長ヒストグ
ラムを作成する。ステップS22においては、黒ラン長
のピークから五線の線幅thick を、また白ラン長のピー
クから五線の間幅blank を求める。ピーク値としては、
ヒストグラム中の最大値を示すラン長を採用してもよい
し、個数があるレベル以上のラン長の加重平均を取って
もよい。
【0028】ステップS23においては、五線幅height
を求める。五線の幅は、height=(thick ×4) + (blank
×4)となる。解像度はこのheightから判別する。ステッ
プS24においては、2値化しきい値(濃度)を求め
る。2値化しきい値は、例えば、(thick × k) / heig
ht などから判別する。なおk は適当な定数である。ス
テップS25においては、求めた五線幅が、楽譜認識処
理に必要な解像度範囲に対応する所定の長さ範囲内であ
るか否かが判定され、結果が否定の場合にはステップS
28に移行するが、肯定の場合にはステップS26に移
行する。ステップS26においては、ステップS24で
求めた濃度値が所定の範囲内か否かが判定され、結果が
否定の場合にはステップS28に移行するが、肯定の場
合にはステップS27に移行する。ステップS27にお
いては、変数gasituに定数OKを代入し、またステップS
28においては、変数gasituに定数NGを代入する。この
変数gasituはステップS4の判定において参照される。
以上のような処理によって、五線という楽譜特有の画像
から解像度および濃度についての画質チェックを行うこ
とができる。また、この処理によって検出された五線の
線幅および間幅は五線認識時の基準データとして利用さ
れる。
【0029】五線の傾きについての画質チェックは、ス
テップS5と同様にして五線認識を行い、認識された五
線のうちの任意の1本の縦方向のシフト量(ずれ)の最
大幅に基づいて行うことができる。この場合、シフト量
の最大幅をmaxgap、検出された五線の横方向の長さをst
afflength とすると、(maxgap × k)/height、(maxgap
× k)/stafflength 、あるいは(maxgap × k)/(staffle
ngth × height)(kは適当な定数)などの値を求め
て、この値が所定値以上である場合にはNGとすること
ができる。
【0030】以上、実施例を説明したが、次のような変
形例も考えられる。実施例においては、画質チェック結
果がOKか否かのみが判定される例を開示したが、例え
ば解像度については、低すぎる、良い、高すぎる、濃度
については、薄い、良い、濃いの3段階で判別するよう
にしても良いし、更に段階を多くしてもよい。また、解
像度、2値化しきい値の2つを統合して取り込みの適切
さを判別する、即ち解像度が適切であれば、OKと判定
する濃度範囲をある程度広くし、解像度が適切でない場
合には狭くする等の方法も考えられる。
【0031】判定結果を表示するようにしてもよい。N
Gである場合には、解像度が低すぎる(画像が小さすぎ
る)というようなNGの原因となる事項を表示すれば、
再読み込み時の参考になる。更に、現在よりもどの程度
解像度(倍率)を上げればよいか、あるいは濃度をどの
程度変更すればよいかを表示するようにしてもよい。判
定結果を使用して、再読み込み時にスキャナを制御して
もよい。例えば五線幅が適切な値の半分しかなかった場
合には、スキャナの解像度あるいは倍率を倍に上げるよ
うにスキャナを制御し、再読み込みを実行する。濃度に
関して制御してもよい。判定結果に基づき、その後の処
理を実行するか否かを決定する替わりに、チェック結果
を表示して、使用者の判断を待つようにしてもよい。
【0032】ステップS3において解像度や濃度の画質
チェックのみを行った場合、五線全体がある程度以上傾
いていると、ステップS9において矩形を切り出すこと
が困難となり、ステップS10の傾き補正では補正でき
なくなる。従って、本発明では、前記のように、画質チ
ェック処理において、ステップS5における五線認識を
行い、任意の五線の内の一つを検出し、その縦方向のシ
フト量(ずれ)を計算して、シフト量の最大幅から、原
稿の傾きを判別する。この場合には、S5の五線認識と
は異なり、求める五線は1本で良いので、処理コストも
低く、かつ検出結果は後段で利用可能である。
【0033】五線の傾きを検出する他の方法として、横
軸方向の黒画素数のヒストグラムから傾きをある程度は
推定可能である。この場合には楽譜画像データから認識
される五線のデータはヒストグラムであり、傾きが全く
無い場合には、ヒストグラムには五線の位置に5本のピ
ークが現れるが、傾きが大きくなるに連れてピーク値が
低くなる。また、五線間の空白部分は傾きが大きくなる
に連れて縮小し、消滅する。従って、ヒストグラムにお
けるピーク値や空白部の長さによって傾きを判定しても
よい。
【0034】
【発明の効果】以上述べたように、本発明は、楽譜認識
装置において、連続する白および黒画素の長さを求め
て、頻度分布データを作成し、該頻度分布データから五
線の線幅および間幅を求め、線幅および間幅のデータか
ら入力された楽譜画像データの解像度あるいは濃度を算
出して出力するとともに、五線の傾きを判別して出力す
るので、簡単な処理で、予め画像の状態が判別できる。
従って、楽譜画像データの解像度や濃度、五線の傾き
が、認識に必要な所定の範囲から外れている場合に、そ
の旨を表示するなどして、利用者に画像データの再取り
込みを行わせることにより、時間のかかる楽譜認識処理
を行った後で、画質のせいで認識率が落ちていたことが
判別するといった無駄を防止でき、結果として処理時間
が短縮され、認識率も向上し、効率良く楽譜認識を行う
事ができるという効果がある。
【図面の簡単な説明】
【図1】本発明の楽譜認識装置の実施例の構成を示すブ
ロック図である。
【図2】画質チェック処理における楽譜画像データの走
査例およびヒストグラムを示す説明図である。
【図3】CPU1のメイン処理を示すフローチャートで
ある。
【図4】S3の画質チェック処理の詳細を示すフローチ
ャートである。
【符号の説明】
1…CPU、2…ROM、3…RAM、4…ハードディ
スク装置、5…フロッピディスク装置、6…CRTディ
スプレイ装置、7…CRTインターフェース回路、8…
キーボード、9…キーボードインターフェース回路、1
0…プリンタ、11…プリンタインターフェース回路、
12…スキャナ、13…スキャナインターフェース回
路、14…MIDIインターフェース回路、15…バス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 日野 鉄夫 静岡県浜松市寺島町200番地 株式会社河 合楽器製作所内 (72)発明者 大場 厚始 静岡県浜松市寺島町200番地 株式会社河 合楽器製作所内 Fターム(参考) 5B064 AA06

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された楽譜画像データから各種記号
    を認識して、演奏情報に変換する楽譜認識装置におい
    て、 楽譜画像データを五線と垂直方向に走査し、連続する白
    および黒画素の長さを求めて、長さ毎の頻度分布データ
    を作成する頻度分布データ作成手段と、 前記頻度分布データ作成手段により作成された頻度分布
    データから五線の線幅および間幅を求める幅検出手段
    と、 前記幅検出手段により求められた線幅および間幅のデー
    タから、入力された楽譜画像データの解像度および濃度
    の少なくとも一方を算出して出力するとともに、楽譜画
    像データから五線認識を行い、認識された五線のデータ
    から五線の傾きを判別して出力する画質チェック手段と
    を備えたことを特徴とする楽譜認識装置。
  2. 【請求項2】 更に、画質チェック手段の出力を表示す
    る表示手段を備えたことを特徴とする請求項1の楽譜認
    識装置。
  3. 【請求項3】 更に、画質チェック手段の出力に基づ
    き、スキャナから適切な画質で画像データが入力される
    ように、スキャナを制御する制御手段を備えたことを特
    徴とする請求項1または2の楽譜認識装置。
JP2003009571A 2003-01-17 2003-01-17 楽譜認識装置 Expired - Fee Related JP3709991B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003009571A JP3709991B2 (ja) 2003-01-17 2003-01-17 楽譜認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003009571A JP3709991B2 (ja) 2003-01-17 2003-01-17 楽譜認識装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP27513395A Division JP3613356B2 (ja) 1995-09-29 1995-09-29 楽譜認識装置

Publications (2)

Publication Number Publication Date
JP2003187186A true JP2003187186A (ja) 2003-07-04
JP3709991B2 JP3709991B2 (ja) 2005-10-26

Family

ID=27606934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003009571A Expired - Fee Related JP3709991B2 (ja) 2003-01-17 2003-01-17 楽譜認識装置

Country Status (1)

Country Link
JP (1) JP3709991B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009103023A2 (en) * 2008-02-13 2009-08-20 Museami, Inc. Music score deconstruction
US7714222B2 (en) 2007-02-14 2010-05-11 Museami, Inc. Collaborative music creation
US7884276B2 (en) 2007-02-01 2011-02-08 Museami, Inc. Music transcription

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7884276B2 (en) 2007-02-01 2011-02-08 Museami, Inc. Music transcription
US7982119B2 (en) 2007-02-01 2011-07-19 Museami, Inc. Music transcription
US8471135B2 (en) 2007-02-01 2013-06-25 Museami, Inc. Music transcription
US7714222B2 (en) 2007-02-14 2010-05-11 Museami, Inc. Collaborative music creation
US7838755B2 (en) 2007-02-14 2010-11-23 Museami, Inc. Music-based search engine
US8035020B2 (en) 2007-02-14 2011-10-11 Museami, Inc. Collaborative music creation
WO2009103023A2 (en) * 2008-02-13 2009-08-20 Museami, Inc. Music score deconstruction
WO2009103023A3 (en) * 2008-02-13 2009-10-08 Museami, Inc. Music score deconstruction
US8494257B2 (en) 2008-02-13 2013-07-23 Museami, Inc. Music score deconstruction

Also Published As

Publication number Publication date
JP3709991B2 (ja) 2005-10-26

Similar Documents

Publication Publication Date Title
JP4911340B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
KR20090087384A (ko) 휴대 단말에서 자동반주 악보를 인식하는 방법
EP2569930A2 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
US7847175B2 (en) Musical score recognition device and computer program thereof
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2005266907A (ja) バーコード検出切り出し方法及びその装置、並びにプログラムを格納したコンピュータ読み取り可能な記録媒体
JP2003242438A (ja) 楽譜認識装置
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP2003187186A (ja) 楽譜認識装置
JP3608674B2 (ja) 楽譜認識装置
JP3812836B2 (ja) 楽譜認識装置
JP3445039B2 (ja) 楽譜認識装置
JP3613356B2 (ja) 楽譜認識装置
JP5770445B2 (ja) 楽譜認識装置及びコンピュータプログラム
US6580805B1 (en) Method and recognizing music and computer-readable recording medium having music-recognizing program recorded therein
JP3411736B2 (ja) 楽譜認識装置
JP3812835B2 (ja) 楽譜認識装置
JPH1153539A (ja) 円形パターン判定方法および記録媒体
JP3558834B2 (ja) 楽譜認識方法及び楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JPH11250179A (ja) 文字認識装置および文字認識方法
JP5248074B2 (ja) 楽譜認識装置、楽譜認識方法、及びコンピュータプログラム
JP4218541B2 (ja) 情報埋込み装置および情報検証装置、ならびにその情報検証方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050803

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100819

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110819

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130819

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees