JP2007122277A - 楽譜認識装置および楽譜認識プログラム - Google Patents

楽譜認識装置および楽譜認識プログラム Download PDF

Info

Publication number
JP2007122277A
JP2007122277A JP2005311789A JP2005311789A JP2007122277A JP 2007122277 A JP2007122277 A JP 2007122277A JP 2005311789 A JP2005311789 A JP 2005311789A JP 2005311789 A JP2005311789 A JP 2005311789A JP 2007122277 A JP2007122277 A JP 2007122277A
Authority
JP
Japan
Prior art keywords
lyric
rectangle
character
figures
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005311789A
Other languages
English (en)
Other versions
JP4803797B2 (ja
Inventor
Seiji Nakano
誠至 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawai Musical Instrument Manufacturing Co Ltd
Original Assignee
Kawai Musical Instrument Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawai Musical Instrument Manufacturing Co Ltd filed Critical Kawai Musical Instrument Manufacturing Co Ltd
Priority to JP2005311789A priority Critical patent/JP4803797B2/ja
Publication of JP2007122277A publication Critical patent/JP2007122277A/ja
Application granted granted Critical
Publication of JP4803797B2 publication Critical patent/JP4803797B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

【課題】楽譜に記載される歌詞をより適切に認識すること。
【解決手段】楽曲を表現する楽譜を示す楽譜イメージを外部装置5から収集する楽譜イメージ収集部12と、楽譜イメージを形成する複数図形を複数記号にそれぞれ画像認識する楽譜認識部13と、複数図形のうちの楽譜を形成する楽譜記号に認識されない図形を囲む歌詞矩形を楽譜イメージから抽出する歌詞矩形抽出部14と、複数図形のうちの歌詞矩形に囲まれる歌詞図形を文字に画像認識する歌詞認識部16とを備えている。
【選択図】図1

Description

本発明は、楽譜認識装置および楽譜認識プログラムに関し、特に、楽譜イメージを楽譜に認識する
楽譜認識装置および楽譜認識プログラムに関する。
イメージスキャナで楽譜を取り込み、パソコンで編集、印刷、演奏することができる楽譜認識ソフトウェアが知られている。その楽譜認識ソフトウェアとしては、河合楽器製作所製「スコアメーカー」が例示される。その楽譜認識ソフトウェアは、楽譜に記載される歌詞を認識することもできる。その楽譜認識ソフトウェアは、個々の記号の認識精度を向上させることにより誤認識を低減している。その認識精度を向上させる方法としては、文字列辞書を備え、文字認識した後に文字列をその文字列辞書に逐次照らし合わせることが例示される。楽譜に記載される歌詞は、特に日本語のときに、ほとんど平仮名で表現され、文字の区切りがなく、文節の判定が困難である。このため、その歌詞は、文字列辞書を用いて認識率を向上させることが困難である。さらに、その歌詞は、アルファベットで表現されるときに、様々な言語(たとえば、英語、フランス語、ドイツ語、イタリア語、ラテン語)が考えられ、これらの言語のすべてに対応する文字列辞書を用意することが困難である。楽譜に記載される歌詞をより適切に認識する楽譜認識装置が望まれている。
特許3454307号公報には、任意の2旋律間の類似度判定に際し、人間特有の聴感特性(音を記憶して後続の音と関連づける能力=記憶残響効果)を応用した比較手法を用いることで実感覚に則した結果が得られる合理的かつ多角的な類似度判定を可能にする旋律類似度判定方法が開示されている。その旋律類似度判定方法は、旋律データベースに予め格納された照合旋律と、判定旋律とを比較することにより、前記判定旋律の前記照合旋律に対する類似度を判定する楽曲の旋律類似度判定方法において、前記判定旋律の対象となる楽曲の原譜から音程順列聴感譜と時間分割聴感譜とを作成する第1のステップと、前記音程順列聴感譜に基づく照合により音程順列比較を行い、予め定めた音列一致率を上回る前記照合旋律を比較対象照合旋律として抽出する第2のステップと、前記時間分割聴感譜に基づく照合により前記比較対象照合旋律に対して、音程時間比較に基づく音程時間一致率と発音点比較に基づく発音点一致率とを算出し、これを前記比較対象照合旋律に情報付加する第3のステップと、前記音列一致率、前記音程時間一致率及び前記発音点一致率に基づいて前記判定旋律と前記比較対象照合旋律との間の類似率を算出し、これを前記比較対象照合旋律に情報付加する第4のステップと、前記音列一致率、音程時間一致率、発音点一致率及び比較音数間に現われる一定の傾向を類型別に分類した類型別一致率分布データと前記比較対象照合旋律の前記音列一致率、前記音程時間一致率及び前記発音点一致率とを類型照合し、照合結果を類似パターンとして前記比較対象照合旋律に情報付加する第5のステップと、前記比較対象照合旋律に対して、前記音列一致率、前記音程時間一致率、前記発音点一致率、前記類似率及び前記類似パターンを判定要素として判定処理を行い、判定結果を判定評価データとして前記比較対象照合旋律に付加し、評価対象照合旋律として抽出する第6のステップとを備え、前記判定評価データに基づき前記判定旋律と前記照合旋律との間の類似度を判定することを特徴としている。
特許3466894号公報には、楽譜上の混在する斜体文字、標準文字からなる音楽記号について文字単位の字体判別処理を行う構成を提供し、それによって、これらの字体の混在する音楽記号に対し高い認識率が得られるようにせんとする楽譜認識方法が開示されている。その楽譜認識方法は、楽譜イメージを読み取ってその音楽記号を認識し、演奏や楽譜表示のためのデータを作成する楽譜認識方法において、認識すべき音楽記号のうち、文字記号或いは文字を含む記号に対し、そのラベルを抽出してパターンマッチングにより認識を行い、その後該ラベル上のこれらの記号の推定回帰直線の傾きを検出し、その傾きの違いにより、前記記号の字体が斜体であるか否かを判別することを特徴としている。
特許3454307号公報 特許3466894号公報
本発明の課題は、楽譜に記載される歌詞をより適切に認識する楽譜認識装置および楽譜認識プログラムを提供することにある。
本発明の他の課題は、印刷物を光学的に読み取る処理の精度を変更させること無く楽譜に記載される歌詞をより適切に認識する楽譜認識装置および楽譜認識プログラムを提供することにある。
以下に、発明を実施するための最良の形態・実施例で使用される符号を括弧付きで用いて、課題を解決するための手段を記載する。この符号は、特許請求の範囲の記載と発明を実施するための最良の形態・実施例の記載との対応を明らかにするために付加されたものであり、特許請求の範囲に記載されている発明の技術的範囲の解釈に用いてはならない。
本発明による楽譜認識装置(1)は、楽曲を表現する楽譜を示す楽譜イメージを外部装置(5)から収集する楽譜イメージ収集部(12)と、楽譜イメージを形成する複数図形を複数記号にそれぞれ画像認識する楽譜認識部(13)と、複数図形のうちの楽譜を形成する楽譜記号に認識されない図形を囲む歌詞矩形を楽譜イメージから抽出する歌詞矩形抽出部(14)と、複数図形のうちの歌詞矩形に囲まれる歌詞図形を文字に画像認識する歌詞認識部(16)とを備えていることが好ましい。
本発明による楽譜認識装置(1)は、複数種類と複数文字集合とを対応付ける文字種テーブル(21)をさらに備えていることが好ましい。このとき、歌詞認識部(16)は、複数種類のうちから楽譜認識部(13)により歌詞図形が認識された文字を最も多く含んでいる文字集合に対応する種類を検索し、複数文字集合のうちの種類に対応する文字集合に属する文字に優先的に歌詞図形を画像認識する。
本発明による楽譜認識装置(1)は、歌詞図形のうちの譜表に平行な一直線上に並ぶ複数の歌詞番数図形を囲む歌詞番数矩形を歌詞矩形の内部から抽出する歌詞番数矩形抽出部(15)をさらに備えていることが好ましい。このとき、歌詞認識部(16)は、複数図形のうちの歌詞番数矩形に囲まれる図形だけを文字に画像認識する。
歌詞認識部(16)は、歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能であるときに、歌詞番数矩形のうちの第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形のうちの第1図形と横位置が一致する第2図形から認識される文字に第1図形を認識することが好ましい。
歌詞認識部(16)は、歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能である場合で、歌詞番数矩形のうちの第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形が第1図形と横位置が一致する2つ以上の図形を含んでいるときに、その2つ以上の図形の境目の横位置で第1図形を切断した2つ以上の図形をそれぞれ文字に認識することが好ましい。
歌詞番数矩形抽出部(15)は、歌詞番数矩形のうちから所定の条件を満足する無効歌詞番数矩形を選別することが好ましい。このとき、歌詞認識部(16)は、複数図形のうちの無効歌詞番数歌詞矩形に囲まれる図形を文字に認識しない。
その条件は、無効歌詞番数矩形に囲まれる図形のなかに横位置が楽譜記号のうちの音符の横位置に対応しない図形が所定の割合以上あることである。または、その条件は、無効歌詞番数矩形が所定の記号に隣接することである。または、その条件は、無効歌詞番数矩形に囲まれる複数の図形から認識される複数の文字がある1つの種類に属する文字を所定の値以上の割合で含んでいないことである。または、その条件は、無効歌詞番数矩形に囲まれる複数の図形から認識される文字列が所定の文字列を所定の個数以上に含んでいることである。
本発明による楽譜認識プログラムは、コンピュータである楽譜認識装置(1)により実行されるコンピュータプログラムであり、そのコンピュータプログラムの部分として、楽曲を表現する楽譜を示す楽譜イメージを外部装置(5)から収集する楽譜イメージ収集部(12)と、楽譜イメージを形成する複数図形を複数記号にそれぞれ画像認識する楽譜認識部(13)と、複数図形のうちの楽譜を形成する楽譜記号に認識されない図形を囲む歌詞矩形を楽譜イメージから抽出する歌詞矩形抽出部(14)と、複数図形のうちの歌詞矩形に囲まれる歌詞図形を文字に画像認識する歌詞認識部(16)とを備えていることが好ましい。
本発明による楽譜認識プログラムは、複数種類と複数文字集合とを対応付ける文字種テーブル(21)をさらに備えていることが好ましい。このとき、歌詞認識部(16)は、複数種類のうちから楽譜認識部(13)により歌詞図形が認識された文字を最も多く含んでいる文字集合に対応する種類を検索し、複数文字集合のうちの種類に対応する文字集合に属する文字に優先的に歌詞図形を画像認識する。
本発明による楽譜認識プログラムは、歌詞図形のうちの譜表に平行な一直線上に並ぶ複数の歌詞番数図形を囲む歌詞番数矩形を歌詞矩形の内部から抽出する歌詞番数矩形抽出部(15)をさらに備えていることが好ましい。このとき、歌詞認識部(16)は、複数図形のうちの歌詞番数矩形に囲まれる図形だけを文字に画像認識する。
歌詞認識部(16)は、歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能であるときに、歌詞番数矩形のうちの第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形のうちの第1図形と横位置が一致する第2図形から認識される文字に第1図形を認識することが好ましい。
歌詞認識部(16)は、歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能である場合で、歌詞番数矩形のうちの第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形が第1図形と横位置が一致する2つ以上の図形を含んでいるときに、その2つ以上の図形の境目の横位置で第1図形を切断した2つ以上の図形をそれぞれ文字に認識することが好ましい。
歌詞番数矩形抽出部(15)は、歌詞番数矩形のうちから所定の条件を満足する無効歌詞番数矩形を選別することが好ましい。このとき、歌詞認識部(16)は、複数図形のうちの無効歌詞番数歌詞矩形に囲まれる図形を文字に認識しない。
その条件は、無効歌詞番数矩形に囲まれる図形のなかに横位置が楽譜記号のうちの音符の横位置に対応しない図形が所定割合以上あることである。または、その条件は、無効歌詞番数矩形が所定の記号に隣接することである。または、その条件は、無効歌詞番数矩形に囲まれる複数の図形から認識される複数の文字のうちの所定の割合以上の文字が属する種類が存在することである。または、その条件は、無効歌詞番数矩形に囲まれる複数の図形から認識される文字列が所定の文字列を所定の個数以上に含んでいることである。
本発明による楽譜認識装置および楽譜認識プログラムは、楽譜に記載される歌詞をより適切に認識することができる。
図面を参照して、本発明による電子楽器の実施の形態を記載する。その楽譜認識装置1は、図1に示されているように、楽譜認識装置本体2がスキャナ5と出力装置7とを備えている。スキャナ5は、楽曲を表現する楽譜が印刷された印刷物を撮像し、その楽譜の楽譜イメージを生成して楽譜認識装置本体2に出力する。出力装置7としては、ディスプレイ、プリンターが例示される。そのディスプレイは、表示面を備え、楽譜認識装置本体2により生成された画面をその表示面に表示する。そのプリンターは、楽譜認識装置本体2により生成された画面を紙に印刷する。
楽譜認識装置本体2は、コンピュータであり、図示されていないCPUと記憶装置と入力装置とを備えている。そのCPUは、楽譜認識装置本体2にインストールされるコンピュータプログラムを実行して、その記憶装置と入力装置とスキャナ5と出力装置7とを制御する。その記憶装置は、そのコンピュータプログラムを記録し、そのCPUにより生成される情報を一時的に記録する。その入力装置は、ユーザに操作されて入力される情報をそのCPUに出力する。
楽譜認識装置本体2は、そのコンピュータプログラムとして、文字種データベース11と楽譜イメージ収集部12と楽譜認識部13と歌詞矩形抽出部14と歌詞番数矩形抽出部15と歌詞認識部16と楽譜出力部17とがインストールされている。文字種データベース11は、歌詞を表現する文字の種類を示す文字種テーブルを他のコンピュータプログラムにより検索可能に記憶装置に記録する。
楽譜イメージ収集部12は、スキャナ5により生成された楽譜イメージをスキャナ5から収集する。楽譜認識部13は、楽譜イメージ収集部12により収集される楽譜イメージに基づいて楽譜を生成する。すなわち、楽譜認識部13は、楽譜イメージ収集部12により収集される楽譜イメージから複数の図形を抽出し、その複数の図形にそれぞれ図形IDを割り当てる。楽譜認識部13は、さらに、その複数の図形の各々をその複数の記号の各々に比較して、その図形をその複数の記号のうちの最も類似する記号に認識する。その記号は、演奏される楽音を表現する楽譜記号と歌詞を表現する文字とを含んでいる。その楽譜記号としては、譜表、音符、休符、テンポ記号、スラーが例示される。その文字としては、平仮名、片仮名、漢字、アルファベットが例示される。楽譜認識部13は、さらに、文字に認識される複数の図形が隣接して並ぶときに、その複数の図形を文字列に認識する。
歌詞矩形抽出部14は、楽譜認識部13により認識される記号に基づいて、楽譜イメージ収集部12により収集される楽譜イメージから歌詞矩形を抽出する。歌詞番数矩形抽出部15は、楽譜認識部13により認識される記号に基づいて、歌詞矩形抽出部14により抽出される歌詞矩形から歌詞番数矩形を抽出する。歌詞認識部16は、歌詞番数矩形抽出部15により抽出される歌詞番数矩形に囲まれる図形を文字に認識する。
楽譜出力部17は、楽譜認識部13と歌詞認識部16とにより生成される楽譜を出力装置7に出力する。すなわち、その楽譜を示す画面を作成してディスプレイに表示し、プリンターを用いてその楽譜を示す画面を紙に印刷する。
図2は、楽譜イメージ収集部12により収集される楽譜イメージの一部の例を示している。その楽譜イメージは、合唱曲を表現する楽譜を示し、譜表図形31と歌詞図形33−1〜33−2とが記載されている。譜表図形31は、複数の図形から形成され、その複数の図形は、譜表、音符、休符などを示している。歌詞図形33−1〜33−2は、それぞれ、複数の文字図形から形成されている。その複数の文字図形は、歌詞を示す文字を示している。その複数の文字図形は、その譜表の上または下にその譜表に平行な直線上に並んでいる。その複数の文字図形は、その合唱曲が複数の番数を有するときに、複数行で記載され、すなわち、その譜表に平行である複数の平行線の上に並んでいる。このとき、楽譜認識部13は、譜表図形31の図形を譜表、音符、休符などに認識し、歌詞図形33−1〜33−2の文字図形を文字に認識する。
図2は、さらに、歌詞矩形抽出部14により抽出される歌詞矩形を示している。その歌詞矩形34−1〜34−2は、その譜表に平行である辺とその譜表に垂直である辺とから形成される矩形であり、楽譜認識部13により譜表、音符、休符などに認識される図形を囲まないで、楽譜認識部13により文字に認識される図形を囲んでいる。歌詞矩形34−1〜34−2は、さらに、その譜表と長さが概ね同じであり、右端の横位置がその譜表の右端の横位置に概ね一致し、左端の横位置がその譜表の左端の横位置に概ね一致している。すなわち、歌詞矩形抽出部14は、楽譜認識部13により譜表、音符、休符などに認識される図形を囲まないで、楽譜認識部13により文字に認識される図形を囲み、その譜表と長さが概ね同じになるように、歌詞矩形34−1〜34−2を形成する。
図3は、楽譜イメージ収集部12により収集される楽譜イメージの一部の他の例を示している。その楽譜イメージは、合唱曲を表現する楽譜を示し、大譜表図形41が記載されている。大譜表図形41は、高音部譜表図形42−1と低音部譜表図形42−2とから形成されている。高音部譜表図形42−1と低音部譜表図形42−2とは、それぞれ、譜表、音符、休符などを示している。その楽譜イメージは、さらに、歌詞図形43−1〜43−2が記載されている。歌詞図形43−1〜43−2は、それぞれ、複数の文字図形から形成されている。その複数の文字図形は、歌詞を示す文字を示している。その複数の文字図形は、その譜表の上または下にその譜表に平行な直線上に並んでいる。このとき、楽譜認識部13は、高音部譜表図形42−1と低音部譜表図形42−2とを譜表、音符、休符などに認識し、歌詞図形43−1〜43−2の文字図形を文字に認識する。
図3は、さらに、歌詞矩形抽出部14により抽出される歌詞矩形を示している。その歌詞矩形44−1〜44−2は、その譜表に平行である辺とその譜表に垂直である辺とから形成される矩形であり、楽譜認識部13により譜表、音符、休符などに認識される図形を囲まないで、歌詞矩形抽出部14は、楽譜認識部13により文字に認識される図形を囲んでいる。歌詞矩形44−1〜44−2は、さらに、その譜表と長さが概ね同じであり、右端の横位置がその譜表の右端の横位置に概ね一致し、左端の横位置がその譜表の左端の横位置に概ね一致している。すなわち、歌詞矩形抽出部14は、楽譜認識部13により譜表、音符、休符などに認識される図形を囲まないで、楽譜認識部13により文字に認識される図形を囲み、その譜表と長さが概ね同じになるように、歌詞矩形44−1〜44−2を形成する。
図4は、楽譜イメージ収集部12により収集される楽譜イメージの一部のさらに他の例を示している。合唱曲を表現する楽譜に記載される歌詞は、一般的に、複数の番数の歌詞で共通する歌詞が歌われるときに1行で記載され、複数の番数の歌詞で異なる歌詞が歌われるときに複数行で記載される。その歌詞は、さらに、複数行で記載されるときに、先頭にその歌番が記載される。その歌詞は、さらに、その複数の番数で共通して歌われる1行の歌詞と複数の番数で異なって歌われる複数行の歌詞とが1つの段落で記載されるときに、1行の歌詞と複数行の歌詞とのその境目に括弧が記載される。その歌詞を表現する複数の文字は、それぞれ、その譜表に記載される音符の真下に記載され、横位置がその音符の横位置に概ね一致している。
このため、その楽譜イメージは、譜表図形51と音符図形58−1〜58−8と歌詞図形52とが記載されている。譜表図形51は、譜表を示している。音符図形58−1〜58−8は、それぞれその譜表に記載される複数の音符を示している。歌詞図形52は、それぞれ、複数の文字図形57−1〜57−17を含んでいる。その複数の文字図形は、歌詞を示す文字を示している。文字図形57−1〜57−17は、その譜表の上または下にその譜表に平行な直線上に並んでいる。文字図形57−1〜57−17は、その合唱曲が複数の番数を有するときに、複数行で記載され、すなわち、その譜表に平行である複数の平行線の上に並んでいる。歌詞図形52は、さらに、括弧を示す括弧図形54を含んでいる。
文字図形57−1〜57−17は、それぞれ、横位置が音符図形58−1〜58−8のいずれかの横位置に概ね一致している。すなわち、文字図形57−1の横位置は、音符図形58−1の横位置に概ね一致している。文字図形57−2の横位置は、音符図形58−2の横位置に概ね一致している。文字図形57−3の横位置は、音符図形58−3の横位置に概ね一致している。文字図形57−4の横位置は、音符図形58−4の横位置に概ね一致している。文字図形57−6の横位置は、音符図形58−5の横位置に概ね一致している。文字図形57−7の横位置は、音符図形58−6の横位置に概ね一致している。文字図形57−8の横位置は、音符図形58−7の横位置に概ね一致している。文字図形57−9の横位置は、音符図形58−8の横位置に概ね一致している。文字図形57−11の横位置は、音符図形58−5の横位置に概ね一致している。文字図形57−12の横位置は、音符図形58−6の横位置に概ね一致している。文字図形57−13の横位置は、音符図形58−7の横位置に概ね一致している。文字図形57−14の横位置は、音符図形58−8の横位置に概ね一致している。
このとき、楽譜認識部13は、譜表図形51の図形を譜表、音符、休符などに認識し、文字図形57−1〜57−17を文字に認識する。楽譜認識部13は、さらに、音符図形58−1〜58−8を音符に認識し、括弧図形54を括弧に認識する。
図4は、さらに、歌詞矩形抽出部14により抽出される歌詞矩形を示している。その歌詞矩形53は、その譜表に平行である辺とその譜表に垂直である辺とから形成される矩形であり、楽譜認識部13により譜表、音符、休符、スラーなどに認識される図形を囲まないで、歌詞矩形抽出部14は、楽譜認識部13により文字に認識される図形を囲んでいる。歌詞矩形53は、さらに、その譜表と長さが概ね同じであり、右端の横位置がその譜表の右端の横位置に概ね一致し、左端の横位置がその譜表の左端の横位置に概ね一致している。すなわち、歌詞矩形抽出部14は、楽譜認識部13により譜表、音符、休符などに認識される図形を囲まないで、楽譜認識部13により文字に認識される図形を囲み、その譜表と長さが概ね同じになるように、歌詞矩形53を形成する。
歌詞矩形53は、括弧図形54を境に複数の分割歌詞矩形55−1〜55−2とに左右に分割されている。図4は、さらに、歌詞番数矩形抽出部15により抽出される歌詞番数矩形を示している。その歌詞番数矩形56−1〜56−3は、それぞれ、分割歌詞矩形55−1〜55−2のいずれかに囲まれ、その譜表に平行である辺とその譜表に垂直である辺とから形成される矩形である。歌詞番数矩形56−1〜56−3は、さらに、それぞれ、分割歌詞矩形55−1〜55−2と長さが概ね同じであり、右端の横位置が分割歌詞矩形55−1〜55−2の右端の横位置に概ね一致し、左端の横位置が分割歌詞矩形55−1〜55−2の左端の横位置に概ね一致している。歌詞番数矩形56−1〜56−3は、さらに、それぞれ、楽譜認識部13により文字に認識される図形を囲んでいる。歌詞番数矩形56−1〜56−3にそれぞれ囲まれる図形は、複数行に並ばないで、その譜表に平行な1つの直線上に並んでいる。
すなわち、歌詞番数矩形抽出部15は、楽譜認識部13により括弧に認識される括弧図形54で歌詞矩形抽出部14により抽出される歌詞矩形53を分割歌詞矩形55−1〜55−2に分割する。歌詞番数矩形抽出部15は、さらに、分割歌詞矩形55−1〜55−2のいずれかに囲まれ、かつ、1つの直線上に並ぶ文字図形を囲むように、歌詞番数矩形56−1〜56−3を形成する。歌詞番数矩形抽出部15は、さらに、歌詞番数矩形が所定の記号に認識され図形の近傍に配置されるときに、その歌詞番数矩形を削除する。その所定の記号としては、テンポ記号が例示される。歌詞番数矩形抽出部15は、さらに、歌詞番数矩形に囲まれる文字図形から認識される文字が特定の文字を所定の個数以上に含むときに、その歌詞番数矩形を削除する。その特定の文字として、「作」「編」「曲」「詞」「詩」著作権を示す丸で囲まれたアルファベット「C」が例示される。その所定の個数としては、1個が例示される。歌詞番数矩形抽出部15は、さらに、歌詞番数矩形に囲まれる文字図形から認識される文字列が特定の文字列を所定の個数以上に含むときに、その歌詞番数矩形を削除する。その特定の文字列として、「arranged」「copyright」が例示される。その所定の個数としては、1個が例示される。歌詞番数矩形抽出部15は、さらに、文字種テーブル21を参照して、歌詞番数矩形に囲まれる文字図形から認識される複数の文字がある1つの種類に属する文字を所定の値以上の割合で含んでいないときに、その歌詞番数矩形を削除する。歌詞番数矩形抽出部15は、さらに、歌詞番数矩形に囲まれる文字図形から認識される複数の文字が漢字を所定の値以上の割合で含んでいるときに、その歌詞番数矩形を削除する。このとき、歌詞番数矩形抽出部15は、歌詞番数矩形に囲まれる図形のうちの文字に認識されない図形の空隙の個数を計数し、その個数が所定の値以上の図形を漢字として計数する。歌詞番数矩形抽出部15は、さらに、歌詞番数矩形に囲まれる複数の文字図形が音符図形と横位置がそれぞれ一致しないときに、その歌詞番数矩形を削除する。
図5は、文字種データベース11により記録される文字種テーブルを示している。その文字種テーブル21は、種類22と文字集合23と範囲24と修正方法25とを対応付けている。種類22は、歌詞を表現する文字の種類を示している。その種類としては、平仮名、片仮名、アルファベット、記号が付加されるアルファベット、合字、斜体のアルファベットが例示される。そのアルファベットに付加される記号としては、ウムラウト、アクサン、セディーユが例示される。文字集合23は、種類22により示される種類に属する複数の文字を示している。
範囲24は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形から認識される文字に文字集合23により示される文字が含まれる割合がとり得る範囲を示している。修正方法25は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形から認識される文字に文字集合23により示される文字が含まれる割合が範囲24により示される範囲に含まれるときに、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形のうちの文字集合23により示される文字以外に認識される図形から認識される文字を他の文字に変更する修正方法を示している。
たとえば、その修正方法は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形がアルファベットに認識される割合が80%以上であるときに、アルファベット以外の文字をアルファベットに変更することを示している。その修正方法は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形が平仮名(片仮名)に認識される割合が90%以上であるときに、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形から認識された文字を変更しないことを示している。その修正方法は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形が平仮名(片仮名)に認識される割合が60%以下である場合で、アルファベットに1文字の平仮名(片仮名)が挟まれているときにその1文字の平仮名(片仮名)をアルファベットに変更し、平仮名(片仮名)に1〜2文字のアルファベットが挟まれているときにその1文字のアルファベットをアルファベットに変更することを示している。その修正方法は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形が平仮名に認識される割合が多く、かつ、片仮名に認識された図形の両隣の図形が平仮名に認識されるときにその片仮名に認識された図形を平仮名に変更することを示している。その修正方法は、歌詞番数矩形抽出部15により抽出される複数の歌詞番数矩形に囲まれる図形が片仮名に認識される割合が多く、かつ、平仮名に認識された図形の両隣の図形が片仮名に認識されるときにその平仮名に認識された図形を片仮名に変更することを示している。
このとき、歌詞認識部16は、文字種テーブル21を参照して、文字集合23のうちから楽譜認識部13により認識された文字を最も多く属する文字集合を検索し、種類22のうちからその検索された文字集合に対応する種類を検索する。歌詞認識部16は、さらに、文字種テーブル21を参照して、歌詞番数矩形抽出部15により抽出される歌詞番数矩形に囲まれる図形から認識される文字に文字集合23により示される文字が含まれる割合が範囲24により示される範囲に含まれるときに、その文字集合23と範囲24とに対応する修正方法を用いてその文字集合23により示される文字以外の文字を他の文字に変更することによりその文字集合に属する文字に優先的に認識する。
たとえば、歌詞認識部16は、歌詞番数矩形に囲まれる図形がアルファベットに認識される割合が80%以上であるときに、アルファベット以外の文字に認識された図形をアルファベットに再認識する。歌詞認識部16は、歌詞番数矩形に囲まれる図形が平仮名(片仮名)に認識される割合が90%以上であるときに、その歌詞番数矩形に囲まれる図形から認識された文字を再認識しない。歌詞認識部16は、平仮名(片仮名)に認識される割合が60%以下である場合で、アルファベットに1文字の平仮名(片仮名)が挟まれているときにその1文字の平仮名(片仮名)に認識された図形をアルファベットに再認識し、平仮名(片仮名)に1〜2文字のアルファベットが挟まれているときにその1文字のアルファベットに認識された図形をアルファベットに再認識する。次いで、歌詞認識部16は、楽譜認識部13により認識された文字に平仮名が多く、かつ、片仮名に認識された図形の両隣の図形が平仮名に認識されるときに、その片仮名に認識された図形を平仮名に再認識する。たとえば、歌詞認識部16は、片仮名の「ヘ」に認識された図形を平仮名の「へ」に変更し、片仮名の「ヒ」に認識された図形を平仮名の「と」に変更し、片仮名の「リ」に認識された図形を平仮名の「り」に変更する。
歌詞認識部16は、その1つの歌詞番数矩形に囲まれる複数の図形のサイズをそれぞれ測定する。歌詞認識部16は、そのサイズに基づいて、平仮名または片仮名の拗音または促音に用いられる小さい文字を認識し、または、アルファベットの大文字と小文字とを判別する。歌詞認識部16は、歌詞番数矩形56−1〜56−3の1つに囲まれる複数の図形のうちに楽譜認識部13により文字に認識されない図形があるときにも、その1つの歌詞番数矩形に囲まれる複数の図形のサイズをそれぞれ測定する。歌詞認識部16は、その認識されない図形のサイズがその認識される図形のサイズの2倍以上である場合で、その1つの歌詞番数矩形が上下方向に他の歌詞番数矩形に隣接するときに、他の歌詞番数矩形に囲まれる図形のうちのその認識されない図形の横位置に一致する複数の図形の境目でその認識されない図形を分割し、その分割された図形を文字に認識する。歌詞認識部16は、その認識されない図形のサイズがその認識される図形のサイズの2倍以上である場合で、その1つの歌詞番数矩形が上下方向に他の歌詞番数矩形に隣接しないときに、その認識されない図形を接触部分が最も少ない接触位置(切断位置)で切断し、その切断された図形を文字に認識する。
歌詞認識部16は、上下に並ぶ複数の歌詞番数矩形に囲まれる複数の図形を文字に認識するときに、その歌詞番数矩形の左端に配置される図形を数字に優先的に認識する。たとえば、歌詞認識部16は、その歌詞番数矩形の左端の図形が楽譜認識部13によりアルファベットの「l」に認識されたときに、その図形を数字の「1」に変更する。
歌詞認識部16は、上下に並ぶ複数の歌詞番数矩形に囲まれる複数の図形を文字に認識する場合で、複数の歌詞番数矩形の1つに囲まれる1つの図形が文字に認識されないときに、その複数の歌詞番数矩形に囲まれる図形からそれぞれ認識される複数の文字列を比較する。歌詞認識部16は、その複数の文字列が所定の割合以上に一致しているときに、その認識されない図形を他の歌詞番数矩形に囲まれて横位置が同じ図形から認識される文字に認識する。このとき、歌詞認識部16は、その認識されない図形が歌詞番数矩形の左端に配置されている場合で、他の歌詞番数矩形の左端の図形が数字に認識されているときに、その認識されない図形をその数字に認識しない。
歌詞認識部16は、図形を平仮名または片仮名の文字に認識するときに、その図形のうちのその文字の濁点または半濁点が付く位置に対応する部位の複雑度を測定する。このような複雑度の測定は、周知であり、たとえば、ある領域に記載される図形の輪郭の存在頻度などに基づいて測定することができる。歌詞認識部16は、その複雑度が所定の値以上であるときに、その部位に空隙の有無を判別する。歌詞認識部16は、その空隙がないときにその文字に濁点を付け、その空隙があるときにその文字に半濁点を付ける。
図6は、楽譜認識装置1の動作を示している。ユーザは、スキャナ5を用いて楽譜が印刷された印刷物を撮像する。楽譜認識装置1は、その楽譜の楽譜イメージをスキャナ5から収集する(ステップS1)。楽譜認識装置1は、その楽譜イメージを楽譜に認識する(ステップS2)。すなわち、楽譜認識装置1は、その楽譜イメージから複数の図形を抽出し、その複数の図形にそれぞれ図形IDを割り当てる。楽譜認識装置1は、さらに、その複数の図形の各々をその複数の記号の各々に比較して、その図形をその複数の記号のうちの最も類似する記号に認識する。その記号は、演奏される楽音を表現する楽譜記号と歌詞を表現する文字とを含んでいる。その楽譜記号としては、譜表、音符、休符、テンポ記号、スラーが例示される。その文字としては、平仮名、片仮名、漢字、アルファベットが例示される。楽譜認識装置1は、さらに、文字に認識される複数の図形が隣接して並ぶときに、その複数の図形を文字列に認識する。
楽譜認識装置1は、その認識される記号に基づいて、その楽譜イメージから歌詞矩形を抽出する(ステップS3)。すなわち、楽譜認識装置1は、譜表、音符、休符などに認識される図形を囲まないで、文字に認識される図形を囲み、その譜表と長さが概ね同じになるように、歌詞矩形を形成する。
楽譜認識装置1は、括弧に認識される図形でその歌詞矩形を複数の分割歌詞矩形に分割する。楽譜認識装置1は、さらに、その分割歌詞矩形のいずれかに囲まれ、かつ、1つの直線上に並ぶ文字図形を囲むように、歌詞番数矩形を形成する(ステップS4)。このとき、楽譜認識装置1は、歌詞番数矩形が所定の記号に認識され図形の近傍に配置されるときに、その歌詞番数矩形を削除する。その所定の記号としては、テンポ記号が例示される。楽譜認識装置1は、さらに、歌詞番数矩形に囲まれる文字図形から認識される文字が特定の文字を所定の個数以上に含むときに、その歌詞番数矩形を削除する。その特定の文字として、「作」「編」「曲」「詞」「詩」著作権を示す丸で囲まれたアルファベット「C」が例示される。楽譜認識装置1は、さらに、歌詞番数矩形に囲まれる文字図形から認識される文字列が特定の文字列を所定の個数以上に含むときに、その歌詞番数矩形を削除する。楽譜認識装置1は、さらに、文字種テーブル21を参照して、歌詞番数矩形に囲まれる文字図形から認識される複数の文字がある1つの種類に属する文字を所定の値以上の割合で含んでいないときに、その歌詞番数矩形を削除する。楽譜認識装置1は、さらに、歌詞番数矩形に囲まれる文字図形から認識される複数の文字が漢字を所定の値以上の割合で含んでいるときに、その歌詞番数矩形を削除する。このとき、楽譜認識装置1は、歌詞番数矩形に囲まれる図形のうちの文字に認識されない図形の空隙の個数を計数し、その個数が所定の値以上の図形を漢字として計数する。楽譜認識装置1は、さらに、歌詞番数矩形に囲まれる複数の文字図形のなかに音符図形と横位置がそれぞれ一致しない図形が所定割合以上にあるときに、その歌詞番数矩形を削除する。
楽譜認識装置1は、その歌詞番数矩形に囲まれる図形を文字に認識する(ステップS5)。すなわち、楽譜認識装置1は、文字種テーブル21を参照して、文字集合23のうちからその認識された文字を最も多く属する文字集合を検索する。楽譜認識装置1は、さらに、文字種テーブル21を参照して、その歌詞番数矩形に囲まれる図形から認識される文字に文字集合23により示される文字が含まれる割合が範囲24により示される範囲に含まれるときに、その文字集合23と範囲24とに対応する修正方法を用いてその文字集合23により示される文字以外の文字を他の文字に変更することによりその文字集合に属する文字に優先的に認識する。たとえば、楽譜認識装置1は、その認識された文字に平仮名が多く、かつ、片仮名に認識された図形の両隣の図形が平仮名に認識されるときに、その片仮名に認識された図形を平仮名に変更して認識する。たとえば、楽譜認識装置1は、片仮名の「ヘ」に認識された図形を平仮名の「へ」に認識し、片仮名の「ヒ」に認識された図形を平仮名の「と」に認識し、片仮名の「リ」に認識された図形を平仮名の「り」に認識する。
楽譜認識装置1は、その1つの歌詞番数矩形に囲まれる複数の図形のサイズをそれぞれ測定する。楽譜認識装置1は、そのサイズに基づいて、平仮名または片仮名の拗音または促音に用いられる小さい文字を認識し、または、アルファベットの大文字と小文字とを判別する。楽譜認識装置1は、その認識されない図形のサイズがその認識される図形のサイズの2倍以上である場合で、その1つの歌詞番数矩形が上下方向に他の歌詞番数矩形に隣接するときに、他の歌詞番数矩形に囲まれる図形のうちのその認識されない図形の横位置に一致する複数の図形の境目でその認識されない図形を分割し、その分割された図形を文字に認識する。楽譜認識装置1は、その認識されない図形のサイズがその認識される図形のサイズの2倍以上である場合で、その1つの歌詞番数矩形が上下方向に他の歌詞番数矩形に隣接しないときに、その認識されない図形を接触部分が最も少ない接触位置(切断位置)で切断し、その切断された図形を文字に認識する。
楽譜認識装置1は、上下に並ぶ複数の歌詞番数矩形に囲まれる複数の図形を文字に認識するときに、その歌詞番数矩形の左端に配置される図形を数字に優先的に認識する。たとえば、楽譜認識装置1は、その歌詞番数矩形の左端の図形がアルファベットの「l」に認識されたときに、その図形を数字の「1」に変更する。
楽譜認識装置1は、上下に並ぶ複数の歌詞番数矩形に囲まれる複数の図形を文字に認識する場合で、複数の歌詞番数矩形の1つに囲まれる1つの図形が文字に認識されないときに、その複数の歌詞番数矩形に囲まれる図形からそれぞれ認識される複数の文字列を比較する。楽譜認識装置1は、その複数の文字列が所定の割合以上に一致しているときに、その認識されない図形を他の歌詞番数矩形に囲まれて横位置が同じ図形から認識される文字に認識する。このとき、楽譜認識装置1は、その認識されない図形が歌詞番数矩形の左端に配置されている場合で、他の歌詞番数矩形の左端の図形が数字に認識されているときに、その認識されない図形をその数字に認識しない。
楽譜認識装置1は、図形を平仮名または片仮名の文字に認識するときに、その図形のうちのその文字の濁点または半濁点が付く位置に対応する部位の複雑度を測定する。楽譜認識装置1は、その複雑度が所定の値以上であるときに、その部位に空隙の有無を判別する。楽譜認識装置1は、その空隙がないときにその文字に濁点を付け、その空隙があるときにその文字に半濁点を付ける。
このような動作によれば、楽譜認識装置1は、印刷物を光学的に読み取る処理の精度を変更させること無く、その楽譜に記載される歌詞をより適切に認識することができる。このような動作によれば、さらに、楽譜認識装置1は、文字列辞書を用いること無く、その歌詞をより適切に認識することができる。
図1は、本発明による楽譜認識装置の実施の形態を示すブロック図である。 図2は、歌詞矩形の一例を示す図である。 図3は、歌詞矩形の他の例を示す図である。 図4は、歌詞番数矩形の一例を示す図である。 図5は、文字種テーブルを示す図である。 図6は、本発明による楽譜認識装置の動作を示すフローチャートである。
符号の説明
1 :楽譜認識装置
5 :スキャナ
7 :出力装置
11:文字種データベース
12:楽譜イメージ収集部
13:楽譜認識部
14:歌詞矩形抽出部
15:歌詞番数矩形抽出部
16:歌詞認識部
17:楽譜出力部
21:文字種テーブル
22:種類
23:文字集合
24:範囲
23:修正方法
31:譜表図形
33−1〜33−2:歌詞図形
34−1〜34−2:歌詞矩形
41:大譜表図形
42−1:高音部譜表図形
42−2:低音部譜表図形
43−1〜43−2:歌詞図形
44−1〜44−2:歌詞矩形
51:譜表図形
52:歌詞図形
53:歌詞矩形
54:括弧図形
55−1〜55−2:分割歌詞矩形
56−1〜56−3:歌詞番数矩形
57−1〜57−17:文字図形
58−1〜58−8:音符図形

Claims (20)

  1. 楽曲を表現する楽譜を示す楽譜イメージを外部装置から収集する楽譜イメージ収集部と、
    前記楽譜イメージを形成する複数図形を複数記号にそれぞれ画像認識する楽譜認識部と、
    前記複数図形のうちの前記楽譜を形成する楽譜記号に認識されない図形を囲む歌詞矩形を前記楽譜イメージから抽出する歌詞矩形抽出部と、
    前記複数図形のうちの前記歌詞矩形に囲まれる歌詞図形を文字に画像認識する歌詞認識部
    とを具備する楽譜認識装置。
  2. 請求項1において、
    複数種類と複数文字集合とを対応付ける文字種テーブルを更に具備し、
    前記歌詞認識部は、前記複数種類のうちから前記楽譜認識部により前記歌詞図形が認識された文字を最も多く含む文字集合に対応する種類を検索し、前記複数文字集合のうちの前記種類に対応する文字集合に属する文字に優先的に前記歌詞図形を画像認識する
    楽譜認識装置。
  3. 請求項1または請求項2のいずれかにおいて、
    前記歌詞図形のうちの一直線上に並ぶ複数の歌詞番数図形を囲む歌詞番数矩形を前記歌詞矩形の内部から抽出する歌詞番数矩形抽出部を更に具備し、
    前記歌詞認識部は、前記複数図形のうちの前記歌詞番数矩形に囲まれる図形だけを文字に画像認識する
    楽譜認識装置。
  4. 請求項3において、
    前記歌詞認識部は、前記歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能であるときに、前記歌詞番数矩形のうちの前記第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形のうちの前記第1図形と横位置が一致する第2図形から認識される文字に前記第1図形を認識する
    楽譜認識装置。
  5. 請求項3において、
    前記歌詞認識部は、前記歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能である場合で、前記歌詞番数矩形のうちの前記第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形が前記第1図形と横位置が一致する2つ以上の図形を含むときに、前記2つ以上の図形の境目の横位置で前記第1図形を切断した2つ以上の図形をそれぞれ文字に認識する
    楽譜認識装置。
  6. 請求項3において、
    前記歌詞番数矩形抽出部は、前記歌詞番数矩形のうちから所定の条件を満足する無効歌詞番数矩形を選別し、
    前記歌詞認識部は、前記複数図形のうちの前記無効歌詞番数歌詞矩形に囲まれる図形を文字に認識しない
    楽譜認識装置。
  7. 請求項6において、
    前記条件は、前記無効歌詞番数矩形に囲まれる図形のなかに横位置が前記楽譜記号のうちの音符の横位置に対応しない図形が所定割合以上あることである
    楽譜認識装置。
  8. 請求項6において、
    前記条件は、前記無効歌詞番数矩形が所定の記号に隣接することである
    楽譜認識装置。
  9. 請求項6において、
    前記条件は、前記無効歌詞番数矩形に囲まれる複数の図形から認識される複数の文字がある1つの種類に属する文字を所定の値以上の割合で含んでいないことである
    楽譜認識装置。
  10. 請求項6において、
    前記条件は、前記無効歌詞番数矩形に囲まれる複数の図形から認識される文字列が所定の文字列を所定の個数以上に含むことである
    楽譜認識装置。
  11. 楽曲を表現する楽譜を示す楽譜イメージを外部装置から収集する楽譜イメージ収集部と、
    前記楽譜イメージを形成する複数図形を複数記号にそれぞれ画像認識する楽譜認識部と、
    前記複数図形のうちの前記楽譜を形成する楽譜記号に認識されない図形を囲む歌詞矩形を前記楽譜イメージから抽出する歌詞矩形抽出部と、
    前記複数図形のうちの前記歌詞矩形に囲まれる歌詞図形を文字に画像認識する歌詞認識部
    とを具備する楽譜認識プログラム。
  12. 請求項11において、
    複数種類と複数文字集合とを対応付ける文字種テーブルを更に具備し、
    前記歌詞認識部は、前記複数種類のうちから前記楽譜認識部により前記歌詞図形が認識された文字を最も多く含む文字集合に対応する種類を検索し、前記複数文字集合のうちの前記種類に対応する文字集合に属する文字に優先的に前記歌詞図形を画像認識する
    楽譜認識プログラム。
  13. 請求項11または請求項12のいずれかにおいて、
    前記歌詞図形のうちの一直線上に並ぶ複数の歌詞番数図形を囲む歌詞番数矩形を前記歌詞矩形の内部から抽出する歌詞番数矩形抽出部を更に具備し、
    前記歌詞認識部は、前記複数図形のうちの前記歌詞番数矩形に囲まれる図形だけを文字に画像認識する
    楽譜認識プログラム。
  14. 請求項13において、
    前記歌詞認識部は、前記歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能であるときに、前記歌詞番数矩形のうちの前記第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形のうちの前記第1図形と横位置が一致する第2図形から認識される文字に前記第1図形を認識する
    楽譜認識プログラム。
  15. 請求項13において、
    前記歌詞認識部は、前記歌詞番数矩形のうちの第1歌詞番数矩形に囲まれる第1図形を文字に認識不可能である場合で、前記歌詞番数矩形のうちの前記第1歌詞番数矩形に隣接する第2歌詞番数矩形に囲まれる図形が前記第1図形と横位置が一致する2つ以上の図形を含むときに、前記2つ以上の図形の境目の横位置で前記第1図形を切断した2つ以上の図形をそれぞれ文字に認識する
    楽譜認識プログラム。
  16. 請求項13において、
    前記歌詞番数矩形抽出部は、前記歌詞番数矩形のうちから所定の条件を満足する無効歌詞番数矩形を選別し、
    前記歌詞認識部は、前記複数図形のうちの前記無効歌詞番数歌詞矩形に囲まれる図形を文字に認識しない
    楽譜認識プログラム。
  17. 請求項16において、
    前記条件は、前記無効歌詞番数矩形に囲まれる図形のなかに横位置が前記楽譜記号のうちの音符の横位置に対応しない図形が所定割合以上あることである
    楽譜認識プログラム。
  18. 請求項16において、
    前記条件は、前記無効歌詞番数矩形が所定の記号に隣接することである
    楽譜認識プログラム。
  19. 請求項16において、
    前記条件は、前記無効歌詞番数矩形に囲まれる複数の図形から認識される複数の文字がある1つの種類に属する文字を所定の値以上の割合で含んでいないことである
    楽譜認識プログラム。
  20. 請求項16において、
    前記条件は、前記無効歌詞番数矩形に囲まれる複数の図形から認識される文字列が所定の文字列を所定の個数以上に含むことである
    楽譜認識プログラム。
JP2005311789A 2005-10-26 2005-10-26 楽譜認識装置および楽譜認識プログラム Active JP4803797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005311789A JP4803797B2 (ja) 2005-10-26 2005-10-26 楽譜認識装置および楽譜認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005311789A JP4803797B2 (ja) 2005-10-26 2005-10-26 楽譜認識装置および楽譜認識プログラム

Publications (2)

Publication Number Publication Date
JP2007122277A true JP2007122277A (ja) 2007-05-17
JP4803797B2 JP4803797B2 (ja) 2011-10-26

Family

ID=38146078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005311789A Active JP4803797B2 (ja) 2005-10-26 2005-10-26 楽譜認識装置および楽譜認識プログラム

Country Status (1)

Country Link
JP (1) JP4803797B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090202106A1 (en) * 2008-02-12 2009-08-13 Tae-Hwa Hong Method for recognizing music score image with automatic accompaniment in mobile device
JP2013225016A (ja) * 2012-04-20 2013-10-31 Tokyo Metropolitan Univ 演奏システム及びプログラム
CN106446952A (zh) * 2016-09-28 2017-02-22 北京邮电大学 一种乐谱图像识别方法及装置
KR101793184B1 (ko) * 2016-06-29 2017-11-03 전남대학교산학협력단 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법
WO2019049293A1 (ja) * 2017-09-07 2019-03-14 ヤマハ株式会社 コード情報抽出装置、コード情報抽出方法およびコード情報抽出プログラム
KR20200010927A (ko) * 2018-07-23 2020-01-31 정희정 배리어프리 오페라 제작시스템 및 방법
CN111104869A (zh) * 2019-11-26 2020-05-05 杭州电子科技大学 一种可识别小字符内容的工尺谱数字化方法
CN111274891A (zh) * 2020-01-14 2020-06-12 成都嗨翻屋科技有限公司 一种面向简谱图像的音高及对应歌词提取方法及系统
US11315532B2 (en) 2017-09-07 2022-04-26 Yamaha Corporation Chord information extraction device, chord information extraction method and non-transitory computer readable medium storing chord information extraction program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07295988A (ja) * 1994-04-21 1995-11-10 N T T Data Tsushin Kk 単語訂正方式
JPH11161738A (ja) * 1997-11-25 1999-06-18 Kawai Musical Instr Mfg Co Ltd 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003242438A (ja) * 2003-02-06 2003-08-29 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07295988A (ja) * 1994-04-21 1995-11-10 N T T Data Tsushin Kk 単語訂正方式
JPH11161738A (ja) * 1997-11-25 1999-06-18 Kawai Musical Instr Mfg Co Ltd 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003242438A (ja) * 2003-02-06 2003-08-29 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8442325B2 (en) * 2008-02-12 2013-05-14 Samsung Electronics Co., Ltd. Method for recognizing music score image with automatic accompaniment in mobile device
US20090202106A1 (en) * 2008-02-12 2009-08-13 Tae-Hwa Hong Method for recognizing music score image with automatic accompaniment in mobile device
JP2013225016A (ja) * 2012-04-20 2013-10-31 Tokyo Metropolitan Univ 演奏システム及びプログラム
KR101793184B1 (ko) * 2016-06-29 2017-11-03 전남대학교산학협력단 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법
CN106446952B (zh) * 2016-09-28 2019-08-16 北京邮电大学 一种乐谱图像识别方法及装置
CN106446952A (zh) * 2016-09-28 2017-02-22 北京邮电大学 一种乐谱图像识别方法及装置
WO2019049293A1 (ja) * 2017-09-07 2019-03-14 ヤマハ株式会社 コード情報抽出装置、コード情報抽出方法およびコード情報抽出プログラム
CN111052220A (zh) * 2017-09-07 2020-04-21 雅马哈株式会社 和弦信息提取装置、和弦信息提取方法及和弦信息提取程序
US11308924B2 (en) 2017-09-07 2022-04-19 Yamaha Corporation Chord information extraction device, chord information extraction method and non-transitory computer readable medium storing chord information extraction program
US11315532B2 (en) 2017-09-07 2022-04-26 Yamaha Corporation Chord information extraction device, chord information extraction method and non-transitory computer readable medium storing chord information extraction program
CN111052220B (zh) * 2017-09-07 2023-06-27 雅马哈株式会社 和弦信息提取装置、和弦信息提取方法及存储装置
KR20200010927A (ko) * 2018-07-23 2020-01-31 정희정 배리어프리 오페라 제작시스템 및 방법
KR102096529B1 (ko) * 2018-07-23 2020-05-27 정희정 배리어프리 오페라 제작시스템 및 방법
CN111104869A (zh) * 2019-11-26 2020-05-05 杭州电子科技大学 一种可识别小字符内容的工尺谱数字化方法
CN111274891A (zh) * 2020-01-14 2020-06-12 成都嗨翻屋科技有限公司 一种面向简谱图像的音高及对应歌词提取方法及系统

Also Published As

Publication number Publication date
JP4803797B2 (ja) 2011-10-26

Similar Documents

Publication Publication Date Title
JP4803797B2 (ja) 楽譜認識装置および楽譜認識プログラム
JP3927407B2 (ja) ディジタル・ペンを使用してコモン・ミュージック・ノテーション(cmn)を書くための方法およびシステム
US8209169B2 (en) Synchronization of an input text of a speech with a recording of the speech
US8586848B2 (en) Musical-score information generating apparatus, music-tone generation controlling apparatus, musical-score information generating method, and music-tone generation controlling method
JP2008123182A (ja) 楽譜認識装置およびプログラム
Bainbridge Extensible optical music recognition
CN111052221B (zh) 和弦信息提取装置、和弦信息提取方法及存储器
JP2009098161A (ja) 楽譜認識装置及びコンピュータプログラム
JP4738135B2 (ja) 楽譜認識装置および楽譜認識プログラム
JP2009009307A (ja) 文書画像処理装置及びその方法
WO2000034942A1 (en) Method and system for recognizing musical notations using a compass-direction user interface
JP3454307B2 (ja) 楽曲の旋律類似度判定方法
CN110299049B (zh) 一种电子乐谱的智能展现方法
Miyao et al. Format of ground truth data used in the evaluation of the results of an optical music recognition system
JP2001229162A (ja) 中国語文書自動校正方法及び装置
Gross A set of computer programs to aid in music analysis.
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP6168117B2 (ja) 楽譜情報生成装置、楽譜情報生成方法及びプログラム
CN115937015A (zh) 一种音乐数据库的特征信息构建方法
JPH06102871A (ja) 楽譜認識装置
JP2003242439A (ja) 楽譜認識装置
JP3507720B2 (ja) オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体
JPH1166061A (ja) 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1185145A (ja) 譜面作成装置
CN114724151A (zh) 一种基于卷积神经网络的古筝简谱识别方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110808

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110808

R150 Certificate of patent or registration of utility model

Ref document number: 4803797

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3