JP2017069843A - 楽譜画像解析装置 - Google Patents

楽譜画像解析装置 Download PDF

Info

Publication number
JP2017069843A
JP2017069843A JP2015194932A JP2015194932A JP2017069843A JP 2017069843 A JP2017069843 A JP 2017069843A JP 2015194932 A JP2015194932 A JP 2015194932A JP 2015194932 A JP2015194932 A JP 2015194932A JP 2017069843 A JP2017069843 A JP 2017069843A
Authority
JP
Japan
Prior art keywords
score
index
symbol
shooting
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015194932A
Other languages
English (en)
Other versions
JP6586847B2 (ja
Inventor
山本 和彦
Kazuhiko Yamamoto
山本  和彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2015194932A priority Critical patent/JP6586847B2/ja
Priority to PCT/JP2016/079057 priority patent/WO2017057694A1/ja
Publication of JP2017069843A publication Critical patent/JP2017069843A/ja
Priority to US15/938,544 priority patent/US10452940B2/en
Application granted granted Critical
Publication of JP6586847B2 publication Critical patent/JP6586847B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Auxiliary Devices For Music (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

【課題】利用者が撮影の指示をすることなく、適切な撮影方向から楽譜を撮影した画像を取得する。
【解決手段】楽譜画像解析装置100は、相互に並列された複数の譜表と各譜表に対して所定の位置に配置された楽譜記号72(n)とを含む楽譜を撮影装置10による動画撮影で時系列に生成された各楽譜画像70から楽譜記号72(n)を検出する記号検出部510と、記号検出部510が検出した複数の楽譜記号72(n)の配列である記号列を特定する記号列特定部520と、楽譜に対する撮影方向の適否の指標である姿勢指標Zを記号列に応じて算出する指標算出部530と、姿勢指標Zが所定の条件を満たす場合に撮影装置に楽譜画像70Aの静止画撮影を指示する撮影制御部570とを具備する。
【選択図】図13

Description

本発明は、楽譜を撮影する技術に関する。
書籍を撮影する技術が従来から提案されている。例えば、特許文献1には、利用者がデジタルカメラ等の撮像装置を利用して撮影した書籍の画像の湾曲歪を補正する技術が公開されている。
特開2013−93704号公報
特許文献1の技術を利用すれば、撮影画像の湾曲歪の補正が可能であるが、本来的には、撮影画像の歪みが低減される適切な撮影方向から撮影されることが重要である。しかし、利用者が、デジタルカメラ等のモニタで表示される書籍の歪みを目視により確認しながら撮影装置の撮影方向を調整し、撮影装置を適切な撮影方向に維持した状態で撮影の指示を付与することは、実際には容易ではない。以上の事情を考慮して、本発明は、利用者が撮影の指示をすることなく、適切な撮影方向から楽譜を撮影した画像を取得することを目的とする。
以上の課題を解決するために、本発明に係る楽譜画像解析装置は、相互に並列された複数の譜表と各譜表に対して所定の位置に配置された楽譜記号とを含む楽譜を撮影装置による動画撮影で時系列に生成された各楽譜画像から楽譜記号を検出する記号検出部と、記号検出部が検出した複数の楽譜記号の配列である記号列を特定する記号列特定部と、楽譜に対する撮影方向の適否の指標である姿勢指標を記号列に応じて算出する指標算出部と、姿勢指標が所定の条件を満たす場合に撮影装置に楽譜画像の静止画撮影を指示する撮影制御部とを具備する。以上の構成では、楽譜に対する撮影方向の適否の指標である姿勢指標が所定の条件を満たす場合に撮影制御部が撮影装置に静止画撮影を指示する。したがって、利用者が撮影の指示をすることなく、適切な撮影方向で撮影した楽譜画像を取得することが可能である。
本発明の好適な態様において、指標算出部は、楽譜記号の位置で記号列に交差する単位領域を設定する単位領域設定部と、楽譜記号が配置された譜表のうち単位領域に含まれる割合に応じた第1指標を算出する第1指標算出部とを含み、第1指標に応じた姿勢指標を設定する。以上の構成では、複数の楽譜記号の配列である記号列に交差する単位領域を設定し、単位領域に含まれる譜表の割合に応じた第1指標が算出されて姿勢指標に反映される。したがって、楽譜に対する撮影方向の適否を定量的に評価した姿勢指標を、静止画撮影の指示に適用できる。
本発明の好適な態様において、指標算出部は、記号列の角度に応じた第2指標を算出する第2指標算出部を含み、第2指標に応じた姿勢指標を設定する。以上の構成では、記号列の角度に応じた第2指標が算出されて姿勢指標に反映される。したがって、楽譜に対する撮影方向の適否を定量的に評価した姿勢指標を、静止画撮影の指示に適用できる。
本発明の好適な態様において、姿勢指標は、撮影範囲の横方向が楽譜の横方向に平行となる状態に近いほど大きい数値となる指標であり、所定の条件は、姿勢指標が所定の閾値を上回ることである。以上の構成では、撮影範囲の横方向が楽譜の横方向に平行となる状態に近いほど姿勢指標は大きい数値となる構成のもとで、姿勢指標が所定の閾値を上回る場合に撮影制御部が撮影装置に楽譜画像の静止画撮影を指示する。したがって、撮影範囲の横方向が楽譜の横方向に平行となる状態に近い適切な撮影方向で撮影した楽譜画像を取得することが可能である。
第1実施形態の楽譜画像解析装置の構成図である。 撮影方向が楽譜の法線方向に対して平行な場合の楽譜画像の表示例である。 撮影方向が楽譜の法線方向に対して傾斜した場合の楽譜画像の表示例である。 記号検出部の処理の説明図である。 記号列特定部の処理の説明図である。 単位領域設定部の処理の説明図である。 第1指標算出部が第1指標を算出する処理のフローチャートである。 第1指標算出部の処理の説明図である。 第2指標算出部が第2指標を算出する処理のフローチャートである。 ベクトルを説明するための記号列図形の拡大図である。 楽譜画像の表示装置への表示例である。 第1実施形態の制御装置が楽譜画像を解析する処理のフローチャートである。 第2実施形態の楽譜画像解析装置の構成図である。 第2実施形態の制御装置が楽譜画像を解析する処理のフローチャートである。
<第1実施形態>
図1は、第1実施形態に係る楽譜画像解析装置100の構成図である。楽譜画像解析装置100は、利用者が撮影した楽譜の画像を解析する装置であり、例えばスマートフォンやタブレット等の可搬型の装置で実現される。図1に例示される通り、第1実施形態の楽譜画像解析装置100は、撮影装置10と入力装置20と記憶装置30と表示装置40と制御装置50とを具備する。
撮影装置10は、画像を撮影するための装置であり、被写体からの到来光を電気信号に変換する撮像素子を含んで構成される。利用者は、印刷物等に記載された楽譜に対して所望の位置および方向に撮影装置10を保持した状態で楽譜を撮影する。撮影装置10は、所定の範囲(以下「撮影範囲」という)内の楽譜の画像(以下「楽譜画像」という)70を生成および出力する。第1実施形態の撮影装置10は動画撮影および静止画撮影が可能である。具体的には、撮影装置10は、動画撮影時には複数の楽譜画像70を所定の周期で時系列に生成し、静止画撮影時には1個の楽譜画像70を生成する。図2に例示される通り、以下の説明では、楽譜画像70の横方向(撮影範囲の横方向)をx軸方向と表記し、縦方向(撮影範囲の縦方向)をy軸方向と表記する。なお、第1実施形態では、撮影装置10が楽譜画像解析装置100に一体に搭載された構成を例示する。
楽譜には、図2に例示される通り、相互に平行な複数の直線の集合(以下「譜表」という)62(1)〜62(N)と、各譜表62(n)(n=1〜N)に対して所定の位置に配置された楽譜記号72(n)との複数組(N組)が縦方向に並列される。第1実施形態の譜表62(n)は、相異なる音高を表象する5本の直線で構成される五線譜である。楽曲を表現する音符や休符,変化記号等の符号は譜表62(n)に対して任意の位置に配置される。第1実施形態では、楽譜の譜表62(n)に対して左端付近に位置するト音記号およびへ音記号を楽譜記号72(n)として例示する。
利用者は、楽譜(1頁分)の全体が撮影範囲に包含されるように撮影装置10(楽譜画像解析装置100)を保持して撮影する。具体的には、利用者は、撮影方向が楽譜の法線方向に対して平行となり、かつ、楽譜画像70のx軸方向が楽譜の横方向に平行となる状態(以下「基準状態」という)となるように撮影方向を調整する。基準状態では、図2に例示される通り、複数の楽譜記号72(1)〜72(N)が破線15で示すようにy軸方向に平行に配列し、かつ、複数の譜表62(n)の各々がx軸方向に平行となる。しかし、実際には、利用者が撮影装置10を基準状態に継続的に保持することは容易ではなく、撮影方向が楽譜の法線方向に対して傾斜した状態、または、撮影範囲が楽譜の法線方向を軸として基準状態から回転した状態(楽譜画像70のx軸方向が楽譜の横方向に平行とならない状態)となり得る。以上のように撮影方向が傾斜した状態(以下「傾斜状態」という)や撮影範囲が回転した状態(以下「回転状態」という)では、図3に破線15で例示される通り、楽譜画像70において複数の楽譜記号72(1)〜72(N)の配列がy軸方向に平行にならない場合があり得る。
図1の表示装置40は、例えば液晶表示パネルであり、制御装置50から指示された画像を表示する。例えば撮影装置10による動画撮影で生成された複数の楽譜画像70が表示装置40に順次に表示(ライブビュー表示)される。入力装置20は、楽譜画像解析装置100に対する各種の指示のために利用者が操作する操作機器であり、例えば利用者が操作する複数の操作子を含んで構成される。具体的には、利用者は、入力装置20を適宜に操作することで動画撮影や静止画撮影を楽譜画像解析装置100に指示することが可能である。表示装置40と一体に構成されたタッチパネルを入力装置20として採用することも可能である。
記憶装置30は、磁気記録媒体や半導体記録媒体等の公知の記録媒体であり、制御装置50が実行するプログラムや制御装置50が使用する各種のデータを記憶する。例えば、撮影装置10が静止画撮影で生成した静止画像の楽譜画像70Aが記憶装置30に記憶される。
制御装置50は、例えばCPU(Central Processing Unit)等の処理装置で構成され、記憶装置30に記憶されたプログラムを実行することで、図1に例示される通り、撮影装置10が撮影した楽譜画像70を解析する複数の要素(記号検出部510、記号列特定部520、単位領域設定部532、第1指標算出部534、第2指標算出部544、姿勢指標算出部550、表示制御部560、撮影制御部570)として機能する。なお、制御装置50の一部の機能を専用の電子回路で実現した構成や、制御装置50の機能を複数の装置に分散した構成も採用され得る。
制御装置50が実現する各要素について詳述する。以下に説明する各要素による処理は、実際には撮影装置10による動画撮影に並行して楽譜画像70毎に順次に実行されるが(詳細は後述)、以下の説明では便宜的に1個の楽譜画像70に着目する。
記号検出部510は、撮影装置10が動画撮影で時系列に生成した各楽譜画像70から複数(N個)の楽譜記号72(1)〜72(N)を検出する。記号検出部510による楽譜記号72(n)の検出には、公知の画像認識(例えばパターン認識)技術が任意に採用され得る。図4は、第1実施形態の楽譜画像70に対する記号検出部510の処理の説明図である。図4に例示される通り、記号検出部510は、楽譜画像70から検出した各楽譜記号72(n)を含むように記号領域76(n)を設定する。記号領域76(n)は、x軸に平行な直線とy軸に平行な直線とで構成される矩形状の領域である。
楽譜記号72(1)〜72(N)が譜表62(n)に対して左端付近にあること、および、楽譜(1頁分)の全体が撮影範囲に包含されるように利用者が撮影することを考慮すると、N個の楽譜記号72(1)〜72(N)は、楽譜画像70内で左側に位置する縦方向の領域内に位置する可能性が高い。そこで、第1実施形態の記号検出部510は、図4に例示される通り、楽譜画像70のうち楽譜記号72(1)〜72(N)が位置すると予想される所定の範囲74内を対象として楽譜記号72(1)〜72(N)を検出する。すなわち、範囲74の外側の領域は楽譜記号72(n)の探索範囲から除外される。範囲74は、楽譜画像70の左端にx軸に平行な直線とy軸に平行な直線とで構成され、y軸方向に長尺な短形状の領域である。なお、範囲74に楽譜記号72(1)〜72(N)が含まれるように撮影装置10による撮影範囲(楽譜と撮影装置10との距離)を利用者が調整する、ということも可能である。以上の通り、第1実施形態では、楽譜画像70の所定の範囲74内を楽譜記号72(n)の探索対象とする一方で、所定の範囲74外は楽譜記号72(n)の探索を行わない。したがって、楽譜画像70の全範囲を楽譜記号72(n)の探索対象とする構成と比較して、記号検出部510にかかる処理負荷(ひいては楽譜画像解析装置100全体の処理負荷)を軽減することが可能である。
図1の記号列特定部520は、記号検出部510が検出したN個の楽譜記号72(1)〜72(N)の配列(以下「記号列」という)を特定する。図5は、第1実施形態に係る楽譜画像70に対する記号列特定部520の処理の説明図である。図5に例示される通り、第1実施形態の記号列特定部520は、記号列を表す記号列図形78を設定する。具体的には、記号列特定部520は、N個の記号領域76(1)〜76(N)の各々の頂点を内包し、かつ、面積が最小となる矩形状の記号列図形78を設定する。前述の通り、傾斜状態や回転状態では、記号列がx軸方向およびy軸方向に対して傾斜する。したがって、図5から理解される通り、記号列特定部520が特定する記号列図形78は、楽譜の法線方向に対する撮影方向の傾斜や楽譜に対する撮影範囲の回転の度合に応じて、x軸方向およびy軸方向に対して傾斜し得る。
図1の単位領域設定部532は、図6に例示される通り、記号検出部510が検出した各楽譜記号72(n)に対応するN個の単位領域A(1)〜A(N)を設定する。任意の1個の楽譜記号72(n)に対応する単位領域A(n)は、記号列特定部520が特定した記号列図形78に当該楽譜記号72(n)の位置で交差する矩形状の領域である。具体的には、単位領域A(n)は、楽譜記号72(n)を端点として、記号列図形78の長辺に直交する方向に延在する矩形状の領域である。単位領域A(n)の横幅(記号列図形78に直交する方向のサイズ)は、楽譜画像70の横幅に対して所定の比率(例えば95%)に設定され、単位領域A(n)の縦幅(記号列図形78に平行な方向のサイズ)は、記号領域76(n)の縦幅に対して所定の比率(例えば120〜130%)に設定される。図6から理解される通り、記号列図形78が傾斜している場合は、単位領域A(n)も同様にx軸方向およびy軸方向に対して傾斜する。
図1の第1指標算出部534は、第1指標X1を算出する。第1指標X1は、撮影方向が楽譜の法線方向に対して傾斜する度合の指標である。具体的には、第1指標算出部534は、単位領域設定部532が設定した単位領域A(n)について、単位領域A(n)に対応する楽譜記号72(n)が配置された譜表62(n)のうち単位領域A(n)に含まれる割合R(n)を算出し、N個の単位領域A(1)〜A(N)における割合R(1)〜R(N)に応じた第1指標X1を算出する。
図7は、第1実施形態の第1指標算出部534が第1指標X1を算出する処理(以下「第1指標算出処理」という)S5のフローチャートであり、図8は、第1指標算出処理S5の説明図である。単位領域設定部532の単位領域A(n)の設定を契機として第1指標算出処理S5が開始される。
第1指標算出処理S5を開始すると、第1指標算出部534は、楽譜画像70に注目領域Bを設定する(S5-1)。注目領域Bは、図8に例示される通り、x軸に平行な直線とy軸に平行な直線とで構成される矩形状の領域である。具体的には、注目領域Bの横幅は、楽譜画像70の横幅に対して所定の比率(例えば95%)に設定され、注目領域Bの縦幅は、記号列図形78の全ての頂点を含むサイズに設定される。
第1指標算出部534は、楽譜画像70のうち図7のステップS5-1で設定した注目領域Bの内側を対象として直線63の検出(以下「直線検出」という)を行う(S5-2)。具体的には、図8に例示される通り、楽譜画像70の注目領域B内に対して直線検出を行い、楽譜画像70内の譜表62(1)〜62(N)を含む図形から複数の直線63を検出する。直線検出には、公知の特徴検出(例えばハフ変換)処理が任意に採用され得る。なお、注目領域Bの外側は楽譜ではない可能性が高いから、第1指標算出部534による直線検出の対象から除外される。
第1指標算出部534は、図7のステップS5-2で検出した複数の直線63を譜表62(n)毎(楽譜記号72(n)毎)に複数の集合64(n)に分類する(S5-3)。直線63の分類には、公知のクラスタリング技術(例えばk-means法)が任意に採用され得る。具体的には、第1指標算出部534は、楽譜画像70から検出した複数の直線63を、記号検出部510が検出した楽譜記号72(n)と同数の集合64(n)に分類する。例えば、楽譜記号72(n)の個数Nを分類数として指定したクラスタリングにより、複数の直線63をN個の集合64(n)に分類することが可能である。また、前述の通り、譜表62(n)は、相互に平行な複数の直線の集合であるので、任意の1個の譜表62(n)から検出された複数の直線63は、相互に近接した位置に分布する。したがって、図8に例示される通り、楽譜記号72(n)が配置された譜表62(n)から検出された複数の直線63は、同一の集合64(n)に分類され得る。したがって、例えば1個の単位領域A(n)が複数の譜表62(n)に跨るようにx軸方向に対して傾斜した状態でも、単位領域A(n)に含まれる譜表62(n)の割合R(n)を譜表62(n)毎に高精度に特定することが可能である。また、複数の譜表62(n)から検出される複数の直線63が楽譜記号72(n)と同数の集合64(n)に分類されるので、複数の直線63の分類数が未知である構成と比較して、複数の直線63を適切に分類できるという利点がある。
第1指標算出部534は、N個の単位領域A(1)〜A(N)の各々について、図7のステップS5-3で集合64(n)に分類された複数の直線63が当該単位領域A(n)に含まれる割合R(n)を算出する(S5-4)。具体的には、集合64(n)に分類された複数の直線63の各々の線上の点(例えば端点や中点)のうち単位領域A(n)内に含まれる点の個数の割合R(n)を算出する。以上のように各直線63上の点を計数する構成によれば、例えば各直線63のうち単位領域A(n)内に位置する長さの比率を算定する構成と比較して、割合R(n)の算出が容易であるという利点がある。
撮影方向が楽譜の法線方向に平行な基準状態では、各譜表62(n)はx軸方向に延在する一方、記号列図形78がy軸方向に略平行になることで各単位領域A(n)はx軸方向に略平行な方向(すなわち譜表62(n)に略平行な方向)に延在する。したがって、集合64(n)に分類された直線63の殆どが単位領域A(n)に内包されるので、割合R(n)は、大きい値となる。他方、撮影方向が楽譜の法線方向に対して傾斜した傾斜状態では、例えば、図6に例示される通り、各譜表62(n)はx軸方向に延在する一方、記号列図形78がx軸およびy軸方向に傾斜することで各単位領域A(n)もx軸およびy軸方向に対して傾斜した方向に延在する。したがって、図8に例示される通り、集合64(n)に分類された直線63のうち、単位領域A(n)に内包されない直線63が多くなり、割合R(n)は、小さい値となる。つまり、撮影方向が楽譜の法線方向に対して傾斜する度合の指標として割合R(n)を利用可能である。
第1指標算出部534は、図7のステップS5-4で算出したN個の単位領域A(1)〜A(N)における各々の割合R(n)に応じた第1指標X1を算出する(S5-5)。具体的には、N個の割合R(1)〜R(N)の合計や加重和が第1指標X1として算出される。以上の通り、第1実施形態では、N個の単位領域A(1)〜A(N)にわたる割合R(n)に応じて第1指標X1を算出するので、撮影方向の楽譜の法線方向に対する傾斜の度合を楽譜画像70の広範囲にわたり総合的に評価することができる。以上が第1指標算出処理S5の具体例である。
図1の第2指標算出部544は、第2指標X2を算出する。第2指標X2は、楽譜の法線方向に対する撮影方向の傾斜や楽譜に対する撮影範囲の回転の度合の指標である。具体的には、第2指標算出部544は、記号列特定部520が特定した記号列(N個の楽譜記号72(1)〜72(N)の配列)の角度に応じて第2指標X2を算出する。図9は、第1実施形態の第2指標算出部544が第2指標X2を算出する処理(以下「第2指標算出処理」という)S6のフローチャートである。例えば記号列特定部520による記号列の特定を契機として第2指標算出処理S6が開始される。
第2指標算出処理S6を開始すると、第2指標算出部544は、記号列特定部520が特定した記号列に平行なベクトルCを求める(S6-1)。具体的には、記号列特定部520は、記号列図形78を構成する直線に平行なベクトルCを求める。図10は、ベクトルCを説明するための記号列図形78の拡大図である。例えば、記号列図形78の頂点のうちx軸に最も近い位置にある頂点を始点Pとして、記号列図形78の長辺に平行でx軸に対して角度θをなすベクトルCを求める。ベクトルCは、大きさ(絶対値)が1に正規化された単位ベクトルである。ベクトルCの角度θは、x軸に対する記号列の角度とも換言され得る。
第2指標算出部544は、ベクトルCにおけるy軸方向の成分Cyの絶対値|Cy|(0≦|Cy|≦1)を第2指標X2として算出する(S6-2)。基準状態では、記号列図形78がy軸方向に略平行になるため、ベクトルCも同様にy軸に略平行となる。したがって、ベクトルCの成分Cyの絶対値|Cy|、つまり第2指標X2は、最大値である1に近い値となる。他方、傾斜状態や回転状態では、記号列図形78はx軸およびy軸方向に対して傾斜する。したがって、第2指標X2は1より小さくなる。以上の説明から理解される通り、傾斜状態において撮影方向が楽譜の法線方向に対して傾斜する度合、および、回転状態において撮影範囲が基準状態から回転する度合の指標として第2指標X2を利用可能である。
図1の姿勢指標算出部550は、姿勢指標Zを算出する。姿勢指標Zは、撮影装置10を保持する利用者の姿勢(撮影装置10の撮影方向)が基準状態に近いか否かを表す指標である。具体的には、姿勢指標算出部550は、第1指標算出部534が算出した第1指標X1と第2指標算出部544が算出した第2指標X2とに応じて姿勢指標Zを算出する。例えば、第1指標X1と第2指標X2との積が姿勢指標Zとして算出される。前述の通り、第1指標X1も第2指標X2も基準状態に近い(すなわち、撮影範囲のx軸方向が楽譜の横方向に平行となる状態に近い)ほど大きい値をとるので、第1指標X1と第2指標X2の積である姿勢指標Zは、撮影方向が基準状態に近いほど大きくなる。つまり、撮影装置10の撮影方向が基準状態に近いか否かの指標として姿勢指標Zを利用可能である。
以上の説明から理解される通り、図1の単位領域設定部532と第1指標算出部534と第2指標算出部544と姿勢指標算出部550とは、楽譜に対する撮影方向の適否の指標である姿勢指標Zを算出する指標算出部530として機能する。
図1の表示制御部560は、楽譜画像70の解析結果を表示装置40に表示させる。具体的には、第1実施形態の表示制御部560は、図11に例示される通り、記号列特定部520が設定した記号列図形78と、記号列図形78の基準となる基準図形80と、姿勢指標算出部550が算出した姿勢指標Zとを表示装置40に表示させる。第1実施形態では、基準図形80は、楽譜記号72(n)の探索対象となる範囲74の概形である。具体的には、表示制御部560は、図11に例示される通り、記号列図形78と基準図形80とを楽譜画像70に重ねて表示装置40に表示させる。また、姿勢指標Zを表示装置40に表示させる。記号列図形78と基準図形80と姿勢指標Zとは、撮影装置10による楽譜の動画撮影に並行して表示装置40に表示される。なお、表示制御部560が表示装置40に表示させる項目は任意であるので、例えば、図11に例示される通り、姿勢指標Zの値(スコア)を利用者が調整する目安とするために、「スコアを高くしてください。」等の文字列を表示させることも可能である。
図1の撮影制御部570は、撮影装置10の撮影動作を制御する。具体的には、第1実施形態の撮影制御部570は、動画撮影の指示を利用者が入力装置20に付与した場合には撮影装置10に動画撮影を指示し、静止画撮影の指示を利用者が入力装置20に付与した場合には撮影装置10に静止画撮影を指示する。利用者は、動画撮影中の任意の時点で静止画撮影の指示を入力装置20に付与することが可能である。静止画撮影で生成された静止画像の楽譜画像70Aは撮影制御部570により記憶装置30に格納される。
図12は、第1実施形態の制御装置50が楽譜画像70を解析する処理(以下「楽譜画像解析処理」という)のフローチャートである。利用者からの動画撮影の指示を契機として楽譜画像解析処理が開始される。楽譜画像解析処理を開始すると、制御装置50は、撮影装置10が動画撮影で生成する複数の楽譜画像70の各々を順次に取得する(S1)。
記号検出部510は、撮影装置10が生成した楽譜画像70から楽譜記号72(n)を検出する(S2)。記号列特定部520は、記号検出部510が検出した複数の楽譜記号72(1)〜72(N)の配列である記号列(記号列図形78)を特定する(S3)。単位領域設定部532は、記号列特定部520が特定した記号列に楽譜記号72(n)の位置で交差する単位領域A(n)を設定する(S4)。第1指標算出部534は、楽譜記号72(n)が配置された譜表62(n)のうち単位領域A(n)に含まれる割合R(n)を算出し、N個の単位領域A(1)〜A(N)における割合R(1)〜R(N)に応じた第1指標X1を算出する(S5)。第1指標算出処理S5の具体例は、前掲の図7を参照して前述した通りである。第2指標算出部544は、前掲の図9を参照して前述した通り、記号列特定部520が特定した記号列の角度θに応じた第2指標X2を算出する(S6)。
姿勢指標算出部550は、第1指標算出部534が算出した第1指標X1と第2指標算出部544が算出した第2指標X2とに応じた姿勢指標Zを算出する(S7)。表示制御部560は、記号列特定部520が設定した記号列図形78と、記号列図形78の基準となる基準図形80と、姿勢指標算出部550が算出した姿勢指標Zとを楽譜の動画撮影に並行して楽譜画像70に重ねて表示装置40に表示させる(S8)。
利用者は、表示装置40に表示された記号列図形78や姿勢指標Zを確認しながら撮影装置10の方向を適宜に調整し、記号列図形78が基準図形80に沿う状態または姿勢指標Zが大きい数値になった状態で、入力装置20を操作して静止画撮影を指示する。撮影制御部570は、静止画撮影の指示が利用者から入力装置20に付与されたか否かを判定する(S9)。静止画撮影が利用者から指示された場合(S9;YES)、撮影制御部570は、撮影装置10に静止画撮影を指示し(S10)、指示に応じて撮影装置10が撮影した静止画像の楽譜画像70Aを記憶装置30に格納する(S11)。他方、利用者から静止画撮影が指示されない場合(S9;NO)、図12に例示される通り、ステップS10とステップS11の処理は実行されずに、ステップS12の処理が実行される。
楽譜の動画撮影を終了する場合(S12;YES)、例えば、利用者が楽譜の動画撮影の終了を入力装置20に付与した場合、図12の楽譜画像解析処理は終了する。他方、撮影を終了しない場合(S12;NO)、撮影装置10から取得される新たな楽譜画像70についてステップS1からステップS12の処理が実行される。なお、ステップS6の処理は、ステップS4の処理の前に行ってもよい。つまり、第1指標X1を算出する処理(S4〜S5)と第2指標X2を算出する処理(S6)との先後関係は任意である。
以上の説明から理解される通り、動画撮影の終了が指示されるまで(S12;YES)ステップS1からステップS11の処理は繰り返し実行される。つまり、記号検出部510による楽譜記号72(n)の検出(S2)と、記号列特定部520による記号列の特定(S3)と、指標算出部530による姿勢指標Zの算出(S4〜S7)とは、撮影装置10による動画撮影に並行して順次に実行される。
また、表示制御部560が記号列図形78と基準図形80と姿勢指標Zとを表示装置40に表示させる動作も動画撮影に並行して順次に実行される。利用者は、記号列図形78を基準図形80に合わせるように撮影装置10の撮影方向を適宜に調整するので、楽譜画像70(例えば楽譜記号72(n)の位置や大きさ)も刻々と変化する。したがって、記号列図形78や姿勢指標Zは経時的に変化する。つまり、表示制御部560は、記号列特定部520による記号列の特定結果に応じて記号列図形78と姿勢指標Zとを経時的に(S1〜S7の処理が実行される度に)変更する。したがって、記号列図形78と基準図形80と楽譜画像70との関係を目視により確認しながら、利用者が撮影方向を適切な方向に調整することが可能である。
以上に説明した通り、第1実施形態では、楽譜画像70から検出された複数の楽譜記号72(n)の配列である記号列に交差する単位領域A(n)を設定し、単位領域A(n)に含まれる譜表62(n)の割合に応じた第1指標X1が算出される。撮影方向が楽譜の法線方向に対して傾斜するほど単位領域A(n)内の譜表62(n)の割合が低下するので、第1指標X1も低下する。また、記号列の角度θに応じた第2指標X2が算出される。楽譜の法線方向に対する撮影方向の傾斜角度または楽譜に対する撮影範囲の回転角度(楽譜に平行な面内での撮影装置10の回転角度)に応じて記号列の角度θは変化するので、角度θに伴い第2指標X2も変化する。したがって、楽譜に対する撮影方向の適否を定量的に評価することが可能である。
なお、撮影方向が楽譜の法線方向に平行に維持されたまま、撮影範囲が基準状態と比較して回転した回転状態では、記号列はx軸方向またはy軸方向に対して傾斜する一方で、各譜表62(n)は記号列に対して直交する。したがって、第2指標X2は小さい数値となる一方、第1指標X1は大きい数値となる。他方、撮影方向が楽譜の法線方向に対して傾斜した傾斜状態では、第1指標X1および第2指標X2の双方が小さい数値となる。以上の説明から理解される通り、第2指標X2には、傾斜状態および回転状態の双方の状態における記号列の傾斜が反映されるのに対し、第1指標X1には、傾斜状態における撮影方向の傾斜は反映されるが、撮影範囲の回転に起因した記号列の傾斜は反映されない。以上の傾向を考慮すると、撮影方向が楽譜の法線方向に対して傾斜する度合(傾斜状態)の指標としては、第1指標X1が特に好適である。
<第2実施形態>
本発明の第2実施形態を説明する。以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
図13は、第2実施形態の楽譜画像解析装置100の構成図である。第1実施形態では、入力装置20に対する利用者からの操作を契機として撮影制御部570が撮影装置10に静止画撮影を指示した(S10)。図13に例示される通り、第2実施形態の撮影制御部570は、指標算出部530が算出した姿勢指標Zが所定の条件を満たす場合に、撮影装置10に楽譜画像70Aの静止画撮影を指示する。
具体的には、指標算出部530が算出した姿勢指標Zと所定の閾値ZTとの比較結果に応じて、撮影制御部570は撮影装置10に静止画撮影を指示する。例えば、姿勢指標Zが閾値ZTを上回る場合に、撮影装置10に静止画撮影が指示される。姿勢指標Zと対比される閾値ZTは、実験的または統計的に選定される。また、入力装置20に対する利用者からの指示に応じて閾値ZTを可変に設定することも可能である。
図14は、第2実施形態の制御装置50が楽譜画像70を解析する処理のフローチャートである。楽譜画像70の取得(S1)から解析結果の表示(S8)は、第1実施形態と同様である。撮影制御部570は、指標算出部530が算出した姿勢指標Zが閾値ZTを上回るか否かを判定する(S9)。撮影装置10の撮影方向が基準状態に近いほど姿勢指標Zは大きい数値となる。姿勢指標Zが閾値ZTを上回る場合(S9;YES)、すなわち、撮影装置10の撮影方向が適切である場合、撮影制御部570は、撮影装置10に静止画撮影を指示し(S10)、指示に応じて撮影装置10が撮影した静止画像の楽譜画像70Aを記憶装置30に格納する(S11)。他方、姿勢指標Zが閾値ZTを下回る場合(S9;NO)、図14に例示される通り、ステップS10とステップS11の処理は実行されずに、ステップS12の処理が実行される。動画撮影の終了が利用者から指示されるまでステップS1からステップS11の処理が反復される点は第1実施形態と同様である。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、姿勢指標Zが所定の条件を満たす場合に撮影装置10に楽譜画像70Aの静止画撮影が指示される。したがって、利用者が撮影の指示をすることなく、楽譜の撮影に適している撮影方向で撮影した楽譜の静止画像(楽譜画像70A)を取得することが可能である。
<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
(1)前述の各形態では、N個の単位領域A(1)〜A(N)における割合R(1)〜R(N)の合計や加重和を第1指標X1として算出したが、第1指標X1の算出方法は以上の例示に限定されない。例えば、N個の単位領域A(1)〜A(N)がx軸方向に対して傾斜する角度は概ね共通することを考慮すると、N個の割合R(1)〜R(N)は相互に近い数値になると予想される。したがって、N個の単位領域A(1)〜A(N)のうち特定の1個の単位領域A(n)における割合R(n)を第1指標X1とすることも可能である。
(2)前述の各形態では、記号列図形78の長辺に平行でx軸に対して角度θをなすベクトルCのy軸方向の成分Cyの絶対値|Cy|を第2指標X2として算出したが、第2指標X2の算出方法は以上の例示に限定されない。例えば、記号列に垂直なベクトルCのx軸方向(またはy軸方向)の絶対値を第2指標X2として算出する構成や、x軸方向に対する記号列の角度θに対する所定の演算で第2指標X2を算出する構成(したがって、ベクトルCの特定は不要である)も採用され得る。以上の説明から理解される通り、第2指標X2は、記号列の角度θに応じた指標として包括的に表現され、具体的な算出方法の如何は不問である。
(3)前述の各形態では、第1指標X1と第2指標X2との積を姿勢指標Zとして算出したが、姿勢指標Zの算出方法は以上の例示に限定されない。例えば、第1指標X1と第2指標X2との合計や加重和を姿勢指標Zとすることも可能である。また、第1指標X1を姿勢指標Zとして設定する構成(第2指標X2の算出は省略される)や、第2指標X2を姿勢指標Zとして設定する構成(第1指標X1の算出は省略される)も採用され得る。
(4)前述の各形態では、撮影装置10の撮影方向が基準状態に近いほど第1指標X1および第2指標X2が増加する場合を例示したが、撮影方向の適否と第1指標X1および第2指標X2の大小との関係は反転され得る。例えば、N個の割合R(1)〜R(N)の合計や加重和の逆数を第1指標X1として算定する構成では、撮影装置10の撮影方向が基準状態に近いほど第1指標X1は小さい数値となる。第2指標X2についても同様に、例えばベクトルCのx軸方向の成分Cxの絶対値|Cx|を第2指標X2として算出する構成では、撮影装置10の撮影方向が基準状態に近いほど第2指標X2は小さい数値となる。
(5)前述の各形態では、楽譜記号72(n)の探索対象となる範囲74の概形を基準図形80としたが、基準図形80の形状や位置は以上の例示に限定されない。例えば、y軸に平行な直線を基準図形80とすることも可能である。以上の例示から理解される通り、基準図形80は、記号列図形78(記号列)の基準となる図形として包括的に表現される。
(6)前述の各形態では、N個の記号領域76(1)〜76(N)の各々の頂点を内包し、かつ、面積が最小となる矩形状の記号列図形78を設定したが、記号列図形78の形状や設定方法は以上の例示に限定されない。例えば、記号領域76(1)と76(N)との各々の重心を通る直線や当該直線に沿う矩形を記号列図形78とすることも可能である。
(7)前述の各形態では、ト音記号およびへ音記号を楽譜記号72(n)として検出したが、楽譜記号72(n)の種類は以上の例示に限定されない。例えば、ト音記号やへ音記号のどちらか一方やハ音記号を楽譜記号72(n)として検出することも可能である。また、前述の各形態では、相異なる音高を表象する5本の直線の組を譜表62(n)とした五線譜を楽譜として例示したが、楽譜の種類(表記法)は以上の例示に限定されない。例えば、弦楽器の各弦に対応する6本の直線で構成される譜表62(n)に奏法(具体的には運指)を表記したタブ譜を楽譜として本発明を適用することも可能である。タブ譜を撮影対象とした場合、各譜表62(n)の左端に縦書きされた「TAB」の文字列を楽譜記号72(n)として検出することが可能である。
(8)前述の各形態では、動画撮影により時系列に生成された複数の楽譜画像70の各々を処理対象としたが、例えば静止画撮影で生成された1個の楽譜画像70を対象として第1指標X1や第2指標X2を算出することも可能である。以上の説明から理解される通り、本発明では、楽譜の動画撮影は必須ではない。
(9)移動体通信網やインターネット等の通信網を介して端末装置(例えば携帯電話機やスマートフォン)と通信するサーバ装置と端末装置との協働で楽譜画像解析装置100を実現することも可能である。例えば、指標算出部530をサーバ装置に設置するとともに、それ以外の要素(記号検出部510、記号列特定部520、表示制御部560、撮影制御部570)を端末装置に設置することも可能である。以上の説明から理解される通り、楽譜画像解析装置100は、相互に別体で構成される複数の装置の集合(システム)でも実現され、各装置で実行する処理の切り分けは任意である。
(10)第2実施形態では、姿勢指標Zが閾値ZTを上回る場合に撮影装置10に静止画撮影を指示したが、静止画撮影を指示すべき姿勢指標Zの条件は以上の例示に限定されない。具体的には、閾値ZTを上回る範囲で姿勢指標Zが所定の時間にわたり安定に推移することを条件として撮影装置10に静止画撮影を指示することも可能である。例えば、時系列に算定される複数の姿勢指標Zの散布度(例えば分散)が所定値を下回る場合に姿勢指標Zが安定した状態と判定できる。また、姿勢指標Zの時間的な変動を監視し、姿勢指標Zが極大となったことを検出した場合に撮影装置10に静止画撮影を指示する構成も採用される。以上の説明から理解される通り、撮影制御部570は、姿勢指標Zが所定の条件を満たす場合に撮影装置10に楽譜画像70Aの静止画撮影を指示する要素として包括的に表現され、当該指示の発生条件の具体的な内容は不問である。
(11)前述の各形態で例示した楽譜画像解析装置100は、前述の各形態の例示の通り、制御装置50とプログラムとの協働で実現される。本発明の好適な態様に係るプログラムは、相互に並列されたN個の譜表62(1)〜62(N)と各譜表62(n)に対して所定の位置に配置された楽譜記号72(n)とを含む楽譜を撮影した楽譜画像70から楽譜記号72(1)〜72(N)を検出する記号検出部510、記号検出部510が検出したN個の楽譜記号72(1)〜72(N)の配列である記号列を特定する記号列特定部520、楽譜記号72(n)の位置で記号列に交差する単位領域A(n)を設定する単位領域設定部532、および、楽譜記号72(n)が配置された譜表62(n)のうち単位領域A(n)に含まれる割合R(n)に応じた第1指標X1を算出する第1指標算出部534としてコンピュータを機能させる。以上に例示したプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、通信網を介した配信の形態でプログラムをコンピュータに配信することも可能である。
(12)本発明は、前述の各形態に係る楽譜画像解析装置100の動作方法(楽譜画像解析方法)としても特定される。例えば、本発明の一態様に係る楽譜画像解析方法は、相互に並列されたN個の譜表62(1)〜62(N)と各譜表62(n)に対して所定の位置に配置された楽譜記号72(n)とを含む楽譜を撮影した楽譜画像70から楽譜記号72(1)〜72(N)を検出し(S2)、検出したN個の楽譜記号72(1)〜72(N)の配列である記号列を特定し(S3)、楽譜記号72(n)の位置で記号列に交差する単位領域A(n)を設定し(S4)、楽譜記号72(n)が配置された譜表62(n)のうち単位領域A(n)に含まれる割合R(n)に応じた第1指標X1を算出する(S5)。
100……楽譜画像解析装置、10……撮影装置、20……入力装置、30……記憶装置、40……表示装置、50……制御装置、62……譜表、63……直線、64……集合、70,70A……楽譜画像、72……楽譜記号、74……範囲、76……記号領域、78……記号列図形、80……基準図形、510……記号検出部、520……記号列特定部、530……指標算出部、532……単位領域設定部、534……第1指標算出部、544……第2指標算出部、550……姿勢指標算出部、560……表示制御部、570……撮影制御部

Claims (4)

  1. 相互に並列された複数の譜表と前記各譜表に対して所定の位置に配置された楽譜記号とを含む楽譜を撮影装置による動画撮影で時系列に生成された各楽譜画像から前記楽譜記号を検出する記号検出部と、
    前記記号検出部が検出した複数の楽譜記号の配列である記号列を特定する記号列特定部と、
    前記楽譜に対する撮影方向の適否の指標である姿勢指標を前記記号列に応じて算出する指標算出部と、
    前記姿勢指標が所定の条件を満たす場合に前記撮影装置に前記楽譜画像の静止画撮影を指示する撮影制御部と
    を具備する楽譜画像解析装置。
  2. 前記指標算出部は、
    前記楽譜記号の位置で前記記号列に交差する単位領域を設定する単位領域設定部と、
    前記楽譜記号が配置された前記譜表のうち前記単位領域に含まれる割合に応じた第1指標を算出する第1指標算出部とを含み、
    前記第1指標に応じた前記姿勢指標を設定する
    請求項1の楽譜画像解析装置。
  3. 前記指標算出部は、
    前記記号列の角度に応じた第2指標を算出する第2指標算出部を含み、
    前記第2指標に応じた前記姿勢指標を設定する
    請求項1または請求項2の楽譜画像解析装置。
  4. 前記姿勢指標は、撮影範囲の横方向が前記楽譜の横方向に平行となる状態に近いほど大きい数値となる指標であり、
    前記所定の条件は、前記姿勢指標が所定の閾値を上回ることである
    請求項1から請求項3の何れかの楽譜画像解析装置。
JP2015194932A 2015-09-30 2015-09-30 楽譜画像解析装置 Active JP6586847B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015194932A JP6586847B2 (ja) 2015-09-30 2015-09-30 楽譜画像解析装置
PCT/JP2016/079057 WO2017057694A1 (ja) 2015-09-30 2016-09-30 楽譜画像解析装置
US15/938,544 US10452940B2 (en) 2015-09-30 2018-03-28 Musical score image analyzer and musical score image analyzing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015194932A JP6586847B2 (ja) 2015-09-30 2015-09-30 楽譜画像解析装置

Publications (2)

Publication Number Publication Date
JP2017069843A true JP2017069843A (ja) 2017-04-06
JP6586847B2 JP6586847B2 (ja) 2019-10-09

Family

ID=58495374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015194932A Active JP6586847B2 (ja) 2015-09-30 2015-09-30 楽譜画像解析装置

Country Status (1)

Country Link
JP (1) JP6586847B2 (ja)

Also Published As

Publication number Publication date
JP6586847B2 (ja) 2019-10-09

Similar Documents

Publication Publication Date Title
US10452953B2 (en) Image processing device, image processing method, program, and information recording medium
KR101808015B1 (ko) 최적 문자 인식을 위한 모바일 문서 획득 지원
JP7059054B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN111429354B (zh) 图像拼接及全景图拼接方法和装置、存储介质、电子设备
CN107918767B (zh) 目标检测方法、装置、电子设备及计算机可读介质
US10007680B2 (en) Content collection search with robust content matching
JP6494418B2 (ja) 画像解析装置、画像解析方法、およびプログラム
US20160353021A1 (en) Control apparatus, display control method and non-transitory computer readable medium
US9342753B2 (en) Image processing apparatus, image processing method, and computer program product
JP6530432B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN105208263B (zh) 图像处理装置及其控制方法
WO2017057694A1 (ja) 楽譜画像解析装置
WO2019230593A1 (ja) 画像処理方法および画像処理装置
WO2017208367A1 (ja) 画像処理装置、画像処理方法、および、プログラム
JP6229554B2 (ja) 検出装置および検出方法
JP6586847B2 (ja) 楽譜画像解析装置
JP6586846B2 (ja) 楽譜画像解析装置
CN111311550A (zh) 伪造证件的识别方法、装置及电子设备
EP2375375A1 (en) Computer program product related to digital image analyzing operations
JP2017069840A (ja) 画像処理装置
US11557108B2 (en) Polygon detection device, polygon detection method, and polygon detection program
JP7067608B2 (ja) 情報処理システム
US20140215320A1 (en) Marker placement support apparatus, marker placement support method, and non-transitory computer readable medium
JP2022014793A (ja) 情報処理装置、情報処理方法、及びプログラム
US20150234517A1 (en) Display apparatus and method and computer program product

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190826

R151 Written notification of patent or utility model registration

Ref document number: 6586847

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151