JP7197263B2 - 画像解析方法およびプログラム - Google Patents

画像解析方法およびプログラム Download PDF

Info

Publication number
JP7197263B2
JP7197263B2 JP2017201939A JP2017201939A JP7197263B2 JP 7197263 B2 JP7197263 B2 JP 7197263B2 JP 2017201939 A JP2017201939 A JP 2017201939A JP 2017201939 A JP2017201939 A JP 2017201939A JP 7197263 B2 JP7197263 B2 JP 7197263B2
Authority
JP
Japan
Prior art keywords
image
partial image
candidate
partial
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017201939A
Other languages
English (en)
Other versions
JP2019074998A (ja
Inventor
和彦 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2017201939A priority Critical patent/JP7197263B2/ja
Priority to PCT/JP2018/037850 priority patent/WO2019078072A1/ja
Publication of JP2019074998A publication Critical patent/JP2019074998A/ja
Priority to US16/852,596 priority patent/US11398100B2/en
Priority to JP2022107040A priority patent/JP2022153394A/ja
Application granted granted Critical
Publication of JP7197263B2 publication Critical patent/JP7197263B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/759Region-based matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Auxiliary Devices For Music (AREA)

Description

本発明は、楽譜または書籍等の書面を撮像した画像を解析する技術に関する。
利用者の所望の楽曲を検索する技術が従来から提案されている。例えば特許文献1には、利用者が順次に指定した音符の時系列を含む楽曲を複数の候補から検索する技術が開示されている。
特開平6-110945号公報
特許文献1の技術のもとでは、所望の楽曲の音符を指定するための音楽的な知識が利用者に必要であり、所望の楽曲を検索できる場面は実際には制限されるという問題がある。なお、以上の説明では楽曲の検索を例示したが、例えば利用者の所望の文字列を含む文書(例えば書籍)を検索する場合にも同様の問題が発生し得る。以上の事情を考慮して、本発明の好適な態様は、利用者の所望の情報を簡便に特定することを目的とする。
以上の課題を解決するために、本発明の好適な態様に係る画像解析方法は、平面状に形成された被写体の一部を撮像した部分画像を解析し、前記部分画像の解析結果に基づいて、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する。
本発明の好適な態様に係るプログラムは、平面状に形成された被写体の一部を撮像した部分画像を解析する処理と、前記部分画像の解析結果に基づいて、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する処理とをコンピュータに実行させる。
本発明の第1実施形態に係る画像解析装置の構成を示すブロック図である。 部分楽譜の説明図である。 楽譜データの模式図である。 解析データの説明図である。 制御装置の機能的な構成を示すブロック図である。 画像解析処理のフローチャートである。 第2実施形態に係る画像解析装置の構成を示すブロック図である。
<第1実施形態>
図1は、本発明の第1実施形態に係る画像解析装置100Aの構成を例示するブロック図である。図1に例示される通り、第1実施形態の画像解析装置100Aは、制御装置11と記憶装置12と撮像装置13と表示装置14とを具備するコンピュータシステムで実現される。例えば携帯電話機もしくはスマートフォン等の可搬型の情報端末、またはパーソナルコンピュータ等の可搬型または据置型の情報端末が、画像解析装置100Aとして好適に利用され得る。
撮像装置13は、画像を撮像するための画像入力機器であり、被写体からの入射光を電気信号に変換する撮像素子を具備する。具体的には、撮像装置13は、撮影レンズ等の光学系の画角に応じた撮像範囲内の被写体を表す画像データを生成する。なお、画像データの形式は任意である。また、第1実施形態では撮像装置13が画像解析装置100Aに搭載された構成を例示するが、画像解析装置100Aとは別体の撮像装置13を画像解析装置100Aに有線または無線で接続してもよい。
第1実施形態の撮像装置13は、利用者からの指示に応じて任意の楽曲の楽譜Mを撮像する。第1実施形態では、図2に例示される通り、書面に印刷された楽譜Mの全体のうちの撮像範囲内の部分(以下「部分楽譜」という)Qが撮像装置13により撮像された場合を想定する。第1実施形態の画像解析装置100Aは、楽譜の1頁分を表す複数の画像(以下「候補楽譜」という)のうち部分楽譜Qに対応する部分を含む候補楽譜(以下「目標楽譜」という)を検索する。具体的には、部分楽譜Qに類似または一致する部分を含む目標楽譜が検索される。以上の説明から理解される通り、第1実施形態の画像解析装置100Aは、撮像装置13により撮像された部分楽譜Qと楽曲が共通する候補楽譜を目標楽譜として複数の候補楽譜から検索する。
図2に例示される通り、撮像装置13により撮像される楽譜Mは、相互に間隔をあけて縦方向に並列に配置された複数の譜表F(具体的には五線譜)を含む。複数の譜表Fの各々は、相異なる音高を表す横方向の複数の直線で構成される。ト音記号またはヘ音記号等の音部記号と音符または休符等の符号とを含む複数の楽譜要素が、複数の譜表Fの各々に対して配置される。部分楽譜Q(部分画像の一例)は、楽譜Mのうち譜表Fの一部を含む範囲内の画像である。
表示装置14は、制御装置11による制御のもとで各種の画像を表示する。例えば液晶表示パネルまたは有機EL(Electroluminescence)表示パネルが表示装置14として好適に利用される。記憶装置12は、制御装置11が実行するプログラムと制御装置11が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置12として任意に採用され得る。
第1実施形態の記憶装置12は、相異なる候補楽譜(すなわち楽譜の1頁分)に対応する複数の楽譜データDを複数の楽曲の各々について記憶する。任意の1個の楽譜データDは、図3に例示される通り、楽譜画像データXと付属データYと解析データZとを含む。
楽譜画像データXは、候補楽譜を表す画像データである。例えばPDF形式等の任意の形式の画像データが楽譜画像データXとして利用される。付属データYは、候補楽譜に関する付属的なデータである。例えば、付属データYは、候補楽譜に対応する楽曲を識別するための情報(例えば楽曲名)と、当該楽曲の楽譜を構成する複数頁のうち当該候補楽譜が表す頁の番号とを指定する。なお、例えば候補楽譜に対応する楽譜が掲載された書籍(楽譜集)を識別するための情報を付属データYに含めてもよい。解析データZは、候補楽譜が表す1頁分の楽譜の内容を表すデータである。
図4は、候補楽譜の解析データZ(候補画像解析データの一例)を説明するための模式図である。図2を参照して前述した通り、楽譜Mの各頁には、複数の譜表Fと複数の楽譜要素(音部記号または符号)とが配置される。図4には、楽譜Mから抽出された複数の特徴点Pa(すなわち画像上の特徴的な地点)と、譜表Fを構成する複数の直線Lに沿う基準線Rとが図示されている。図4の射影点Pbは、1個の特徴点Paを基準線Rに射影(詳細には正射影)した地点である。すなわち、射影点Pbは、1個の特徴点Paを通過する基準線Rの垂線と当該基準線Rとの交点(垂線の足)である。第1実施形態の解析データZは、楽譜Mから抽出された相異なる特徴点Paに対応する複数の射影点Pbの集合(すなわち点群)を表すベクトルデータである。楽譜Mの1頁分に含まれる複数の譜表Fの各々に対応する解析データZが楽譜データDに含まれる。以上の説明から理解される通り、候補楽譜の解析データZは、当該候補画像から抽出された特徴点Paを基準線Rに射影した結果を表すデータである。
図3に例示される通り、解析データZは、複数の射影点Pbの各々について、当該射影点Pbの識別情報(例えば番号)z1と、当該射影点Pbの位置(座標)z2と、当該射影点Pbの近傍に位置する1個以上の射影点Pbの識別情報z3(=z1)とを含む。以上の説明から理解される通り、各射影点Pbについて近傍の射影点Pbの識別情報z3が登録されるから、ひとつの譜表Fに対応する複数の射影点Pbの相互間の位置関係を簡便に把握できるという利点がある。
図1の制御装置11は、例えばCPU(Central Processing Unit)等の処理回路であり、画像解析装置100Aの各要素を統括的に制御する。第1実施形態の制御装置11は、図5に例示される通り、記憶装置12に記憶されたプログラムを実行することで、撮像装置13により撮像された部分楽譜Qに対応する部分を含む目標楽譜を検索するための複数の要素(解析処理部31および特定処理部32)を実現する。なお、制御装置11の機能を複数の装置の集合(すなわちシステム)で実現してもよいし、制御装置11の機能の一部または全部を専用の電子回路で実現してもよい。
解析処理部31は、撮像装置13が撮像した部分楽譜Qを解析することで当該部分楽譜Qの解析データZ(部分画像解析データの一例)を生成する。特定処理部32は、相異なる候補楽譜について記憶装置12に記憶された複数の解析データZの各々と解析処理部31が生成した解析データZとを相互に対比することで、部分楽譜Qに対応する部分を含む候補楽譜を目標楽譜として特定する。
図6は、制御装置11が部分楽譜Qから目標楽譜を特定する処理(以下「画像解析処理」という)の具体的な内容を例示するフローチャートである。例えば撮像装置13により部分楽譜Qが撮像されるたびに画像解析処理が実行される。したがって、複数の部分楽譜Qの時系列で構成される動画像を撮像する場合、図6の画像解析処理が部分楽譜Q毎に順次に実行されて目標楽譜が特定される。
画像解析処理を開始すると、解析処理部31は、部分楽譜Qの解析により解析データZを生成する(Sa1~Sa6)。部分楽譜Qを解析する処理は、縮小処理Sa1と設定処理Sa2と抽出処理Sa3と区分処理Sa4と射影処理Sa5と生成処理Sa6とを含む。縮小処理Sa1は、部分楽譜Qを縮小する処理である。縮小処理Sa1には公知の画像縮小技術が任意に採用される。なお、縮小処理Sa1を省略してもよい。
解析処理部31は、撮像装置13が撮像した部分楽譜Qについて基準線Rを設定する(設定処理Sa2)。具体的には、解析処理部31は、譜表Fを構成する各直線Lを部分楽譜Qから抽出し、複数の直線Lに平行な基準線Rを設定する。例えば、解析処理部31は、部分楽譜Qから抽出された横方向の複数の直線Lを譜表F毎に区分(クラスタリング)し、縦方向における譜表Fの中点を通過するとともに当該譜表Fの各直線Lに沿って横方向に延在する基準線Rを設定する。以上の説明から理解される通り、制御装置11は、部分楽譜Qに含まれる直線Lに対応した基準線Rを設定する要素(基準線設定部)として機能する。
解析処理部31は、撮像装置13が撮像した部分楽譜Qから複数の特徴点Paを抽出する(抽出処理Sa3)。特徴点Paの抽出には、SIFT(Scale-Invariant Feature Transform)、SURF(Speeded Up Robust Features)、KAZE(KAZE Features)、またはAKAZE(Accelerated KAZE)等の公知の画像解析技術が任意に採用される。以上の説明から理解される通り、制御装置11は、部分楽譜Qから複数の特徴点Paを抽出する要素(特徴点抽出部)として機能する。なお、設定処理Sa2および抽出処理Sa3の順序を逆転してもよい。
解析処理部31は、抽出処理Sa3で抽出した複数の特徴点Paを譜表F毎に複数の集合(クラスタ)に区分する(区分処理Sa4)。区分処理Sa4には公知の分類技術(クラスタリング)が任意に採用される。部分楽譜Qに1個の譜表Fのみが含まれる場合には、区分処理Sa4を省略してもよい。
以上の処理(Sa1~Sa4)が完了すると、解析処理部31は、部分楽譜Qに含まれる譜表F毎に、複数の特徴点Paを基準線Rに射影することで複数の射影点Pbを特定する(射影処理Sa5)。すなわち、解析処理部31は、任意の1個の譜表Fの付近から抽出処理Sa3で抽出した複数の特徴点Paの各々を、設定処理Sa2で設定した基準線Rに正射影することで、複数の射影点Pbを特定する。以上の説明から理解される通り、制御装置11は、複数の特徴点Paを基準線Rに射影する要素(特徴点射影部)として機能する。
解析処理部31は、射影処理Sa5で特定した複数の射影点Pbを表す解析データZを生成する(生成処理Sa6)。すなわち、制御装置11は、射影後の各特徴点Pa(すなわち射影点Pb)を表す解析データZを生成する要素(生成処理部)として機能する。解析処理部31が部分楽譜Qの解析により解析データZを生成する処理(Sa1~Sa6)の具体例は以上の通りである。なお、各候補楽譜の解析データZは、以上に例示した処理(Sa1~Sa6)を候補楽譜について実行することで生成されて記憶装置12に格納される。
解析処理部31が以上の処理により部分楽譜Qの解析データZを生成すると、特定処理部32は、以下に詳述する通り、相異なる候補楽譜について記憶装置12に記憶された複数の解析データZの各々と、解析処理部31が生成した解析データZとを相互に対比することで、部分楽譜Qに対応する部分を含む候補楽譜を目標楽譜として特定する(Sb1~Sb4)。
特定処理部32は、複数の候補楽譜の何れかを選択し(Sb1)、当該候補楽譜の解析データZと部分楽譜Qの解析データZとの間で類似指標を算定する(Sb2)。類似指標は、候補楽譜の解析データZと部分楽譜Qの解析データZとの間の類似の度合を示す指標である。2個のベクトルの相互間の距離または相関を示す任意の指標が類似指標として好適である。以下の説明では、候補楽譜の解析データZと部分楽譜Qの解析データZとが類似するほど類似指標が大きい数値となる場合を想定する。
特定処理部32は、全部の候補楽譜について部分楽譜Qとの間の類似指標を算定したか否かを判定する(Sb3)。類似指標を算定していない候補楽譜がある場合(Sb3:NO)、特定処理部32は、未選択の候補楽譜を新たに選択したうえで、当該候補楽譜の解析データZと部分楽譜Qの解析データZとの類似指標を算定する(Sb2)。
以上に例示した処理が反復されることで全部の候補楽譜について類似指標を算定すると(Sb3:YES)、特定処理部32は、複数の候補楽譜のうち類似指標が最大となる候補楽譜を目標楽譜として特定する(Sb4)。すなわち、複数の候補楽譜のうち部分楽譜Qに対応する部分を含む候補楽譜が目標楽譜として特定される。特定処理部32は、目標楽譜の楽譜データDを記憶装置12から取得し、当該楽譜データDの楽譜画像データXが表す目標楽譜の画像と、当該楽譜データDの付属データYが表す情報(楽曲名および頁番号)とを表示装置14に表示させる(Sc)。
以上に説明した通り、第1実施形態では、楽譜Mの一部を撮像した部分楽譜Qの解析により、当該部分画像に対応する部分を含む目標楽譜が特定される。したがって、例えば利用者が楽譜Mの様々な範囲を撮影した画像から目標画像を特定することが可能である。また、楽譜の特徴点Paを基準線Rに射影した射影点Pbを表す解析データZを部分楽譜Qと候補楽譜との間で対比することで、目標楽譜を高精度に特定できるという利点もある。
<第2実施形態>
図7は、本発明の第2実施形態における画像解析装置100Bの構成を示すブロック図である。第2実施形態の画像解析装置100Bは、移動体通信網およびインターネット等を含む通信網42を介して端末装置40と通信可能なサーバ装置(例えばウェブサーバ)で実現される。端末装置40は、撮像装置13と表示装置14とを具備する。第1実施形態と同様に、撮像装置13は、楽譜Mの一部である部分楽譜Qを撮像し、表示装置14は、楽譜画像データXが表す楽譜(例えば目標楽譜)を表示する。
撮像装置13が撮像した部分楽譜Qを表す画像データが端末装置40から画像解析装置100Bに送信される。画像解析装置100Bは、端末装置40から送信された画像データを受信し、当該画像データが表す部分楽譜Qに対応する部分を含む目標楽譜を特定する。具体的には、画像解析装置100Bは、第1実施形態と同様の制御装置11および記憶装置12を具備する。記憶装置12は、相異なる候補楽譜に対応する複数の楽譜データDを記憶する。制御装置11は、部分楽譜Qから目標楽譜を特定する図6の画像解析処理を実行する。制御装置11が特定した目標楽譜の楽譜画像データXと付属データYとが端末装置40に送信される。端末装置40の表示装置14は、楽譜画像データXが表す楽譜の画像と、付属データYが表す情報(例えば楽曲名および頁番号)とを表示する。第2実施形態においても第1実施形態と同様の効果が実現される。
<変形例>
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
(1)前述の各形態では、譜表Fを構成する各直線Lに平行な直線を基準線Rとして特定したが、基準線Rを特定する方法は以上の例示に限定されない。例えば利用者が基準線Rを指定してもよい。また、例えば楽譜Mが掲載された書面の縁辺が部分楽譜Qに含まれる場合に、当該縁辺に沿う基準線Rを設定してもよい。
(2)前述の各形態では、複数の候補楽譜の各々に関する解析データZが記憶装置12に事前に記憶された構成を例示したが、目標楽譜の検索の段階(例えば部分楽譜Qの解析前)において候補楽譜の解析により当該候補楽譜の解析データZを生成してもよい。例えば、制御装置11(解析処理部31)は、楽譜画像データXが表す各候補楽譜について図6の解析処理(Sa1~Sa6)を実行することで、当該候補楽譜の解析データZを生成する。候補楽譜の解析データZ(候補画像解析データの一例)と部分楽譜Qの解析データZとを特定処理部32が対比することで目標楽譜を特定する処理(Sb1~Sb4)は前述の各形態と同様である。
(3)前述の各形態では、部分楽譜Qに対応した部分を含む目標楽譜を特定したが、本発明が適用される分野は楽譜の検索に限定されない。例えば、書籍等の文書の一部を撮像した部分画像から当該部分画像を含む候補画像(例えば文書の1頁分)を特定するために、本発明を適用してもよい。書籍等の文書の部分画像を解析する場合には、例えば複数の文字が配列する方向に平行な直線、または利用者が指定した直線が、基準線Rとして好適である。以上の構成によれば、文書の一部を撮像した部分画像から、当該部分画像に対応した部分を含む文書全体を特定することが可能である。以上の説明から理解される通り、本発明の好適な態様は、平面状に形成された被写体(例えば楽譜または文書)の一部を撮像した部分画像を解析することで、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する画像解析方法である。前述の各形態で説明した部分楽譜は「部分画像」の一例であり、前述の各形態で説明した候補楽譜は「候補画像」の一例である。
(4)前述の各形態に係る画像解析装置100(100A,100B)は、各形態での例示の通り、制御装置11とプログラムとの協働により実現される。前述の各形態に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体を含み得る。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体を除外するものではない。また、通信網を介した配信の形態でプログラムをコンピュータに提供することも可能である。
(5)以上に例示した形態から、例えば以下の構成が把握される。
本発明の好適な態様(第1態様)に係る画像解析方法は、平面状に形成された被写体の一部を撮像した部分画像を解析し、前記部分画像の解析結果に基づいて、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する。以上の態様によれば、被写体の一部を撮像した部分画像の解析により、当該部分画像に対応する部分を含む候補画像が特定されるから、例えば利用者が撮影した様々な画像から候補画像を特定することが可能である。
第1態様の好適例(第2態様)において、前記部分画像の解析では、前記部分画像から複数の特徴点を抽出し、前記複数の特徴点を基準線に射影し、前記射影後の各特徴点を表す部分画像解析データを生成する。第2態様の好適例(第3態様)において、前記候補画像の特定では、複数の候補画像の各々について、当該候補画像から抽出された特徴点を基準線に射影した結果を表す候補画像解析データと、前記部分画像解析データとを対比することで、前記部分画像に対応する部分を含む候補画像を特定する。以上の態様では、部分画像から抽出された複数の特徴点を基準線に射影した結果を表す解析データが、相異なる候補画像に対応する複数の解析データの各々と対比される。したがって、部分画像に対応する部分を含む候補画像を高精度に特定できるという利点がある。
第2態様または第3態様の好適例(第4態様)において、前記部分画像の解析では、前記部分画像に含まれる直線に対応した前記基準線を設定する。以上の態様では、部分画像に含まれる直線に対応した基準線が設定されるから、例えば利用者が基準線を設定する必要がないという利点がある。
第1態様から第4態様の何れかの好適例(第5態様)において、前記被写体は楽譜である。以上の態様によれば、楽譜の一部を撮像した部分画像から、当該部分画像に対応した部分を含む楽譜を特定することが可能である。
本発明の好適な態様(第6態様)に係るプログラムは、平面状に形成された被写体の一部を撮像した部分画像を解析することで、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する画像解析処理をコンピュータに実行させる。
100A,100B…画像解析装置、11…制御装置、12…記憶装置、13…撮像装置、14…表示装置、31…解析処理部、32…特定処理部、40…端末装置、M…楽譜(被写体)、F…譜表、Q…部分楽譜(部分画像)、R…基準線、Pa…特徴点、Pb…射影点。

Claims (5)

  1. 平面状に形成された被写体の一部を撮像した部分画像を解析し、
    前記部分画像の解析結果に基づいて、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する
    コンピュータにより実現される画像解析方法であって、
    前記部分画像の解析においては、
    前記部分画像から複数の特徴点を抽出し、
    前記複数の特徴点を基準線に射影した複数の射影点を表す部分画像解析データを生成し、
    前記部分画像解析データは、前記複数の射影点の各々について、当該射影点の識別情報と、当該射影点の位置と、当該射影点の近傍に位置する1以上の射影点の識別情報と、を含む
    画像解析方法。
  2. 前記候補画像の特定においては、
    複数の候補画像の各々について、当該候補画像から抽出された特徴点を基準線に射影した結果を表す候補画像解析データと、前記部分画像解析データとを対比することで、前記部分画像に対応する部分を含む候補画像を特定する
    請求項の画像解析方法。
  3. 前記部分画像の解析においては、
    前記部分画像に含まれる直線に対応した前記基準線を設定する
    請求項または請求項の画像解析方法。
  4. 前記被写体は楽譜である
    請求項1から請求項の何れかの画像解析方法。
  5. 平面状に形成された被写体の一部を撮像した部分画像を解析する処理と、
    前記部分画像の解析結果に基づいて、複数の候補画像のうち当該部分画像に対応する部分を含む候補画像を特定する処理と
    をコンピュータに実行させるプログラムであって、
    前記部分画像を解析する処理においては、
    前記部分画像から複数の特徴点を抽出し、
    前記複数の特徴点を基準線に射影した複数の射影点を表す部分画像解析データを生成し、
    前記部分画像解析データは、前記複数の射影点の各々について、当該射影点の識別情報と、当該射影点の位置と、当該射影点の近傍に位置する1以上の射影点の識別情報と、を含む
    プログラム。
JP2017201939A 2017-10-18 2017-10-18 画像解析方法およびプログラム Active JP7197263B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017201939A JP7197263B2 (ja) 2017-10-18 2017-10-18 画像解析方法およびプログラム
PCT/JP2018/037850 WO2019078072A1 (ja) 2017-10-18 2018-10-11 画像解析方法、画像解析装置およびプログラム
US16/852,596 US11398100B2 (en) 2017-10-18 2020-04-20 Image analysis method and image analysis device for identifying musical information
JP2022107040A JP2022153394A (ja) 2017-10-18 2022-07-01 画像解析方法、画像解析装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017201939A JP7197263B2 (ja) 2017-10-18 2017-10-18 画像解析方法およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022107040A Division JP2022153394A (ja) 2017-10-18 2022-07-01 画像解析方法、画像解析装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2019074998A JP2019074998A (ja) 2019-05-16
JP7197263B2 true JP7197263B2 (ja) 2022-12-27

Family

ID=66174453

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017201939A Active JP7197263B2 (ja) 2017-10-18 2017-10-18 画像解析方法およびプログラム
JP2022107040A Pending JP2022153394A (ja) 2017-10-18 2022-07-01 画像解析方法、画像解析装置およびプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022107040A Pending JP2022153394A (ja) 2017-10-18 2022-07-01 画像解析方法、画像解析装置およびプログラム

Country Status (3)

Country Link
US (1) US11398100B2 (ja)
JP (2) JP7197263B2 (ja)
WO (1) WO2019078072A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7197263B2 (ja) * 2017-10-18 2022-12-27 ヤマハ株式会社 画像解析方法およびプログラム
CN112131424A (zh) * 2020-09-22 2020-12-25 深圳市天维大数据技术有限公司 一种分布式图像分析方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125281A (ja) 2011-12-13 2013-06-24 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2016200883A (ja) 2015-04-08 2016-12-01 大日本印刷株式会社 コンピュータプログラム及び画像処理装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110945A (ja) 1992-09-29 1994-04-22 Fujitsu Ltd 音楽データベース作成装置及びその検索装置
JP3744366B2 (ja) * 2001-03-06 2006-02-08 ヤマハ株式会社 楽曲データに基づく音楽記号自動決定装置、楽曲データに基づく楽譜表示制御装置、および、楽曲データに基づく音楽記号自動決定プログラム
JP4176364B2 (ja) * 2002-03-22 2008-11-05 富士通株式会社 画像対応付け装置及び画像対応付け方法並びに画像対応付けプログラム
US20040139843A1 (en) * 2003-01-21 2004-07-22 Marilyn Forster Music notation system
US7737354B2 (en) * 2006-06-15 2010-06-15 Microsoft Corporation Creating music via concatenative synthesis
JP2009151712A (ja) * 2007-12-21 2009-07-09 Canon Inc 楽譜作成方法及び画像処理システム
KR101459766B1 (ko) * 2008-02-12 2014-11-10 삼성전자주식회사 휴대 단말에서 자동반주 악보를 인식하는 방법
TWI386912B (zh) * 2009-06-12 2013-02-21 Univ Nat Taiwan Science Tech 即時辨識樂譜的方法與系統
US8119896B1 (en) * 2010-06-30 2012-02-21 Smith L Gabriel Media system and method of progressive musical instruction
JP2012215630A (ja) * 2011-03-31 2012-11-08 Kawai Musical Instr Mfg Co Ltd 楽譜演奏装置及び楽譜演奏プログラム
US10854498B2 (en) 2011-07-15 2020-12-01 Asm Ip Holding B.V. Wafer-supporting device and method for producing same
JP5598681B2 (ja) * 2012-04-25 2014-10-01 カシオ計算機株式会社 音符位置検出装置、音符位置推定方法およびプログラム
KR20140081212A (ko) * 2012-12-21 2014-07-01 곽희나 페이퍼 악보 연주장치
WO2015101908A1 (en) * 2013-12-31 2015-07-09 Tonara Ltd. System and method for optical music recognition
EP2919228B1 (en) * 2014-03-12 2016-10-19 NewMusicNow, S.L. Method, device and computer program for scrolling a musical score.
US9747876B1 (en) * 2015-07-28 2017-08-29 Amazon Technologies, Inc. Adaptive layout of sheet music in coordination with detected audio
WO2017057318A1 (ja) * 2015-09-30 2017-04-06 ヤマハ株式会社 再生制御方法及び再生制御システム
JP6746892B2 (ja) * 2015-09-30 2020-08-26 ヤマハ株式会社 画像処理装置、画像処理方法およびプログラム
US10665124B2 (en) * 2017-03-25 2020-05-26 James Wen System and method for linearizing musical scores
JP7197263B2 (ja) * 2017-10-18 2022-12-27 ヤマハ株式会社 画像解析方法およびプログラム
JP7087681B2 (ja) * 2018-05-30 2022-06-21 ヤマハ株式会社 画像処理方法、画像処理装置およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125281A (ja) 2011-12-13 2013-06-24 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2016200883A (ja) 2015-04-08 2016-12-01 大日本印刷株式会社 コンピュータプログラム及び画像処理装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山本 祐介、紙楽譜を用いた演奏メディアonNoteのためのマーカレス楽譜認識の提案、情報処理学会研究報告 平成22年度▲6▼ [DVD-ROM]、その他、2011.04.15発行

Also Published As

Publication number Publication date
JP2019074998A (ja) 2019-05-16
JP2022153394A (ja) 2022-10-12
WO2019078072A1 (ja) 2019-04-25
US11398100B2 (en) 2022-07-26
US20200250420A1 (en) 2020-08-06

Similar Documents

Publication Publication Date Title
JP2022153394A (ja) 画像解析方法、画像解析装置およびプログラム
JP6197631B2 (ja) 楽譜解析装置および楽譜解析方法
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US11461386B2 (en) Visual recognition using user tap locations
US11461390B2 (en) Automated cover song identification
CN105280170A (zh) 一种乐谱演奏的方法和装置
JP2011008752A (ja) ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム
WO2019230593A1 (ja) 画像処理方法および画像処理装置
JPWO2008143116A1 (ja) 文書検索装置及び文書検索方法
JP2015225669A (ja) 注釈表示支援装置及び注釈表示支援方法
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
JPWO2013115203A1 (ja) 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP6746892B2 (ja) 画像処理装置、画像処理方法およびプログラム
Deb et al. An image analysis approach for transcription of music played on keyboard-like instruments
Kodirov et al. Music with harmony: chord separation and recognition in printed music score images
Emad et al. Note Frequency Recognition and Finger Motion Capture of a Guitarist: A Survey and Challenges Ahead
Duke et al. Guitar tablature generation using computer vision
KR100983779B1 (ko) 도서 정보 서비스 장치 및 방법
CN112925944A (zh) 一种曲谱识别方法、终端设备及计算机可读存储介质
JP2024001050A (ja) ポインティングに基づく情報提供方法およびシステム
JP2728117B2 (ja) 文字認識装置
Pan et al. Musical examination to bridge audio data and sheet music

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220405

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220701

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220906

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20221011

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20221101

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20221213

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221215

R150 Certificate of patent or registration of utility model

Ref document number: 7197263

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150