JP2012181765A5 - - Google Patents

Download PDF

Info

Publication number
JP2012181765A5
JP2012181765A5 JP2011045513A JP2011045513A JP2012181765A5 JP 2012181765 A5 JP2012181765 A5 JP 2012181765A5 JP 2011045513 A JP2011045513 A JP 2011045513A JP 2011045513 A JP2011045513 A JP 2011045513A JP 2012181765 A5 JP2012181765 A5 JP 2012181765A5
Authority
JP
Japan
Prior art keywords
feature
feature point
document image
data set
invariant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011045513A
Other languages
English (en)
Other versions
JP2012181765A (ja
JP5660574B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2011045513A priority Critical patent/JP5660574B2/ja
Priority claimed from JP2011045513A external-priority patent/JP5660574B2/ja
Publication of JP2012181765A publication Critical patent/JP2012181765A/ja
Publication of JP2012181765A5 publication Critical patent/JP2012181765A5/ja
Application granted granted Critical
Publication of JP5660574B2 publication Critical patent/JP5660574B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

この発明は、
(I)コンピュータが、文書画像データベースに登録すべき文書画像から、その文書画像の局所的特徴を表す特徴点を抽出する特徴点抽出ステップと、幾何学的変換に対する不変量を用いた各特徴点の特徴量であって、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とする特徴量計算ステップと、前記文書画像から抽出された各特徴点について、(1)前記文書画像の参照に用いる参照子、(2)その特徴点を他の特徴点と区別する識別子および(3)その特徴点の特徴量の前記(1)〜(3)を関連付けてなるデータ組を生成し、前記データ組を前記文書画像と共に前記文書画像データベースに登録する登録ステップとを実行し、前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、所定面積より小さい連結成分の重心を特徴点として抽出し、抽出された特徴点の数が閾値に満たないとき、各特徴点の近傍にある連結成分の重心をさらに特徴点として抽出して閾値以上の特徴点が得られるように抽出し、前記特徴量計算ステップは、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算することを特徴とする文書画像データベースの登録方法を提供する。
さらに、この発明は、
(II)コンピュータが、検索質問として取り込まれた文書画像から、その文書画像の局所的特徴を表す複数のクエリ特徴点を抽出する特徴点抽出ステップと、各クエリ特徴点に係るクエリ特徴量を計算する特徴量計算ステップと、前記登録方法により文書画像が登録された文書画像データベースを参照し、その文書画像データベースに登録されているデータ組の中から、各クエリ特徴点と同一もしくは類似の特徴量を有するデータ組を探索し、見出されたデータ組の参照子を得る個別探索ステップと、各クエリ特徴点について探索を行い、得られた各文書識別子を統計的に処理し、検索結果として推奨すべき文書画像を特定する投票ステップとを実行し、前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、前記特徴量計算ステッ

プは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、かつ、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とすることを特徴とする文書画像の検索方法を提供する。
また、この発明は、
(III)コンピュータが、文書画像データベースに登録すべき文書画像から、その文書画像の局所的特徴を表す特徴点を抽出する特徴点抽出ステップと、幾何学的変換に対する不変量を用いた各特徴点の特徴量であって、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とする特徴量計算ステップと、前記文書画像から抽出された各特徴点について、(1)前記文書画像の参照に用いる参照子、(2)その特徴点を他の特徴点と区別する識別子および(3)その特徴点の特徴量の前記(1)〜(3)を関連付けてなるデータ組を生成し、前記データ組を前記文書画像と共に前記文書画像データベースに登録する登録ステップとを実行し、前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、所定面積より小さい連結成分の重心を特徴点として抽出し、抽出された特徴点の数が閾値に満たないとき、各特徴点の近傍にある連結成分の重心をさらに特徴点として抽出して閾値以上の特徴点が得られるように抽出する文書画像データベースの登録方法を提供する。
さらに、この発明は、
(IV)コンピュータが、検索質問として取り込まれた文書画像から、その文書画像の局所的特徴を表す複数のクエリ特徴点を抽出する特徴点抽出ステップと、各クエリ特徴点に係るクエリ特徴量を計算する特徴量計算ステップと、前記登録方法により文書画像が登録された文書画像データベースを参照し、その文書画像データベースに登録されているデータ組の中から、各クエリ特徴点と同一もしくは類似の特徴量を有するデータ組を探索し、見出されたデータ組の参照子を得る個別探索ステップと、各クエリ特徴点について探索を行い、得られた各文書識別子を統計的に処理し、検索結果として推奨すべき文書画像を特定する投票ステップとを実行し、前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、前記特徴量計算ステップは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とすることを特徴とする文書画像の検索方法を提供する。
この発明の検索方法において、インデックスに応じた類にデータ組が分類されて登録された文書画像データベースの検索方法については、前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、前記特徴量計算ステップは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、かつ、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とし、前記個別探索ステップは、前記登録方法に対応する計算によって各クエリ特徴点のインデックスを得、そのインデックスに係る類として登録されたデータ組を参照し、そのデータ組が簡易特徴量を有する場合は前記クエリ特徴点に係る簡易特徴量を求めたうえで同一もしくは最も類似の簡易特徴量を有するデータ組に係る参照子を得、登録されたデータ組が特徴量を有する場合は同一もしくは最も類似の特徴量を有するデータ組に係る参照子を得るようにしてもよい。このようにすれば、インデックスに応じた類にデータ組が分類されて登録された文書画像データベースについても検索方法が提供される。データ組が分類されているので、短時間に検索を行うことができる。

Claims (9)

  1. コンピュータが、
    文書画像データベースに登録すべき文書画像から、その文書画像の局所的特徴を表す特徴点を抽出する特徴点抽出ステップと、
    幾何学的変換に対する不変量を用いた各特徴点の特徴量であって、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とする特徴量計算ステップと、
    前記文書画像から抽出された各特徴点について、(1)前記文書画像の参照に用いる参照子、(2)その特徴点を他の特徴点と区別する識別子および(3)その特徴点の特徴量の前記(1)〜(3)を関連付けてなるデータ組を生成し、前記データ組を前記文書画像と共に前記文書画像データベースに登録する登録ステップとを実行し、
    前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、所定面積より小さい連結成分の重心を特徴点として抽出し、抽出された特徴点の数が閾値に満たないとき、各特徴点の近傍にある連結成分の重心をさらに特徴点として抽出して閾値以上の特徴点が得られるように抽出し、
    前記特徴量計算ステップは、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算することを特徴とする文書画像データベースの登録方法。
  2. 前記登録ステップは、(1)前記参照子、(2)前記識別子および(3)前記特徴量またはその特徴量を簡略化した簡易特徴量の前記(1)〜(3)を関連付けてなるデータ組を生成し、前記特徴量に応じて各特徴点を分類すべく予め定義された計算を行ってその特徴点が属する類のインデックスを得、インデックスに応じた類に前記データ組を分類し、前記文書画像と共に前記文書画像データベースに登録する請求項1に記載の登録方法。
  3. 前記特徴量計算ステップは、3つの特徴点を頂点とする三角形を前記幾何学的要素としてその三角形の面積を前記特性値とし、4つ以上の特徴点の何れか3点を頂点とする三角形の組み合わせのうち一辺を共有する2つの三角形の面積比を一つの不変量とする請求項1または2に記載の登録方法。
  4. コンピュータが、
    検索質問として取り込まれた文書画像から、その文書画像の局所的特徴を表す複数のクエリ特徴点を抽出する特徴点抽出ステップと、
    各クエリ特徴点に係るクエリ特徴量を計算する特徴量計算ステップと、
    請求項1に記載の登録方法により文書画像が登録された文書画像データベースを参照し、その文書画像データベースに登録されているデータ組の中から、各クエリ特徴点と同一もしくは類似の特徴量を有するデータ組を探索し、見出されたデータ組の参照子を得る個別探索ステップと、
    各クエリ特徴点について探索を行い、得られた各文書識別子を統計的に処理し、検索結果として推奨すべき文書画像を特定する投票ステップとを実行し、
    前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、
    前記特徴量計算ステップは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、かつ、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とすることを特徴とする文書画像の検索方法。
  5. コンピュータが、
    検索質問として取り込まれた文書画像から、その文書画像の局所的特徴を表す複数のクエリ特徴点を抽出する特徴点抽出ステップと、
    各クエリ特徴点に係るクエリ特徴量を計算する特徴量計算ステップと、
    請求項2に記載の登録方法により文書画像が登録された文書画像データベースを参照し、その文書画像データベースに登録されている特徴点の中から、各クエリ特徴点と局所的特徴が類似する特徴点を探索し、見出された類似の特徴点に関連づけられた参照子を得る個別探索ステップと、
    各クエリ特徴点について探索を行い、得られた各文書識別子を統計的に処理し、検索結果として推奨すべき文書画像を特定する投票ステップとを実行し、
    前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、
    前記特徴量計算ステップは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、かつ、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とし、
    前記個別探索ステップは、請求項2に記載の登録方法に対応する計算によって各クエリ特徴点のインデックスを得、そのインデックスに係る類として登録されたデータ組を参照し、そのデータ組が簡易特徴量を有する場合は前記クエリ特徴点に係る簡易特徴量を求めたうえで同一もしくは最も類似の簡易特徴量を有するデータ組に係る参照子を得、登録されたデータ組が特徴量を有する場合は同一もしくは最も類似の特徴量を有するデータ組に係る参照子を得ることを特徴とする文書画像の検索方法。
  6. 前記特徴量計算ステップは、3つの特徴点を頂点とする三角形を前記幾何学的要素としてその三角形の面積を前記特性値とし、4つ以上の特徴点の何れか3点を頂点とする三角形の組み合わせのうち一辺を共有する2つの三角形の面積比を一つの不変量とする請求項4または5に記載の検索方法。
  7. コンピュータが、
    文書画像データベースに登録すべき文書画像から、その文書画像の局所的特徴を表す特徴点を抽出する特徴点抽出ステップと、
    幾何学的変換に対する不変量を用いた各特徴点の特徴量であって、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とする特徴量計算ステップと、
    前記文書画像から抽出された各特徴点について、(1)前記文書画像の参照に用いる参照子、(2)その特徴点を他の特徴点と区別する識別子および(3)その特徴点の特徴量の前記(1)〜(3)を関連付けてなるデータ組を生成し、前記データ組を前記文書画像と共に前記文書画像データベースに登録する登録ステップとを実行し、
    前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、所定面積より小さい連結成分の重心を特徴点として抽出し、抽出された特徴点の数が閾値に満たないとき、各特徴点の近傍にある連結成分の重心をさらに特徴点として抽出して閾値以上の特徴点が得られるように抽出することを特徴とする文書画像データベースの登録方法。
  8. コンピュータが、
    検索質問として取り込まれた文書画像から、その文書画像の局所的特徴を表す複数のクエリ特徴点を抽出する特徴点抽出ステップと、
    各クエリ特徴点に係るクエリ特徴量を計算する特徴量計算ステップと、
    請求項1に記載の登録方法により文書画像が登録された文書画像データベースを参照し、その文書画像データベースに登録されているデータ組の中から、各クエリ特徴点と同一もしくは類似の特徴量を有するデータ組を探索し、見出されたデータ組の参照子を得る個別探索ステップと、
    各クエリ特徴点について探索を行い、得られた各文書識別子を統計的に処理し、検索結果として推奨すべき文書画像を特定する投票ステップとを実行し、
    前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、
    前記特徴量計算ステップは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、かつ、一の不変量に用いた幾何学的要素と重複しない幾何学的要素を他の不変量に用いて各不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とすることを特徴とする文書画像の検索方法。
  9. コンピュータが、
    検索質問として取り込まれた文書画像から、その文書画像の局所的特徴を表す複数のクエリ特徴点を抽出する特徴点抽出ステップと、
    各クエリ特徴点に係るクエリ特徴量を計算する特徴量計算ステップと、
    請求項8に記載の登録方法により文書画像が登録された文書画像データベースを参照し、その文書画像データベースに登録されているデータ組の中から、各クエリ特徴点と同一もしくは類似の特徴量を有するデータ組を探索し、見出されたデータ組の参照子を得る個別探索ステップと、
    各クエリ特徴点について探索を行い、得られた各文書識別子を統計的に処理し、検索結果として推奨すべき文書画像を特定する投票ステップとを実行し、
    前記特徴点抽出ステップは、文書を構成する線の連結成分を決定し、各連結成分の重心を特徴点として抽出し、
    前記特徴量計算ステップは、各特徴点とその近傍n 個(n は自然数)の特徴点とで定まる複数の幾何学的要素に対して所定の演算によりそれぞれの特性値を求め、それらの特性値を組み合わせてなる複数の不変量を計算し、算出された不変量を各次元とするベクトルを前記特徴量とすることを特徴とする文書画像の検索方法。
JP2011045513A 2011-03-02 2011-03-02 文書画像データベースの登録方法および検索方法 Expired - Fee Related JP5660574B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011045513A JP5660574B2 (ja) 2011-03-02 2011-03-02 文書画像データベースの登録方法および検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011045513A JP5660574B2 (ja) 2011-03-02 2011-03-02 文書画像データベースの登録方法および検索方法

Publications (3)

Publication Number Publication Date
JP2012181765A JP2012181765A (ja) 2012-09-20
JP2012181765A5 true JP2012181765A5 (ja) 2014-04-03
JP5660574B2 JP5660574B2 (ja) 2015-01-28

Family

ID=47012893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011045513A Expired - Fee Related JP5660574B2 (ja) 2011-03-02 2011-03-02 文書画像データベースの登録方法および検索方法

Country Status (1)

Country Link
JP (1) JP5660574B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101133429B (zh) * 2005-03-01 2010-10-06 公立大学法人大阪府立大学 文档和/或图像检索方法、文档和/或图像存储设备和检索设备
JP5096776B2 (ja) * 2007-04-04 2012-12-12 キヤノン株式会社 画像処理装置及び画像検索方法
JP5004082B2 (ja) * 2007-07-27 2012-08-22 公立大学法人大阪府立大学 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置
JP4958228B2 (ja) * 2007-09-12 2012-06-20 公立大学法人大阪府立大学 文書および/または画像のデータベースへの登録方法およびその検索方法
US8233722B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated Method and system for finding a document image in a document collection using localized two-dimensional visual fingerprints

Similar Documents

Publication Publication Date Title
Sattler et al. Hyperpoints and fine vocabularies for large-scale location recognition
JP2013536958A5 (ja)
JP2018522339A (ja) 商品画像特徴に基づく個性化捜索装置および方法
JP2012521598A5 (ja)
JP2012208604A5 (ja)
CN104090882B (zh) 一种广告订单的快速聚类方法及系统、服务器
CN104081435A (zh) 一种基于级联二值编码的图像匹配方法
TWI536186B (zh) 三維圖檔搜尋方法與三維圖檔搜尋系統
CN103226584B (zh) 形状描述符的构建方法及基于该描述符的图像检索方法
Mouine et al. Plant species recognition using spatial correlation between the leaf margin and the leaf salient points
JP2018045302A5 (ja)
JP2015127936A5 (ja)
JP2013257761A5 (ja)
JP2015204023A5 (ja)
CN104156362B (zh) 一种大规模图像特征点匹配方法
CN104835174A (zh) 基于超图模式搜索的鲁棒模型拟合方法
JP2013059659A5 (ja)
JP2014225168A (ja) 特徴点集合で表される画像間の類似度を算出するプログラム、装置及び方法
JP2014115737A (ja) 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム
CN104298975B (zh) 一种分布式图像识别方法
JP2012181765A5 (ja)
Hauff et al. WISTUD at MediaEval 2011: Placing Task.
CN108304838B (zh) 一种图片信息识别方法及终端
Hsu et al. Clothing image retrieval for smarter shopping
CN107203561B (zh) 一种数据处理方法和设备