JP2007164648A - 類似画像検索装置、類似画像検索方法、プログラム及び情報記録媒体 - Google Patents

類似画像検索装置、類似画像検索方法、プログラム及び情報記録媒体 Download PDF

Info

Publication number
JP2007164648A
JP2007164648A JP2005362728A JP2005362728A JP2007164648A JP 2007164648 A JP2007164648 A JP 2007164648A JP 2005362728 A JP2005362728 A JP 2005362728A JP 2005362728 A JP2005362728 A JP 2005362728A JP 2007164648 A JP2007164648 A JP 2007164648A
Authority
JP
Japan
Prior art keywords
image
layout
feature amount
similarity
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005362728A
Other languages
English (en)
Other versions
JP4859025B2 (ja
JP2007164648A5 (ja
Inventor
Koji Kobayashi
幸二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005362728A priority Critical patent/JP4859025B2/ja
Priority to US11/611,530 priority patent/US20070143272A1/en
Publication of JP2007164648A publication Critical patent/JP2007164648A/ja
Publication of JP2007164648A5 publication Critical patent/JP2007164648A5/ja
Application granted granted Critical
Publication of JP4859025B2 publication Critical patent/JP4859025B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

【課題】ターゲット画像を曖昧な記憶を頼りに検索する用途に好適な類似画像検索装置を実現する。
【解決手段】類似度算出処理部116は、問い合わせ画像と検索対象画像についてのレイアウト特徴量及び画像性質特徴量を用いて問い合わせ画像と検索対象画像の類似度を算出し、類似度の高い順に検索対象画像を順位付けするが、類似度の算出においてはレイアウト特徴量に画像性質特徴量より大きな重みを持たせる。検索対象画像は画像DB119の登録画像であり、その特徴量は特徴量DBより類似度算出処理部に読み込まれる。問い合わせ画像が画像DBの登録画像である場合には、その特徴量は特徴量DBより読み込まれる。問い合わせ画像が未登録画像である場合には、その特徴量は各特徴量算出処理部114,115により算出され類似度算出処理部に入力される。
【選択図】図1

Description

本発明は、類似画像検索技術に係り、特に、ターゲット画像をそれについての曖昧な記憶を頼りに検索する用途に好適な類似画像検索装置及び方法に関する。
特許文献1に記載の画像検索装置においては、画像間の類似度算出に例えば3種類の特徴量a,b,cを用いる。検索時に、特徴量aに関する問い合わせ画像A,特徴量bに関する問い合わせ画像B,特徴量cに関する問い合わせ画像Cを指定する。例えば、特徴量aが色特徴量ならばターゲット画像と配色の雰囲気が似た画像を問い合わせ画像Aとして指定し、特徴量bがエッジ特徴量ならばターゲット画像と構造の雰囲気が似た画像を問い合わせ画像Bとして指定し、特徴量cがテクスチャ特徴量ならばターゲット画像とテクスチャの雰囲気が似た画像を問い合わせ画像Cとして指定する。そして、問い合わせ画像A,B,Cより特徴量a,b,cを抽出し、検索対象画像(データベース登録画像)との間で特徴量a,b,cの類似度(距離)を算出し、それらを合計して総合類似度(距離)とする。この類似度の合計の際に、特徴量a,b,cの類似度に重み付けをつける態様も記載されている。
特許文献2に記載の情報処理装置においては、画像を属性毎のブロックに領域分割する。そして、入力画像と登録画像(電子データ)との対応ブロック間の位置、サイズ、属性と、ブロック内部の色、テクスチャ等の特徴量の類似率を求める。全ブロックの類似率を合計して総合類似率を求めるが、その際にブロックの占有率に応じた重み付けをする。
特許文献3に記載の画像検索装置においては、検索の際にキーワードとレイアウト情報を指定する。登録画像のインデックスとして、キーワードやレイアウト情報が含まれる。レイアウト情報は、たとえば、タイトルの有無、段組の有無、表の有無等を雛形(メニュー)を選ぶことにより指定する。キーワードとレイアウト情報を用いてインデックスを検索し、条件に合った電子データを特定する。
特開2000−285141号公報 特開2004−348706号公報 特開2003−330965号公報
紙文書をスキャナ等の入力デバイスを使用して電子化する電子ファイリング等の装置は従来より存在していたが、大量に紙文書を扱う業務用途として使用されるにとどまっていた。しかし、スキャナの低価格化やスキャン機能を搭載したMFP(Multi Function Printer)の普及、e−文書法等の法制化により、一般にもそのハンドリングの良さや利便性が認知され、紙文書をスキャンして電子化する機会が増えてきている。
また、紙文書のスキャンと同時に電子化された文書画像データをデータベース(以下DB)化して管理する画像DBの用途も増えてきている。例えば紙文書の原本を保存しておく必要があっても管理のし易さという点で画像DBを構築する場合もある。このような文書画像DBにおいては、サーバ装置をおいて多数の人がアクセスする大規模なものから、個人のPC内にDBを構築するパーソナル用途のものまで様々である。また、近年のMFPでは内臓のHDDに文書を蓄積する機能を備えており、MFPをベースとして文書画像DBを構築する例もある。
このような文書画像DBにおいて、大量の文書画像から所望の文書画像を検索するために検索機能を備えたものがある。現在主流の検索機能は、OCR(Optical Character Reader)処理により認識した結果をキーワードとしてテキストベースでの全文検索または概念検索等を行うのが一般的となっている。しかし、このようなテキストベースの検索には
(1)OCRの精度に依存する
(2)検索キーワードが必要
(3)ヒット数が多い場合の絞り込みが困難
という問題点がある。
上記(1)については、OCRにより100%の正解率を得ることは現状では不可能であるため、入力した検索キーワードの部分にOCRのミスがあればヒットしないという問題が生じる。上記(2)については、テキストベースの検索は、例えば、インターネットのHPを検索するような未知のものを検索する場合や、そのキーワードが明らかな場合には有効性が高いが、例えば数年前に入力した記憶が曖昧な文書を検索するような場合には、適切なキーワードが思い浮かばなければ検索することができない。また、ページ全体が写真やグラフィクスで文章が存在しない文書を検索することはできない。上記(3)については、テキストベースの検索の場合には順位付けが困難であるため、キーワードにヒットしたものは同格に扱われる。そのため、ヒット数が多い場合、ヒットした多数の文書画像を一つ一つ確認する必要があり、ユーザビリティが悪い。
一方、画像の特徴を用いて類似画像を検索する技術がある。特許文献1,2に記載の装置はその例である。しかし、特許文献1記載の装置の場合、文書画像中の図や表、写真、文章等の要素を同系列で扱ってしまうため期待する順位付け結果が得られないことが多い。また、特許文献2記載の装置の場合、領域分割した各オブジェクト毎に類似度を算出して総合類似度を算出するため、例えば、ターゲット文書と同じ写真が用いられた文書は、それがターゲット文書と同写真以外は内容が異なるものであっても類似性の高いものとして検索されてしまうといった問題がある。
また、特許文献3に記載の画像検索装置は、キーワードとレイアウト情報を指定して画像の絞込みを行うものである。一般のユーザが適切なレイアウト情報を指定することは容易でないため、同文献ではレイアウトの雛形(メニュー)を選ぶ方法が示されている。しかし、レイアウト情報によって少ない数の文書画像に絞り込もうとすると、多数のレイアウトの雛形を用意しなければならず、その選択が煩瑣となり利用しにくいものとなる。また、レイアウト雛形の数を少なくすると文書を効率的に絞り込むことができなくなる。また、キーワードによるテキストベースの検索に関して上に述べたような制約がある。
さて、ターゲット画像についての曖昧な記憶を頼りに、画像データベースからターゲット画像を検索する場合、ターゲット画像と同一の画像又は一部要素が同一の画像を問い合わせ画像として使用することは困難であるため、オブジェクトの類似度よりも画像の全体的雰囲気の類似度が重要になる。特許文献1,2に記載されたような装置は、そのような点が配慮されていない。
よって、本発明の目的は、ターゲット画像についての曖昧な記憶を頼りに画像データベース等からターゲット画像を検索する用途に適したユーザビリティの優れた類似画像検索装置及び方法を提供することにある。
請求項1記載の発明は、検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)及びレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、この類似度の算出においてレイアウト特徴量に画像性質特徴量より大きな重みを持たせ、算出された類似度の高い順に検索対象画像を順位付けすることを特徴とする類似画像検索方法である。
請求項2記載の発明は、検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を用いて算出し、算出された類似度の高い順に検索対象画像を順位付けし、このようにして順位付けされた検索対象画像を所定数順位毎に2以上のグループに分割し、各グループ毎に、グループ内の検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、算出された類似度の高い順にグループ内の検索対象画像を順位付けすることを特徴とする類似画像検索方法である。
請求項3記載の発明は、問い合わせ画像と検索対象画像との類似度を算出し、算出された類似度の高い順に検索対象画像を順位付けする類似度算出処理手段を有し、前記類似度算出処理手段は、問い合わせ画像と検索対象画像との類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)及びレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、この類似度の算出においてレイアウト特徴量に画像性質特徴量より大きな重みを持たせることを特徴とする類似画像検索装置である。
請求項4記載の発明は、問い合わせ画像及び検索対象画像の類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を用いて算出し、算出された類似度の高い順に検索対象画像を順位付けするレイアウト類似度算出処理手段と、前記レイアウト類似度算出処理手段により順位付けされた検索対象画像を所定数順位毎に2以上のグループに分割し、各グループ毎に、グループ内の検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、算出された類似度の高い順にグループ内の検索対象画像を順位付けする画像性質類似度算出処理手段とを有することを特徴とする類似画像検索装置である。
請求項5記載の発明は、画像からレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を取得するレイアウト特徴量抽出手段と、画像からレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を取得する画像性質特徴量抽出手段と、画像が登録された画像データベースと、前記画像データベースに登録された画像について前記レイアウト特徴量抽出手段により取得されたレイアウト特徴量及び前記画像性質特徴量抽出手段により取得された画像性質特徴量が登録された特徴量データベースと、前記画像データベースに登録された画像又は前記画像データに未登録の画像を問い合わせ画像として指定する手段と、問い合わせ画像と前記画像データベースに登録されている検索対象画像との類似度を算出し、算出された類似度の高い順に検索対象画像を順位付けする類似度算出処理手段と、前記類似度算出処理手段により順位付けされた検索対象画像を検索結果として表示する手段とを有し、前記類似度算出処理手段は、問い合わせ画像についての、前記レイアウト特徴量抽出手段及び前記画像性質特徴量抽出手段により取得された、又は、前記特徴量データベースに登録されているレイアウト特徴量及び画像性質特徴量と、前記画像データベースに登録されている検索対象画像についての前記特徴量データベースに登録されているレイアウト特徴量及び画像性質特徴量を用いて、問い合わせ画像と検索対象画像との類似度を算出し、この類似度の算出においてレイアウト特徴量に画像性質特徴量より大きな重みを持たせることを特徴とする類似画像検索装置である。
請求項6記載の発明は、画像からレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を取得するレイアウト特徴量抽出手段と、画像からレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を取得する画像性質特徴量抽出手段と、画像が登録された画像データベースと、前記画像データベースに登録された画像について前記レイアウト特徴量抽出手段により取得されたレイアウト特徴量が登録されたレイアウト特徴量データベースと、前記画像データベースに登録された画像について前記画像性質特徴量抽出手段により取得された画像性質特徴量が登録された画像性質特徴量データベースと、前記画像データベースに登録された画像又は前記画像データに未登録の画像を問い合わせ画像として指定する手段と、問い合わせ画像についての、前記レイアウト特徴量抽出手段により取得された、又は、前記レイアウト特徴量データベースに登録されているレイアウト特徴量、及び、前記画像データベースに登録されている検索対象画像についての前記特徴量データベースに登録されているレイアウト特徴量を用いて、問い合わせ画像と検索対象画像との類似度を算出し、算出された類似度の高い順に検索対象画像を順位付けするレイアウト類似度算出処理手段と、前記レイアウト類似度算出処理手段により順位付けされた検索対象画像を所定数順位毎に2以上のグループに分割し、各グループ毎に、グループ内の検索対象画像についての前記画像性質特徴量データベースに登録されている画像性質特徴量、及び、問い合わせ画像についての、前記画像性質特徴量抽出手段により取得された又は前記画像性質特徴量データベースに登録されている画像性質特徴量を用いて、検索対象画像と問い合わせ画像との類似度を算出し、算出された類似度の高い順にグループ内の検索対象画像を順位付けする画像性質類似度算出処理手段と、前記画像性質類似度算出処理手段により順位付けされた検索対象画像を検索結果として表示する手段とを有することを特徴とする類似画像検索装置である。
請求項7記載の発明は、請求項5又は6記載の発明に係る類似画像検索装置であって、前記画像性質特徴量抽出手段によって取得される画像性質特徴量に画像の色、エッジ及びテクスチャに関する特徴量が含まれることを特徴とする類似画像検索装置である。
請求項8記載の発明は、請求項5又は6記載の発明に係る類似画像検索装置であって、前記レイアウト特徴量抽出手段は、画像のレイアウト解析を行って画像中のオブジェクトとその属性を検出するレイアウト解析処理手段と、このレイアウト解析処理手段によるレイアウト解析の結果に基づいて画像のレイアウト特徴量を算出するレイアウト特徴量算出手段とからなることを特徴とする類似画像検索装置である。
請求項9記載の発明は、請求項8記載の発明に係る類似画像検索装置であって、前記レイアウト特徴量算出手段は、画像の領域分割を2種類以上の異なった分割数で行い、分割領域毎にレイアウト特徴量を算出することを特徴とする類似画像検索装置である。
請求項10記載の発明は、請求項9記載の発明に係る類似画像検索装置であって、前記レイアウト特徴量算出手段により算出される前記分割領域毎のレイアウト特徴量に、分割領域内の属性毎のオブジェクトの面積率、オブジェクトの個数及びオブジェクト毎の面積率が含まれることを特徴とする類似画像検索装置である。
請求項11記載の発明は、請求項5又は6記載の発明に係る類似画像検索装置であって、前記レイアウト特徴量抽出手段は、画像のレイアウト解析を行って画像中のオブジェクトとその属性を検出するレイアウト解析処理手段と、このレイアウト解析処理手段により検出された各オブジェクトにその属性に応じた一様データ又はテクスチャをマーキングしたレイアウト画像を生成するレイアウト画像生成処理手段と、このレイアウト画像生成処理手段により生成されたレイアウト画像からレイアウト特徴量を算出するレイアウト特徴量算出処理手段とからなることを特徴とする類似画像検索装置である。
請求項12記載の発明は、請求項11記載の発明に係る類似画像検索装置であって、前記レイアウト画像生成処理手段によってオブジェクトにマーキングされる一様データ又はテクスチャの類似性とオブジェクトの属性の類似性とを対応させることを特徴とする類似画像検索装置である。
請求項13記載の発明は、請求項3又は4記載の発明に係る類似画像検索装置の類似度算出処理手段としてコンピュータを機能させるプログラムである。
請求項14記載の発明は、請求項4記載の発明に係る類似画像検索装置のレイアウト類似度算出処理手段及び画像性質類似度算出処理手段としてコンピュータを機能させるプログラムである。
請求項15記載の発明は、請求項5乃至12のいずれか1項記載の発明に係る類似画像検索装置の手段のうち、少なくとも問い合わせ画像を指定する手段と検索結果を表示する手段以外の各手段としてコンピュータを機能させるプログラムである。
請求項16記載の発明は、請求項13,14又は15記載の発明に係るプログラムが記録された、コンピュータが読み取り可能な情報記録媒体である。
本発明の類似画像検索方法又は装置は、ターゲット画像をその曖昧な記憶を頼りに検索する用途に最適である。すなわち、請求項1,3,5,7〜12に係る類似画像検索方法又は装置は、検索対象画像及び問い合わせ画像より取得されたレイアウト特徴量及び画像性質特徴量を用い、かつ、レイアウト特徴量に画像性質特徴量より大きな重みを持たせて算出した類似度により検索対象画像を順位付けすることによって、請求項2,4,6,7〜12に係る類似画像検索方法又は装置は、検索対象画像及び問い合わせ画像より取得されたレイアウト特徴量を用いて算出した類似度により検索対象画像を順位付けし、順位付けされた検索対象画像をグループ別に、検索対象画像及び問い合わせ画像より取得された画像性質特徴量を用いて算出された類似度により最終的に順位付けすることによって、画像の大局的な情報であるレイアウトを優先した類似画像検索を行う。しかも画像より取得されたレイアウト特徴量を用いるため、利用者がレイアウト情報を指定する必要はない。このようなレイアウト優先の類似画像検索によれば、ターゲット画像とレイアウトが近いと思われる問い合わせ画像を用いることにより、ターゲット画像とレイアウトが近い画像が検索されるため、検索された画像の中でターゲット画像により近いと思われる画像を問い合わせ画像として用い検索を繰り返すことにより、ターゲット画像についての曖昧な記憶を頼りにターゲット画像を容易に絞り込むことができ、またレイアウト情報を利用者が指定する必要がなく、検索のユーザビリティが向上する。また、請求項7〜12に係る類似画像検索装置は、類似度算出のための精度の良い特徴量の算出が可能となる。また、請求項9,10に係る類似画像検索装置は、レイアウト特徴量算出時における動的なオブジェクトの選択動作や画像による特徴量の数の相違がなくなり、類似度算出処理の高速性を保つ上で有利である。また、請求項11,12に係る類似画像検索装置は、レイアウト情報によって作成したレイアウト画像からレイアウト特徴量を算出するに際して、レイアウトの属性を属性の類似性に応じて表す事が可能となるため、オブジェクトの属性が異なる画像同士を類似性の低いものとして扱う影響を軽減することできる。請求項13,14,15に係るプログラム又は請求項16に係る情報記録媒体に記録されたプログラムによれば、コンピュータを利用して請求項3〜12に係る類似画像検索装置を容易に実現可能となる。
以下、本発明の実施の形態について、いくつかの実施例を用いて説明する。
図1は、本実施例に係る類似画像検索装置の機能的構成を説明するためのブロック図である。ここに例示した類似画像検索装置は、クライアント装置100とサーバ装置110を有線/無線LANやインターネット等の外部通信路104を介し接続した構成であるが、後述するように、このようなサーバ・クライアント構成に必ずしも限定されない。
クライアント装置100は、ユーザからの指示を入力するための手段である入力デバイス103、検索結果として画像その他の情報を表示するための手段である表示デバイス101、ユーザから入力された指示の解釈や、サーバ装置110との通信、表示デバイス101の制御等を行う手段である処理制御部102を含む。
このようなクライアント装置100は、具体的には例えば、パーソナルコンピュータ(PC)等のコンピュータであったり、PDA(Personal Digital(Data) Assistants)、携帯電話機その他のモバイル端末等であり、処理制御部102はPCやモバイル端末等の組み込みコンピュータで動作するアプリケーションプログラムとして実現される。
サーバ装置110は、クライアント装置100からのコマンドに応じて類似画像検索を行って検索結果をクライアント装置100へへ出力するものであって、画像データベース(DB)118、特徴量データベース(DB)117、画像DB制御処理部119、類似度算出処理部116、レイアウト解析処理部113、レイアウト特徴量算出処理部115、画像性質特徴量算出処理部114、外部通信路104とのインターフェースである外部インターフェース111を含む構成である。
レイアウト解析処理部113は、画像のレイアウトを解析し画像要素を領域分割してオブジェクト化するとともにオブジェクトの属性を判定し、その結果であるレイアウト情報を出力する手段である。レイアウト特徴量算出処理部115は、レイアウト解析処理部113より出力されるレイアウト情報から画像のレイアウトに関する特徴量(レイアウト特徴量)を算出する手段である。画像性質特徴量算出処理部114は、画像のレイアウト以外の性質に関する特徴量(画像性質特徴量)を算出する手段である。
画像DB118は画像が登録されているデータベースである。特徴量DB117は、画像DB118に登録されている各画像に関し画像性質特徴量算出処理部114及びレイアウト特徴量算出処理部115によってそれぞれ算出された画像性質特徴量及びレイアウト特徴量のデータが登録画像と対応付けられて蓄積されたデータベースである。例えば、登録画像とそれに関する特徴量データは、同一のID(識別情報)を付して管理される。
類似度算出処理部116は、問い合わせ画像(画像DB118に登録されている画像又は外部より入力される未登録の画像)に関する特徴量と、各登録画像に関する特徴量とから、問い合わせ画像と登録画像との類似度を算出し、類似度の高い所定数までの登録画像を類似画像として選択し、それら類似画像を類似度の高い順に順位付けする手段である。類似度算出処理部116からは、それら順位付けられた類似画像を表す情報が画像DB制御処理部119へ出力されるが、ここでは各類似画像(登録画像)のIDが順位付けられて出力されるものとして説明する。画像DB制御処理部119は、画像DB119に対する画像の登録、画像の読み出し等を制御する手段である。
このようなサーバ装置110は例えば図2に示すようなコンピュータ上にソフトウェアによって実現される。図2において、201はプログラムに応じた演算や処理を実行するCPU、202はプログラムのコードや画像の符号データ等のデータを一時的に記憶するために使用される揮発性のメモリ、203は画像データやプログラム等を保存するためのハードディスク、205はモニタ、204はモニタ205に表示するためのデータを蓄積するためのビデオメモリである。ビデオメモリ204に書き込まれた画像データは定期的にモニタ205へ表示される。206はマウスやキーボード等の入力デバイス、207はインターネットやLAN等の外部通信路104を介してデータを送受信する外部インターフェース、208は上記各構成要素を相互接続するためのバスである。このようなコンピュータにおいて、画像DB118と特徴量DB117はハードディスク203に保持されることになろう。そして、コンピュータをサーバ装置110の各手段113,114,115,116,119として機能させるためのアプリケーションプログラムが、例えばハードディスク203よりメモリ202にロードされ、CPU201で実行されることにより、コンピュータはサーバ装置110として動作する。このようなプログラム、及び、同プログラムが記録された磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子等のコンピュータが読み取り可能な各種の情報記録(記憶)媒体も本発明に包含されるものである。なお、後記実施例2,3に係るサーバ装置110について同様である。
クライアント装置100も同様に、PCのようなコンピュータやモバイル端末等の組み込みコンピュータのハードウェアを利用しソフトウェアにより実現可能であることは前述した通りである。そのためのプログラム、及び、同プログラムが記録された各種の情報記録(記憶)媒体も本発明に包含される。なお、後記実施例2,3に係るクライアント装置100について同様である。
なお、サーバ装置110をMFP(Multi Function Printer)等の機器にハードウェア又はソフトウェアとして実装することも可能である。また、本実施例に係る画像検索システムは、サーバ装置とクライアント装置とに分離せず、例えば1つのPCやMFP等の機器に、図1の構成要素を一体的に実装する構成とすることも可能である。これは後記実施例2,3についても同様である。
次に、レイアウト解析処理部113について説明する。レイアウト解析処理部113は、画像のレイアウト解析によって画像を画像要素単位(オブジェクト)に分割するとともに各オブジェクトの属性判定を行うことによりレイアウト情報を生成する。
このようなレイアウト解析処理は、OCR処理の前処理等でよく使用されており、そのための様々な手法が公開されている。レイアウト解析処理には、それら公知の手法を用いることができる。例えば特開2001−297303号公報に開示されていような、文書画像の背景色を特定し、その背景色を用いて文書画像から背景領域以外の画素を抽出し、該画素を統合して連結成分を生成し、該連結成分を少なくとも形状特徴を用いて所定の領域に分類することにより、文字領域や写真領域を識別する手法を用いることができる。また、文字領域識別に、例えば特開平7−73271号公報に開示されているような、適応的な2値化処理を行ったのちに外接矩形の形状を利用して文字領域を識別する手法を用いることもできる。また、例えば特開平7−221968号公報に開示されているような、画像の黒領域の隣接関係を解析して長方形に分離し、この長方形の大きさや黒領域の分布密度に基づいて画像の文字、写真、図形(グラフィックス)、表の各領域を識別する手法を用いることもできる。このような公知の手法(またはその組み合わせ)を用いることにより、文字領域や写真領域、グラフィックス領域、表領域等の属性毎の領域分割(オブジェクト化)およびその属性判定が可能となる。また、その際に、文字領域の位置やサイズ、文字の大きさ等に基づいてタイトル領域の識別等を行えば、類似画像検索時の類似度判定の精度を向上させることができる。
なお、分割されたオブジェクトの属性判定については、例えば、分割された領域のヒストグラムや周波数的な特徴量等を取得して、予め特徴量と属性の関係を学習させたニューラルネットワークやサポートベクタマシン等のパターン認識手法を使用する等しても良い。また、レイアウト解析処理の前に、その精度を高めるために、入力画像に対してスキュー補正や裏写り除去等の前処理を行うようにすればさらに好適である。
以上のレイアウト解析の例を図4に示す。図4において、(a)は入力画像(原稿)を示し、(b)はそのレイアウト解析結果を示す。この例では、画像はタイトル、文字、図形又は写真の属性を持つ6個のオブジェクトに分割されている。
次に、レイアウト特徴量算出処理部115について説明する。レイアウト特徴算出処理部115は、画像(ページ)全体を異なる分割数で分割し、各分割数の場合の分割領域毎の特徴量をレイアウト情報から算出する。この分割数には1を含めることができる。つまり、画像全体を分割領域として特徴量を求めることも可能である。
分割数を1,4,12として、それぞれの分割数でのレイアウト特徴量を算出する場合のレイアウト特徴量算出部115の機能的構成を図4に示す。図4において、401,402はページ分割処理部、403,404及び405は特徴量算出処理部である。
レイアウト解析処理部113から出力されたページ単位のレイアウト情報400が入力されるが、これを図5の(a)に模式的に示す。このレイアウト情報はそのまま特徴量算出処理部403に入力する。つまり、特徴量算出処理部403においては、ページ全体を1つの分割領域として、つまり、分割数=1として、特徴量の算出を行う。
ページ分割処理部401は、図5の(b)に示すようにページを1〜4の4領域に分割し、レイアウト情報を4つの分割領域毎に分割して特徴量算出処理部404へ入力する。したがって、特徴量算出処理部404においては、図5の(b)に示す各分割領域毎に特徴量を算出することになる。
ページ分割処理部402は、図5の(c)に示すようにページを1〜12の12領域に分割し、レイアウト情報を12の分割領域毎に分割して特徴量算出処理部405へ入力する。したがって、特徴量算出処理部405においては、図5の(c)に示す各分割領域毎に特徴量を算出することになる。
特徴量算出処理部403,404,405はそれぞれ、各分割領域における
・属性(タイトル、文字、図形、写真、表等)毎のオブジェクトの面積率
・オブジェクトの個数
・オブジェクト毎の面積率
を特徴量として算出する。
属性毎のオブジェクトの面積率は、分割領域内のオブジェクトの種類および構成の類似度を測るための特徴量であり、オブジェクトの個数およびオブジェクト毎の面積率は分割領域内での属性によらないオブジェクト構成の類似性を図る特徴量である。オブジェクト毎の面積率は、面積率の大きい所定数(1以上)のオブジェクトについて算出することとすれば、特徴量の数が画像によって変化することを防ぐことができる(ただし、分割領域内のオブジェクト数が上記所定数未満の場合、この特徴量を0とする)。オブジェクトの位置的な特徴は、ページ分割数の多いレイアウト情報を処理することにより自動的に算出されることになる。
レイアウト特徴量算出処理部115を以上のような構成とすることによって、レイアウト特徴量算出時における動的なオブジェクトの選択動作や画像による特徴量の数の相違がなくなるため、類似画像検索時の類似度算出処理の高速化に有利である。ちなみに、前記特許文献1には、類似画像検索時に問い合わせ画像と比較する画像から問い合わせ画像の各オブジェクトに対応したオブジェクトを抽出し、オブジェクトの位置、サイズ、属性を比較して類似度を算出する手法が開示されている。しかし、かかる方法では、検索時に動的に被類似度算出画像のオブジェクトを選択する必要が生じるため、類似度算出処理に要する時間が非常に増加する懸念がある。上に述べた本実施例に係るレイアウト特徴量算出処理方法によれば、そのような動的なオブジェクト選択動作は不要となる。
なお、レイアウト特徴量算出処理におけるページの分割数や分割方法は上に述べた例に限らない。なお、分割を画像のサイズによらず等分とすることによって、画像サイズによって分割数が異なることによる複雑化を吸収することができる。また、分割数を多くすればオブジェクトの形状に対する精度の向上が見込める。
次に画像性質特徴量算出処理部114について説明する。画像の性質として色味、輪郭(エッジ)、模様(テクスチャ)を選び、それらに関する特徴量を算出する場合の画像性質特徴量算出処理部114の機能的構成を図6に示す。図6において、301は解像度変換処理部、302は色特徴量算出処理部、303はエッジ特徴量算出処理部、304はテクスチャ特徴量算出処理部である。
入力画像300に対して解像度変換処理部301で解像度変換処理を施し、入力画像300を所定の低い解像度の画像に変換してから各特徴量算出処理部403,404,405へ入力する。このような解像度変換を行う狙いは次の通りである。通常、文書画像は文字の判読性を保つために200〜300dpi程度の解像度を持つが、画像性質の特徴量の算出にはそれほど高い解像度を必要とせず、また、解像度を下げたほうが特徴量算出に要する時間を短縮できるからである。また、低解像度化することによって、入力画像中の文字や網点等の局所的なエッジが無効化されるため、特徴量算出精度の向上を期待できるからである。なお、入力画像300が低解像度画像の場合や、特徴量算出処理時間の短縮の必要がない場合等は、解像度変換処理を省いてもよい。
解像度変換処理後の画像データから、色特徴量算出処理部302で色特徴量が算出され、エッジ特徴量算出処理部303でエッジ特徴量が算出され、テクスチャ特徴量算出処理部304でテクスチャ特徴量が算出される。これら3種の特徴量の算出には公知の手法を用いることができる。例えば、色特徴量については、画像の色ヒストグラム等を使用すればよい。色ヒストグラムは、適当な色空間(例えばLab,Luv,HSVなどが一般的)を選択し、その色空間を複数の領域に分割し、画像の各画素が色空間中のどの領域に対応するかを調べ、領域毎の画素数を全体の画素数により正規化することによって色特徴量を算出する手法を用いることができる。エッジ特徴量については、適当なエッジ抽出フィルタ等を用いて算出することができる。テクスチャ特徴量は、例えば同時生起行列に基づくテクスチャ抽出処理によって得ることができる(参考文献:高木幹夫雄及び下田陽久監修,「画像解析ハンドブック」,東京大学出版会,1991年)。
次に、画像登録時の動作について図7に示すフローチャートを参照して説明する。図1において、サーバ装置110内の破線は画像登録時のデータフローを示している。
クライアント装置100のユーザが入力デバイス103より処理制御部102に対し画像データの登録指示を入力することにより、この登録指示が処理制御部102(アプリケーションプログラム)によって外部通信路104を介しサーバ装置110へ送信され(ステップ101)、登録すべき画像のデータが例えば外部通信路104を介してサーバ装置110へ入力される(ステップS102)。この画像データは外部インターフェース111を経由して取り込まれ、画像DB制御処理部119の制御によって画像DB118へ登録される(ステップS103)。当該画像データはレイアウト解析処理部113及び画像性質特徴量算出処理部114へも入力され、レイアウト解析処理部113により当該画像のレイアウト情報が得られ、このレイアウト情報からレイアウト特徴量算出処理部115によってレイアウト特徴量が算出されるとともに、画像性質特徴量算出処理部114によって当該画像の画像性質特徴量が算出される(ステップS104)。このようにして得られた当該画像のレイアウト特徴量及び画像性質特徴量のデータは、当該画像と関連付けられて(具体的には前述のように当該画像と同一のIDを付けられて)特徴量DB117に蓄積される(ステップS105)。
ここでは、画像データとその特徴量データとが画像DB118と特徴量DB117とに別々に蓄積されるものとしている。しかし、画像データと特徴量データを、例えばXML(eXtensible Markup Langage)等の言語を使用し階層的なデータ構造として同一のデータベースに蓄積することにより、画像DB118と特徴量DB117を統合する形態をとることも可能である。また、画像DB118と特徴量DB117の一方又は両方をサーバ装置110の外部に設ける形態をとることも可能である。また、登録すべき画像データを外部通信路104を経由してサーバ装置110へ入力するものとしたが、スキャナやデジタルカメラ等の画像入力装置から直接的に画像データをサーバ装置110へ入力する形態をとることも可能である。
次に、類似画像検索動作について説明する。図8は、その説明のためのフローチャートである。図8において、左側に示すステップはクライアント側の処理ステップであり、右側のステップはサーバ側の処理ステップである。
ステップS201: クライアント装置100において、ユーザは入力デバイス103を通じて処理制御部102に対し、検索したい文書画像(ターゲット画像)とレイアウトが類似していると思われる文書画像を、問い合わせ画像として指定するとともに類似画像検索を指示する。処理制御部102はサーバ装置110へ、問い合わせ画像を指定して類似画像検索の指示を通知する。
問い合わせ画像として、画像DB118に登録済みの画像を指定することも外部ファイルにある画像から選択することもできる。外部ファイルにある画像が問い合わせ画像として指定された場合には、外部インターフェース111を介して外部通信路を通じ問い合わせ画像が入力される。図1には、この場合を想定し外部ファイルから問い合わせ画像112が入力された様子を示している。画像DB118に登録済みの画像が問い合わせ画像として指定された場合には、問い合わせ画像そのものの取り込みは不要であり、またステップS202,S203の処理も不要である。問い合わせ画像を登録済み画像の中からのみ選ぶという制限を加える場合には、画像DB118と特徴量DB117を別途作成しておくならば、特徴量を取得するための各手段113,114,115をサーバ装置110に備えておく必要もない。このことは後記実施例2,3においても同様である。
ここでは、問い合わせ画像112が外部ファイルから入力されたものとして以下の処理を説明する。
ステップS202: レイアウト解析処理部113により問い合わせ画像112に対し前記レイアウト解析処理が行われ、レイアウト情報が生成される。
ステップS203: 画像性質特徴量算出処理部114で問い合わせ画像113の画像性質特徴量が算出される。また、レイアウト特徴量算出処理部115で、レイアウト解析処理部113より入力されたレイアウト情報からレイアウト特徴量が算出される。算出された画像性質特徴量とレイアウト特徴量は類似度算出処理部116へ入力される。なお、画像DB118に登録済みの画像が問い合わせ画像として指定された場合には、その画像に関する特徴量データが特徴量DB117から類似度算出処理116に読み出される。
ステップS204: 類似度算出処理部116では、特徴量DB117より読み出した登録済みの各画像のレイアウト特徴量及び画像性質特徴量と、問い合わせ画像のレイアウト特徴量及び画像性質特徴量とを用いて画像間の類似度を算出し、登録済み画像を類似度の高いものから順位付けをする。このようにして順位付けした所定数の登録済み画像のIDを画像DB制御処理部119へ出力する。つまり、この段階で問い合わせ画像に類似した画像が検索されたわけである。
ここで、類似度算出処理部116における類似度算出処理について図9を参照して説明する。特徴量DB117に蓄積されている登録画像の特徴量は、特徴量の種類毎に図9に示すような特徴空間にマップされる。類似度算出においては、問合せ画像の特徴量も同様に特徴空間にマップされる。図9に示すポイント(黒点)は特徴空間にマップされた画像を示し、問合せ画像のポイントと各画像のポイントとの距離が画像の類似度となる。画像の特徴量の多くはベクトルデータであり、ポイント間の距離の計算には一般にユークリッド距離などのベクトルの距離定義式が利用される。画像の類似度は、特徴量毎に算出された類似度に重みを掛けて算出される。
すなわち、レイアウト特徴量の数をn個、各レイアウト特徴量の重みをLi、各レイアウト特徴量の類似度をDi、画像性質特徴量の数をm個、各画像性質特徴量の重みをSj、各画像性質特徴量の類似度をdj、レイアウト特徴量全体に対する重みをα、画像性質特徴量全体に対する重みをβとすると、画像の類似度Rは次の式(1)により算出される。ただし、式(1)において、α<βの関係に選ばれる。
Figure 2007164648
この例では、各特徴量の類似度が距離であるため、画像の類似度Rは、その値が小さいほど類似度は高いことを意味する。つまり、α<βに設定することは、類似度計算の際にレイアウト特徴量の重みを画像性質特徴量の重みより大きくすることである。
なお、LiやSjに予めα、βの値を掛けておき、全てのレイアウト特徴量の重みが画像性質特徴量の重みよりも大きくなるように設定しても良い。ここで、LiやSjは各特徴量を正規化するための係数とみなす事が出来る。α、βは作為的な順位付けの為に使用される。ユーザの設定等によりLi、Sjの特定な重みを重くするような処理を行っても良い。また、α、βの重みも同様にユーザの指示に応じて変更するようにしても良い。
このように、レイアウト特徴量の重みを画像性質特徴量よりも重くする(重視する)ことによって、レイアウト特性に偏重した(ページの大局的な情報を優先した)類似画像検索が可能となる。このような大局的な情報を優先した類似画像検索によれば、ターゲット画像に関する曖昧な記憶を頼りに画像を絞り込み、容易にターゲット画像に到達することができる。
ステップS205: 前述のように、類似度算出処理部116は類似度に高い順に順位付けした画像のIDを画像DB制御処理部119へ入力する。画像DB制御処理部119は、そのIDを用いて、それら順位付けされた画像のデータを画像DB118より順に読み出し、外部インターフェース111により外部通信路104を介しクライアント装置100へ送信させる。
ステップS206: クライアント装置100の処理制御部103は、サーバ装置110より受信した画像を類似度の高い順に表示デバイス101に表示させる。この場合の表示方法は、特に限定されないが、例えば類似画像検索で一般的なサムネイルの一覧表示を用いることができる。
ユーザは、表示デバイス101に表示された画像中にターゲット画像が含まれているか確認し、ターゲット画像が見つかったならば「検索終了」の指示を入力デバイス103から入力し、類似画像検索を終了させることができる。表示された画像中にターゲット画像が含まれていない場合には、「再検索」の指示を入力し、類似画像検索を継続させることができる。
ステップ207: ユーザは、「再検索」の指示を入力した場合には、新たな問い合わせ画像を指定して類似画像検索を指示することができる。この際、表示デバイス101に表示されている前回検索された画像の中から、記憶しているターゲット画像のレイアウトに最も似ている画像を選び、それを新たな問い合わせ画像として指定することができる。つまり、前回の検索結果を利用した絞り込み検索を行うことが可能である。勿論、全く別の画像を問い合わせ画像として指定することも可能である。このような問い合わせ画像の指定と類似画像検索の指示が処理制御部102によりサーバ装置110へ通知される。
これに対し、サーバ装置110では前回の類似検索指示の場合と同様な処理の流れで類似画像検索が実行される。
以上のように、記憶しているターゲット画像にレイアウトが近いと思われる問い合わせ画像を用いて検索を開始するため、検索の初期の段階では、検索結果にターゲット画像が含まれている可能性は必ずしも高いとは限らない。しかし、検索結果中に最初の問い合わせ画像によりもターゲット画像に近い画像が含まれている可能性は高い。したがって、検索結果中のターゲット画像に近い画像を問い合わせ画像として選択し再度検索するという再帰的な類似画像検索を繰り返すことにより、問い合わせ画像とターゲット画像との類似度が次第に高くなり、登録画像中のターゲット画像の表示順位が上がる結果となる。これはあたかも、ターゲット画像を手繰り寄せるような効果をもたらす。しかも、前述したように類似度算出の際にレイアウト特徴量の重みを画像性質特徴量よりも重くし(重視し)、レイアウト(ページの大局的な情報)を優先した類似画像検索が行われる。よって、ターゲット画像に関する曖昧な記憶を頼りにして画像の絞り込みを行い、容易にターゲット画像に到達することができるため、ユーザビリティが大きく向上する。たなみに、従来のテキストベースの検索では、ターゲット画像を絞り込むことができない場合には、ユーザが多くの画像を確認するという頻雑かつ非効率な作業を必要とした。
なお、本実施例は、画像としてスキャンデータのようなラスタ画像を想定してレイアウト解析処理や特徴量算出処理を説明した。各種のアプリケーションソフトウェアにより生成される画像データやPDFフォーマットの画像データの場合でも、それら画像データをラスタライズすることにより同様に扱うことができ、またそのような画像データの構造情報を使用してレイアウト解析を行うような構成とすることも可能である。
以上の説明から明らかなように、本実施例は請求項3,5,7,8,9,10に係る発明の一実施例に相当する。また、本実施例は請求項1に係る発明の一実施例でもあることは明らかである。なお、レイアウト解析処理部113とレイアウト特徴量算出処理部115は、請求項5のレイアウト特徴量抽出手段を構成するものである。また、画像性質特徴量算出処理部114は請求項5の画像性質特徴量抽出手段に対応するものである。
図10は、本実施例に係る類似画像検索装置の機能的構成を説明するためのブロック図である。前記実施例1との相違について次に説明する。
本実施例においては、特徴量DBは、レイアウト特徴量DB121と画像性質特徴量DB123に分離されている。画像の登録時に、レイアウト特徴量算出処理部116により算出されたレイアウト特徴量は画像と対応付けられたレイアウト特徴量DB120に蓄積され、画像性質特徴量算出処理部114により算出された画像性質特徴量は画像と対応付けられて画像性質特徴量DB122に蓄積される。ただし、特徴量DBを必ずしも物理的に2分割する必要はない。
また、類似度算出処理手段が、レイアウト類似度算出処理部120と画像性質類似度算出処理部122とに分離されている。レイアウト類似度算出処理部120は、類似画像検索時に、レイアウト特徴量を用いて問い合わせ画像と登録画像の類似度(レイアウト類似度と呼ぶ)を算出し、レイアウト類似度の高い順に登録画像を順位付けする処理を行う手段である。画質性質類似度算出処理部122は、類似画像検索時に、レイアウト類似度により順位付けされた登録画像に関して、所定数順位毎に、画像性質特徴量を用いて問い合わせ画像との類似度(画像性質類似度と呼ぶ)を算出し、画像性質類似度の高い順に登録画像の順位を付け直す手段である。つまり、レイアウト特徴により大局的な順位付けを行い、次に画像性質特徴により局所的な順位付けの変更を行う。
より詳しく説明すると、まずレイアウト類似度算出処理部120でレイアウト特徴量のみを用いて問い合わせ画像と登録画像のレイアウト類似度を式(2)により算出される。上述べたように2段階の順位付けを行うため、前記式(1)で用いられたような重みαは不要である。
Figure 2007164648
このようなレイアウト類似度算出処理により、例えば図11の上段に示すようにレイアウト類似度の高い順に登録画像の順位付けが行われたものとする。
次に、レイアウト類似度により順位付けられた登録画像を例えば10順位毎に分けて、画像性質類似度算出処理部122で画像性質特徴量を用いて問い合わせ画像との画像性質類似度を算出する。この場合、その算出は式(3)により行われる。
Figure 2007164648
画像性質類似度算出処理により、図11の中段に示すように、レイアウト類似度による順位1〜10の登録画像は画像性質類似度の高い順に順位が付け直される。レイアウト類似度による順位11〜20の登録画像、順位21〜30の登録画像も同様に画像性質類似度の高い順に順位が付け直される。かくして、最終的に図11の下段に示すように順位付けがなされる。
このような最終的な順位付けに従って、それに対応した登録画像のIDが画像DB制御処理部111へ送られることにより、それらIDを持つ画像が順位付けに従った順に画像DBより読み出されてクライアント装置100へ送られ、表示デバイス101に検索結果として表示されることになる。
以上の説明から明らかなように、本実施例においても、画像のレイアウト特徴で大局的な類似度順位が決定されるため、ターゲット画像のレイアウトについての曖昧な記憶を頼りにターゲット画像を容易に絞り込むことができ、ユーザビリティの良好な類似画像検索が可能となる。
以上の説明から明らかなように、本実施例は、請求項4,6,7,8,9,10に係る発明の一実施例に相当する。また、本実施例は請求項2に係る発明の一実施例でもあることは明らかである。なお、レイアウト解析処理部113とレイアウト特徴量算出処理部115は、請求項6のレイアウト特徴量抽出手段を構成するものである。また、画像性質特徴量算出処理部114は請求項6の画像性質特徴量抽出手段に対応するものである。
図12は、本実施例に係る類似画像検索装置の機能的構成を説明するためのブロック図である。前記実施例1との相違について次に説明する。
本実施例においては、レイアウト解析処理部113とレイアウト特徴量算出処理部115の間にレイアウト画像生成処理部130が追加され、また、レイアウト特徴量算出処理部115の構成が変更されている。
レイアウト画像生成処理部130は、レイアウト解析処理部113によるレイアウト情報を入力として、画像中の各オブジェクトを、その属性に応じてマーキングした画像(レイアウト画像)を生成する手段である。このマーキングは、オブジェクトを、その属性に応じた一様データで塗りつぶす方法や、属性に応じたテクスチャで塗りつぶす方法を用いることができる。例えば図3(a)に示す文書画像がレイアウト解析により図3(b)のようなオブジェクトに分割された場合、図3(b)の各オブジェクトを属性対応の一様データで塗りつぶした如きレイアウト画像、又は、図13に示すような各オブジェクトを属性対応のテクスチャで塗りつぶしたマーキング画像が生成される。
オブジェクトを属性に応じた一様データで塗りつぶすマーキング方法が、処理が簡単でありレイアウト特徴量算出処理部115の構成も単純になるため、好ましいであろう。
一様データで塗りつぶすマーキング方法においては、塗りつぶしデータによって属性を数値化することが可能である。この場合、属性の類似性を塗りつぶしデータの値に関連付けることかできる。これについて図14により説明する。
図14は、属性の類似性を考慮した数値化の説明図である。例えば、属性判定での属性種類を、文字、タイトル、表、図形、写真とした場合に、文字と最も類似性のある属性としてタイトル、次に表、図形、写真の順とし、それぞれの類似度合いに応じて距離を設定して数値化する。例えば、「文字とタイトルは類似性が高いので近距離とする。」、「写真と図形は類似性が高いので近距離とする」等々として、白地を0、文字を128、タイトルを150、表を190、図形を230、写真を250のように数値化し、その数値で対応する属性のオブジェクトを塗りつぶす。このようにすれば、属性の異なるオブジェクトを全く別のものとして扱わずに属性の類似性を数値化して、レイアウト類似度の算出を行う事が可能となる。このようにオブジェクトを属性に応じた数値により表した場合、レイアウト画像生成処理部130から出力される画像はグレー画像となる。なお、数値に代えて色で属性を表すようにしてもよい。
オブジェクトを属性に応じたテクスチャを塗りつぶすマーキング方法の場合に、属性の類似性の高いオブジェクトに類似性の高いテクスチャを使用することができる。図13に示したレイアウト画像は、属性の類似性を考慮したテクスチャでオブジェクトを塗りつぶした例であり、文字系のオブジェクトに斜線のテクスチャ、写真系のオブジェクトに水平・垂直線のオブジェクトが用いられている。
レイアウト特徴量算出処理115では画像性質特徴量算出処理部114と同様な処理によってレイアウト特徴量を算出することができる。だだし、オブジェクトをテクスチャでマーキングする方法の場合には、色特徴量を使用する必要はない。
本実施例においては、レイアウト情報によって作成したレイアウト画像からレイアウト特徴量を算出するに際して、レイアウトの属性を属性の類似性に応じて表す事が可能となるため、オブジェクトの属性が異なる画像同士を類似性の低いものとして扱う影響を軽減することが可能となり、人の曖昧な記憶を頼りにした画像の絞り込みを容易にしてユーザビリティを向上させることができる。
なお、本実施例は前記実施例1の構成をベースとしたものであるが、前記実施例2の構成をベースにすることも可能である。すなわち、実施例2の構成において、レイアウト解析処理部113とレイアウト特徴算出処理部130の間にレイアウト画像生成処理部130を挿入した構成とすることも可能である。
以上の説明から明らかなように、本実施例は、請求項11,12に係る発明の一実施例に相当する。また、本実施例は請求項1に係る発明の一実施例でもあることは明らかである。レイアウト解析処理部113とレイアウト画像生成処理部130とレイアウト特徴量算出処理部115は、請求項11のレイアウト特徴量抽出手段を構成するものである。
実施例1に係るシステム構成を示すブロック図である。 コンピュータの構成例を示すブロック図である。 レイアウト解析を説明するための図である。 レイアウト特徴量算出処理部の機能的構成を示すブロック図である。 レイアウト特徴量算出のための画像分割を説明するための図である。 画像性質特徴量算出処理部の機能的構成を示すブロック図である。 画像登録動作を説明するためのフローチャートである。 類似画像検索動作を説明するためのフローチャートである。 特徴空間上での類似度算出の概念図である。 実施例2に係るシステム構成を示すブロック図である。 レイアウト類似度と画像性質類似度とによる段階的な順序付けの説明図である。 実施例3に係るシステム構成を示すブロック図である。 テクスチャで塗りつぶす方法によるレイアウト画像の説明図である。 オブジェクトの属性の類似性とオブジェクトの塗りつぶしデータの値との対応付けを説明するための図である。
符号の説明
100 クライアント装置
101 表示デバイス
102 処理制御部(アプリケーションプログラム)
103 入力デバイス
104 外部通信路
110 サーバ装置
111 外部インターフェース
112 問い合わせ画像
113 レイアウト解析処理部
114 画像性質特徴量算出処理部
115 レイアウト特徴量算出処理部
116 類似度算出処理部
117 特徴量DB
118 画像DB
119 画像DB制御処理部
120 レイアウト類似度算出処理部
121 レイアウト特徴量DB
122 画像性質類似度算出処理部
123 画像性質特徴量DB
130 レイアウト画像生成処理部

Claims (16)

  1. 検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)及びレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、この類似度の算出においてレイアウト特徴量に画像性質特徴量より大きな重みを持たせ、
    算出された類似度の高い順に検索対象画像を順位付けすることを特徴とする類似画像検索方法。
  2. 検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を用いて算出し、算出された類似度の高い順に検索対象画像を順位付けし、
    このようにして順位付けされた検索対象画像を所定数順位毎に2以上のグループに分割し、各グループ毎に、グループ内の検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、算出された類似度の高い順にグループ内の検索対象画像を順位付けすることを特徴とする類似画像検索方法。
  3. 問い合わせ画像と検索対象画像との類似度を算出し、算出された類似度の高い順に検索対象画像を順位付けする類似度算出処理手段を有し、
    前記類似度算出処理手段は、問い合わせ画像と検索対象画像との類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)及びレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、この類似度の算出においてレイアウト特徴量に画像性質特徴量より大きな重みを持たせることを特徴とする類似画像検索装置。
  4. 問い合わせ画像及び検索対象画像の類似度を、それら画像より取得されたレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を用いて算出し、算出された類似度の高い順に検索対象画像を順位付けするレイアウト類似度算出処理手段と、
    前記レイアウト類似度算出処理手段により順位付けされた検索対象画像を所定数順位毎に2以上のグループに分割し、各グループ毎に、グループ内の検索対象画像と問い合わせ画像との類似度を、それら画像より取得されたレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を用いて算出し、算出された類似度の高い順にグループ内の検索対象画像を順位付けする画像性質類似度算出処理手段とを有することを特徴とする類似画像検索装置。
  5. 画像からレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を取得するレイアウト特徴量抽出手段と、
    画像からレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を取得する画像性質特徴量抽出手段と、
    画像が登録された画像データベースと、
    前記画像データベースに登録された画像について前記レイアウト特徴量抽出手段により取得されたレイアウト特徴量及び前記画像性質特徴量抽出手段により取得された画像性質特徴量が登録された特徴量データベースと、
    前記画像データベースに登録された画像又は前記画像データに未登録の画像を問い合わせ画像として指定する手段と、
    問い合わせ画像と前記画像データベースに登録されている検索対象画像との類似度を算出し、算出された類似度の高い順に検索対象画像を順位付けする類似度算出処理手段と、 前記類似度算出処理手段により順位付けされた検索対象画像を検索結果として表示する手段とを有し、
    前記類似度算出処理手段は、問い合わせ画像についての、前記レイアウト特徴量抽出手段及び前記画像性質特徴量抽出手段により取得された、又は、前記特徴量データベースに登録されているレイアウト特徴量及び画像性質特徴量と、前記画像データベースに登録されている検索対象画像についての前記特徴量データベースに登録されているレイアウト特徴量及び画像性質特徴量を用いて、問い合わせ画像と検索対象画像との類似度を算出し、この類似度の算出においてレイアウト特徴量に画像性質特徴量より大きな重みを持たせることを特徴とする類似画像検索装置。
  6. 画像からレイアウトに関する特徴量(以下、レイアウト特徴量と記す)を取得するレイアウト特徴量抽出手段と、
    画像からレイアウト以外の性質に関する特徴量(以下、画像性質特徴量と記す)を取得する画像性質特徴量抽出手段と、
    画像が登録された画像データベースと、
    前記画像データベースに登録された画像について前記レイアウト特徴量抽出手段により取得されたレイアウト特徴量が登録されたレイアウト特徴量データベースと、
    前記画像データベースに登録された画像について前記画像性質特徴量抽出手段により取得された画像性質特徴量が登録された画像性質特徴量データベースと、
    前記画像データベースに登録された画像又は前記画像データに未登録の画像を問い合わせ画像として指定する手段と、
    問い合わせ画像についての、前記レイアウト特徴量抽出手段により取得された、又は、前記レイアウト特徴量データベースに登録されているレイアウト特徴量、及び、前記画像データベースに登録されている検索対象画像についての前記特徴量データベースに登録されているレイアウト特徴量を用いて、問い合わせ画像と検索対象画像との類似度を算出し、算出された類似度の高い順に検索対象画像を順位付けするレイアウト類似度算出処理手段と、
    前記レイアウト類似度算出処理手段により順位付けされた検索対象画像を所定数順位毎に2以上のグループに分割し、各グループ毎に、グループ内の検索対象画像についての前記画像性質特徴量データベースに登録されている画像性質特徴量、及び、問い合わせ画像についての、前記画像性質特徴量抽出手段により取得された又は前記画像性質特徴量データベースに登録されている画像性質特徴量を用いて、検索対象画像と問い合わせ画像との類似度を算出し、算出された類似度の高い順にグループ内の検索対象画像を順位付けする画像性質類似度算出処理手段と、
    前記画像性質類似度算出処理手段により順位付けされた検索対象画像を検索結果として表示する手段とを有することを特徴とする類似画像検索装置。
  7. 前記画像性質特徴量抽出手段によって取得される画像性質特徴量に画像の色、エッジ及びテクスチャに関する特徴量が含まれることを特徴とする請求項5又は6記載の類似画像検索装置。
  8. 前記レイアウト特徴量抽出手段は、画像のレイアウト解析を行って画像中のオブジェクトとその属性を検出するレイアウト解析処理手段と、このレイアウト解析処理手段によるレイアウト解析の結果に基づいて画像のレイアウト特徴量を算出するレイアウト特徴量算出手段とからなることを特徴とする請求項5又は6記載の類似画像検索装置。
  9. 前記レイアウト特徴量算出手段は、画像の領域分割を2種類以上の異なった分割数で行い、分割領域毎にレイアウト特徴量を算出することを特徴とする請求項8記載の類似画像検索装置。
  10. 前記レイアウト特徴量算出手段により算出される前記分割領域毎のレイアウト特徴量に、分割領域内の属性毎のオブジェクトの面積率、オブジェクトの個数及びオブジェクト毎の面積率が含まれることを特徴とする請求項9記載の類似画像検索装置。
  11. 前記レイアウト特徴量抽出手段は、画像のレイアウト解析を行って画像中のオブジェクトとその属性を検出するレイアウト解析処理手段と、このレイアウト解析処理手段により検出された各オブジェクトにその属性に応じた一様データ又はテクスチャをマーキングしたレイアウト画像を生成するレイアウト画像生成処理手段と、このレイアウト画像生成処理手段により生成されたレイアウト画像からレイアウト特徴量を算出するレイアウト特徴量算出処理手段とからなることを特徴とする請求項5又は6記載の類似画像検索装置。
  12. 前記レイアウト画像生成処理手段によりオブジェクトにマーキングされる一様データ又はテクスチャの類似性とオブジェクトの属性の類似性とを対応させることを特徴とする請求項11記載の類似画像検索装置。
  13. 請求項3又は4記載の類似画像検索装置の類似度算出処理手段としてコンピュータを機能させるプログラム。
  14. 請求項4記載の類似画像検索装置のレイアウト類似度算出処理手段及び画像性質類似度算出処理手段としてコンピュータを機能させるプログラム。
  15. 請求項5乃至12のいずれか1項記載の類似画像検索装置の手段のうち、少なくとも問い合わせ画像を指定する手段と検索結果を表示する手段以外の各手段としてコンピュータを機能させるプログラム。
  16. 請求項13,14又は15記載のプログラムが記録された、コンピュータが読み取り可能な情報記録媒体。
JP2005362728A 2005-12-16 2005-12-16 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 Expired - Fee Related JP4859025B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005362728A JP4859025B2 (ja) 2005-12-16 2005-12-16 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US11/611,530 US20070143272A1 (en) 2005-12-16 2006-12-15 Method and apparatus for retrieving similar image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005362728A JP4859025B2 (ja) 2005-12-16 2005-12-16 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体

Publications (3)

Publication Number Publication Date
JP2007164648A true JP2007164648A (ja) 2007-06-28
JP2007164648A5 JP2007164648A5 (ja) 2009-01-15
JP4859025B2 JP4859025B2 (ja) 2012-01-18

Family

ID=38174945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005362728A Expired - Fee Related JP4859025B2 (ja) 2005-12-16 2005-12-16 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体

Country Status (2)

Country Link
US (1) US20070143272A1 (ja)
JP (1) JP4859025B2 (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110360A (ja) * 2007-10-31 2009-05-21 Ricoh Co Ltd 画像処理装置及び画像処理方法
WO2010046963A1 (ja) * 2008-10-20 2010-04-29 株式会社 Jsp データ検索システム、データ検索方法及びデータ検索プログラム
JP2010097609A (ja) * 2008-10-15 2010-04-30 Xerox Corp ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置
JP2010140209A (ja) * 2008-12-11 2010-06-24 Nec Corp 検索システム、検索方法、およびプログラム
JP2010250569A (ja) * 2009-04-16 2010-11-04 Yahoo Japan Corp 画像検索装置
JP2011141664A (ja) * 2010-01-06 2011-07-21 Canon Inc 文書比較装置、文書比較方法、及びプログラム
JP2011164799A (ja) * 2010-02-05 2011-08-25 Canon Inc 画像検索装置、制御方法、プログラム及び記憶媒体
JP2011233023A (ja) * 2010-04-28 2011-11-17 International Business Maschines Corporation 文書の類似度を判定する方法、装置及びプログラム。
JP2012003357A (ja) * 2010-06-15 2012-01-05 Yahoo Japan Corp 特徴情報作成装置、方法及びプログラム
JP2013246732A (ja) * 2012-05-28 2013-12-09 Toshiba Corp 手書き文書検索装置、方法及びプログラム
JP2014063377A (ja) * 2012-09-21 2014-04-10 Nikon Systems Inc 画像処理装置およびプログラム
JP2014063376A (ja) * 2012-09-21 2014-04-10 Nikon Systems Inc 画像処理装置およびプログラム
JP2015203978A (ja) * 2014-04-14 2015-11-16 キヤノン株式会社 画像処理装置、画像検索装置、画像処理装置の制御方法
US9311562B2 (en) 2013-08-22 2016-04-12 Fuji Xerox Co., Ltd. Image retrieval system, information processing apparatus, image retrieval method, and non-transitory computer readable medium
JP2017157138A (ja) * 2016-03-04 2017-09-07 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
JP2018018430A (ja) * 2016-07-29 2018-02-01 ヤフー株式会社 抽出装置、抽出方法、及び抽出プログラム
JP2018055533A (ja) * 2016-09-30 2018-04-05 富士フイルム株式会社 画像レイアウト装置,画像レイアウト方法およびそのプログラム
JP2019057173A (ja) * 2017-09-21 2019-04-11 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US10600211B2 (en) 2016-09-01 2020-03-24 Ricoh Company, Ltd. System and method for calculating image similarity and recording medium
JP2021012453A (ja) * 2019-07-04 2021-02-04 エヌ・ティ・ティ・コムウェア株式会社 検索クエリ生成装置、検索クエリ生成方法、プログラム、素材検索システム、および素材検索方法
JP2021012452A (ja) * 2019-07-04 2021-02-04 エヌ・ティ・ティ・コムウェア株式会社 素材検索システム、素材検索方法、素材検索装置、およびプログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4977452B2 (ja) * 2006-01-24 2012-07-18 株式会社リコー 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム
US20080134070A1 (en) * 2006-11-09 2008-06-05 Koji Kobayashi Image processing apparatus and image processing method
JP5164368B2 (ja) * 2006-12-07 2013-03-21 キヤノン株式会社 画像処理装置、画像処理方法
JP5096776B2 (ja) * 2007-04-04 2012-12-12 キヤノン株式会社 画像処理装置及び画像検索方法
JP4989308B2 (ja) * 2007-05-16 2012-08-01 キヤノン株式会社 画像処理装置及び画像検索方法
JP2009009334A (ja) * 2007-06-27 2009-01-15 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2009271577A (ja) * 2008-04-30 2009-11-19 Panasonic Corp 類似画像検索の結果表示装置及び類似画像検索の結果表示方法
US20090313239A1 (en) * 2008-06-16 2009-12-17 Microsoft Corporation Adaptive Visual Similarity for Text-Based Image Search Results Re-ranking
US8392842B1 (en) * 2008-06-19 2013-03-05 Adobe Systems Incorporated Quick search for replacement of portion of image
JP5214367B2 (ja) * 2008-08-08 2013-06-19 株式会社東芝 特徴量抽出装置、特徴量抽出方法、画像処理装置、及び、プログラム
JP5349879B2 (ja) * 2008-09-18 2013-11-20 キヤノン株式会社 情報処理装置、情報処理方法、プログラム、及び、記憶媒体
US10210179B2 (en) * 2008-11-18 2019-02-19 Excalibur Ip, Llc Dynamic feature weighting
US8429173B1 (en) * 2009-04-20 2013-04-23 Google Inc. Method, system, and computer readable medium for identifying result images based on an image query
JP5230525B2 (ja) * 2009-05-25 2013-07-10 キヤノン株式会社 画像検索装置およびその方法
US8185526B2 (en) * 2010-01-21 2012-05-22 Microsoft Corporation Dynamic keyword suggestion and image-search re-ranking
US20110191336A1 (en) * 2010-01-29 2011-08-04 Microsoft Corporation Contextual image search
CN102024029B (zh) * 2010-11-30 2013-08-28 辽宁师范大学 基于局部视觉关注的彩色图像检索方法
US9171203B2 (en) * 2013-09-10 2015-10-27 Dropbox, Inc. Scanbox
US9594981B2 (en) * 2014-04-14 2017-03-14 Canon Kabushiki Kaisha Image search apparatus and control method thereof
US10013436B1 (en) 2014-06-17 2018-07-03 Google Llc Image annotation based on label consensus
JP2016095787A (ja) * 2014-11-17 2016-05-26 株式会社リコー 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
CN108431829A (zh) * 2015-08-03 2018-08-21 奥兰德股份公司 用于在目录中搜索产品的系统和方法
WO2017020140A1 (es) * 2015-08-03 2017-02-09 Orand S.A. Sistema de búsqueda de imágenes por sketches usando histogramas de orientaciones de celdas y extracción de contornos basado en características de nivel medio
US9846808B2 (en) * 2015-12-31 2017-12-19 Adaptive Computation, Llc Image integration search based on human visual pathway model
JP6832504B2 (ja) * 2016-08-08 2021-02-24 パナソニックIpマネジメント株式会社 物体追跡方法、物体追跡装置およびプログラム
US10628890B2 (en) * 2017-02-23 2020-04-21 International Business Machines Corporation Visual analytics based vehicle insurance anti-fraud detection
CN108304506B (zh) * 2018-01-18 2022-08-26 腾讯科技(深圳)有限公司 检索方法、装置及设备
US10915701B2 (en) * 2018-03-19 2021-02-09 Adobe Inc. Caption association techniques
US11003862B2 (en) 2019-03-20 2021-05-11 Adobe Inc. Classifying structural features of a digital document by feature type using machine learning
US11200445B2 (en) 2020-01-22 2021-12-14 Home Depot Product Authority, Llc Determining visually similar products

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328417A (ja) * 1998-05-20 1999-11-30 Toshiba Corp 画像処理装置、画像処理方法及び画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000285139A (ja) * 1998-11-03 2000-10-13 Ricoh Co Ltd 文書マッチング方法、記述子生成方法、データ処理システム及び記憶媒体
JP2000285141A (ja) * 1999-01-27 2000-10-13 Ricoh Co Ltd 画像検索装置,画像分類装置およびそれらの装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001092973A (ja) * 1999-09-24 2001-04-06 Fujitsu Ltd 画像解析装置及び方法並びにプログラム記録媒体
WO2004047026A1 (ja) * 2002-11-20 2004-06-03 Fujitsu Limited 画像検索プログラム
JP2004334334A (ja) * 2003-04-30 2004-11-25 Canon Inc 文書検索装置、文書検索方法及び記憶媒体
JP2004334337A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理装置
JP2004363786A (ja) * 2003-06-03 2004-12-24 Canon Inc 画像処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5930783A (en) * 1997-02-21 1999-07-27 Nec Usa, Inc. Semantic and cognition based image retrieval
US6562077B2 (en) * 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US6009198A (en) * 1997-11-21 1999-12-28 Xerox Corporation Method for matching perceptual shape similarity layouts across multiple 2D objects
US6782395B2 (en) * 1999-12-03 2004-08-24 Canon Kabushiki Kaisha Method and devices for indexing and seeking digital images taking into account the definition of regions of interest

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328417A (ja) * 1998-05-20 1999-11-30 Toshiba Corp 画像処理装置、画像処理方法及び画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000285139A (ja) * 1998-11-03 2000-10-13 Ricoh Co Ltd 文書マッチング方法、記述子生成方法、データ処理システム及び記憶媒体
JP2000285141A (ja) * 1999-01-27 2000-10-13 Ricoh Co Ltd 画像検索装置,画像分類装置およびそれらの装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001092973A (ja) * 1999-09-24 2001-04-06 Fujitsu Ltd 画像解析装置及び方法並びにプログラム記録媒体
WO2004047026A1 (ja) * 2002-11-20 2004-06-03 Fujitsu Limited 画像検索プログラム
JP2004334334A (ja) * 2003-04-30 2004-11-25 Canon Inc 文書検索装置、文書検索方法及び記憶媒体
JP2004334337A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理装置
JP2004363786A (ja) * 2003-06-03 2004-12-24 Canon Inc 画像処理装置

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110360A (ja) * 2007-10-31 2009-05-21 Ricoh Co Ltd 画像処理装置及び画像処理方法
JP2010097609A (ja) * 2008-10-15 2010-04-30 Xerox Corp ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置
WO2010046963A1 (ja) * 2008-10-20 2010-04-29 株式会社 Jsp データ検索システム、データ検索方法及びデータ検索プログラム
JP2010140209A (ja) * 2008-12-11 2010-06-24 Nec Corp 検索システム、検索方法、およびプログラム
JP2010250569A (ja) * 2009-04-16 2010-11-04 Yahoo Japan Corp 画像検索装置
JP2011141664A (ja) * 2010-01-06 2011-07-21 Canon Inc 文書比較装置、文書比較方法、及びプログラム
JP2011164799A (ja) * 2010-02-05 2011-08-25 Canon Inc 画像検索装置、制御方法、プログラム及び記憶媒体
JP2011233023A (ja) * 2010-04-28 2011-11-17 International Business Maschines Corporation 文書の類似度を判定する方法、装置及びプログラム。
JP2012003357A (ja) * 2010-06-15 2012-01-05 Yahoo Japan Corp 特徴情報作成装置、方法及びプログラム
JP2013246732A (ja) * 2012-05-28 2013-12-09 Toshiba Corp 手書き文書検索装置、方法及びプログラム
CN103455527A (zh) * 2012-05-28 2013-12-18 株式会社东芝 手写文件检索装置、方法以及记录介质
US9230181B2 (en) 2012-05-28 2016-01-05 Kabushiki Kaisha Toshiba Handwritten document retrieval apparatus and method
JP2014063376A (ja) * 2012-09-21 2014-04-10 Nikon Systems Inc 画像処理装置およびプログラム
JP2014063377A (ja) * 2012-09-21 2014-04-10 Nikon Systems Inc 画像処理装置およびプログラム
US9311562B2 (en) 2013-08-22 2016-04-12 Fuji Xerox Co., Ltd. Image retrieval system, information processing apparatus, image retrieval method, and non-transitory computer readable medium
JP2015203978A (ja) * 2014-04-14 2015-11-16 キヤノン株式会社 画像処理装置、画像検索装置、画像処理装置の制御方法
JP2017157138A (ja) * 2016-03-04 2017-09-07 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
JP2018018430A (ja) * 2016-07-29 2018-02-01 ヤフー株式会社 抽出装置、抽出方法、及び抽出プログラム
US10600211B2 (en) 2016-09-01 2020-03-24 Ricoh Company, Ltd. System and method for calculating image similarity and recording medium
JP2018055533A (ja) * 2016-09-30 2018-04-05 富士フイルム株式会社 画像レイアウト装置,画像レイアウト方法およびそのプログラム
JP2019057173A (ja) * 2017-09-21 2019-04-11 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP7013182B2 (ja) 2017-09-21 2022-01-31 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2021012453A (ja) * 2019-07-04 2021-02-04 エヌ・ティ・ティ・コムウェア株式会社 検索クエリ生成装置、検索クエリ生成方法、プログラム、素材検索システム、および素材検索方法
JP2021012452A (ja) * 2019-07-04 2021-02-04 エヌ・ティ・ティ・コムウェア株式会社 素材検索システム、素材検索方法、素材検索装置、およびプログラム
JP7304220B2 (ja) 2019-07-04 2023-07-06 エヌ・ティ・ティ・コムウェア株式会社 素材検索システム、素材検索方法、素材検索装置、およびプログラム
JP7304221B2 (ja) 2019-07-04 2023-07-06 エヌ・ティ・ティ・コムウェア株式会社 検索クエリ生成装置、検索クエリ生成方法、プログラム、素材検索システム、および素材検索方法

Also Published As

Publication number Publication date
JP4859025B2 (ja) 2012-01-18
US20070143272A1 (en) 2007-06-21

Similar Documents

Publication Publication Date Title
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US8001466B2 (en) Document processing apparatus and method
JP5059545B2 (ja) 画像処理装置及び画像処理方法
US8532388B2 (en) Image processing apparatus, image processing method, and computer program
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
US8429154B2 (en) Document search device, imaging forming apparatus, and document search system
US20040218838A1 (en) Image processing apparatus and method therefor
US8612429B2 (en) Apparatus, system, and method for information search
US20060221357A1 (en) Information processing apparatus and method
US9710524B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
US7856144B2 (en) Image retrieving apparatus, image retrieving method, program, and storage medium
US20040213458A1 (en) Image processing method and system
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2007286767A (ja) 画像検索システム、及び、画像検索サーバ及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
GB2478845A (en) Avoiding Confusion Arising from Similar Anchor Expressions
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
JP4261988B2 (ja) 画像処理装置及び方法
JP4859054B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US8065321B2 (en) Apparatus and method of searching document data
JP2010218249A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2006209353A (ja) 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
CN112560849A (zh) 基于神经网络算法的文理分割方法及系统

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110803

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111027

R151 Written notification of patent or utility model registration

Ref document number: 4859025

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees