JP4951373B2 - 画像検索装置、画像検索方法、及びコンピュータプログラム - Google Patents

画像検索装置、画像検索方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP4951373B2
JP4951373B2 JP2007063606A JP2007063606A JP4951373B2 JP 4951373 B2 JP4951373 B2 JP 4951373B2 JP 2007063606 A JP2007063606 A JP 2007063606A JP 2007063606 A JP2007063606 A JP 2007063606A JP 4951373 B2 JP4951373 B2 JP 4951373B2
Authority
JP
Japan
Prior art keywords
image
feature
displayed
displaying
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007063606A
Other languages
English (en)
Other versions
JP2008225871A (ja
Inventor
忍 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007063606A priority Critical patent/JP4951373B2/ja
Priority to CN200810083622XA priority patent/CN101266612B/zh
Priority to US12/076,020 priority patent/US8400466B2/en
Publication of JP2008225871A publication Critical patent/JP2008225871A/ja
Application granted granted Critical
Publication of JP4951373B2 publication Critical patent/JP4951373B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、入力された文書画像データを保存しておき、必要に応じて呼び出して出力するデジタル複合機、文書管理システムなどの画像形成装置、あるいは画像処理装置において使用される画像検索装置、画像検索方法、及びこの画像検索方法を実行するためのコンピュータプログラムに関する。
一般に、画像データを入力して保存しておき、必要なときに保存しておいた画像データを呼び出すような画像検索装置、特に類似する画像を検索する画像検索装置において、画像等のデータ表示手段が十分な大きさをもたない場合、ユーザが保存されているデータを確認する方法として、名称、日付、登録者、ファイルサイズなどの情報をリストにして表示する方法、あるいは、サムネイルなどの画像全体の縮小画像を使用して直感的に選択できるようにする方法がある。ただし、縮小画像を使用したのでは、外見上似た構造の画像どうしを区別できないことがある(図7参照)。
このような縮小画像を使用した際、外見上似た構造の画像どうしを区別技術として、例えば特許文献1あるいは2記載の発明が知られている。特許文献1記載の発明は、画像データやワードプロセッサで作成した文書、表計算ソフトのデータなど電子データを縮小画像作成部が読み込み縮小画像を作成し、差異判定部が、ここで作成された複数の縮小画像間の類似度を求め、類似度が所定の閾値よりも大きい場合は、差異画像作成部により類似する画像の中で差異のある部分の領域を切り出し、その部分を画像表示部に表示するというものである。また、特許文献2記載の発明は、複数の文書のそれぞれのレイアウトを抽出し当該レイアウトに基づき文書を区分する文書区分手段と、前記各文書中の類似していない個所を抽出する非類似個所抽出手段と、非類似個所抽出手段が抽出した個所のみを表示する非類似個所表示手段とを有し、さらに前記各文書中の類似している個所を抽出する類似個所抽出手段、類似個所抽出手段が抽出した個所のみを表示する類似個所表示手段を有するというものである。これらの発明は、縮小画像が類似していれば、もとの画像を分割した部分画像の中の類似度が小さいものを抽出して表示するようにしている。これによれば、画像データ全体の縮小画像どうしが類似していて判別困難であっても、差異の大きい部分を表示するため区別が可能となる。
また、縮小画像が似ている画像どうしを区別する方法として、特許文献3記載の発明がある。この発明は、文書ファイルを取得する文書ファイル取得手段と、文書ファイル取得手段により取得した文書ファイルにかかる画像の縮小画像を生成する縮小画像生成手段と、ディスプレイに表示された前記縮小画像がポインタ指定された場合に、文書ファイルにかかる画像上の処理領域を決定する処理領域決定手段と、処理領域内の情報を前記文書ファイルから抽出する処理領域内情報抽出手段と、処理領域内情報抽出手段が抽出した処理領域内情報を所定の大きさでディスプレイに表示する処理領域内情報表示手段と備えたもので、表示されている縮小画像の着目する部分をオペレータが指定したとき、その指定部分周辺の領域を縮小画像のもとになった画像データから抽出し、その領域から情報を抽出し、抽出した情報を出力表示するものである。これによれば、着目する部分の情報を表示することで縮小画像が似ている画像データどうしでも区別が可能となる。
特開2003−331299号公報 特開2005−063220号公報 特開2005−017592号公報
しかしながら、特許文献1及び2記載の発明では、検索結果を多数表示したい場合には、表示装置のサイズが限定されるため該検索結果の縮小画像を表示するが、縮小画像では画像の特徴がユーザに把握しづらい。そこで検索結果の特徴領域画像を表示するため前記特許文献1及び2に記載された技術が知られている。
しかし、特許文献1及び2に記載された技術における特徴領域画像は、検索結果として表示される他の画像における部分画像と類似度が一番小さい(似ていない)画像であり、他の画像との関係における相対的な特徴画像にすぎず、本来の画像の特徴的な領域でない場合がある。さらに、検索結果として表示される画像が多いとそれだけ計算量が多くなり、処理速度低下の要因となっていた。
また、特許文献3記載の発明では、類似した縮小画像のどの部分に着目すれば区別が可能か効率よく指定するためには、どのあたりが違いそうかという事前の情報、もしくは経験的な予測などが必要であり、それを知らなければ手当たりしだいに着目する部分を指定することになり、非効率である。さらに、着目する部分を指定してから、もとの画像データの領域を抽出して処理するため、その処理時間だけ待つことになる。処理内容が複雑になれば、より待ち時間が増えることになって不便である。
そこで、本発明が解決すべき課題は、複雑な処理を必要とせず、短時間で効率よく所望の画像データを得ることにある。
前記課題を解決するため、第1の手段は、指定した画像データに類似する画像を検索する画像検索装置において、前記画像データに類似する画像を検索する手段と、前記検索する手段により検索された前記画像をキーとして当該画像と関連付けて保存されている特徴領域画像を抽出し、表示画面に表示させる手段とを備え、前記表示させる手段は、当該特徴領域画像の種別に応じた順番で所定の時間間隔をもって前記表示画面に複数の前記特徴領域画像を表示させることを特徴とする。
第2の手段は、第1の手段において、前記表示させる手段が前記特徴領域画像の種別に応じた大きさで表示させることを特徴とする画像検索装置。
第3の手段は、第1又は第2の手段において、前記表示させる手段が前記特徴領域画像の種別に応じ、表示する特徴領域画像と表示しない特徴領域画像とに区別し、表示する特徴画像のみを表示させることを特徴とする。
第4の手段は、第1ないし第3のいずれかの手段において、前記表示させる手段が代表的な特徴領域の位置情報を求めておき、複数の代表的な特徴領域を切り替えて表示するときに表示する特徴領域の順位を位置情報によって決定することを特徴とする。
第5の手段は、第1ないし第3のいずれかの手段において、前記表示させる手段が代表的な特徴領域の大きさ情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を大きさ情報によって決定することを特徴とする。
第6の手段は、第1ないし第5のいずれかの手段において、前記表示させる手段が代表的な特徴領域の属性情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を属性情報によって決定することを特徴とする。
第7の手段は、第1ないし第6のいずれかの手段において、前記表示画面の表示可能な大きさに代表的特徴領域を変倍して表示することを特徴とする。
第8の手段は、指定した画像データに類似する画像をコンピュータによって検索する画像検索方法において、前記画像データに類似する画像を演算装置が検索する工程と、検索された前記画像をキーとして当該画像と関連付けて保存されている特徴領域画像を前記コンピュータのメモリに抽出する工程と、前記メモリに抽出された特徴領域画像の種別に応じた順番で所定の時間間隔で表示画面に複数の前記特徴領域画像を表示する工程と、を備え、表示された前記特徴領域画像に基づいて画像検索を行うことを特徴とする。
第9の手段は、第8の手段において、前記特徴領域画像を表示する工程で当該特徴領域画像を表示する際、当該特徴領域画像の種別に応じた大きさで表示させることを特徴とする画像検索方法。
第10の手段は、第8又は第9の手段において、前記特徴領域画像を表示する工程で当該特徴領域画像を表示する際、前記特徴領域画像の種別に応じ、表示する特徴領域画像と表示しない特徴領域画像とに区別し、表示する特徴画像のみを表示することを特徴とする。
第11の手段は、第8ないし第10のいずれかの手段において、前記特徴領域画像を表示する工程で当該特徴画像領域を表示する際、代表的な特徴領域の位置情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を位置情報によって決定することを特徴とする。
第12の手段は、第8ないし第10のいずれかの手段において、前記特徴領域画像を表示する工程で当該特徴画像領域を表示する際、代表的な特徴領域の大きさ情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を大きさ情報によって決定することを特徴とする。
第13の手段は、第8ないし第12のいずれかの手段において、前記特徴領域画像を表示する工程で当該特徴画像領域を表示する際、代表的な特徴領域の属性情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を属性情報によって決定することを特徴とする。
第14の手段は、第8ないし第13のいずれかの手段において、前記特徴領域画像を表示する工程で前記表示画面の表示可能な大きさに代表的特徴領域を変倍して表示することを特徴とする。
第15の手段は、第8ないし第14のいずれかの手段に係る画像検索方法における前記工程をコンピュータ実行させるコンピュータプログラムを特徴とする。
なお、後述の実施形態では、画像データに類似する画像を検索する手段、及び表示させる手段は中央演算装置8に、表示画面は画像表示部2にそれぞれ対応し、特徴領域画像は検索する手段により検索された画像をキーとして当該画像と関連付けて補助記憶装置6に保存され、特徴領域画像は特徴領域抽出部4によって抽出される。
本発明によれば、入力された画像データに対して代表的な特徴領域を複数抽出しておき、その特徴領域画像の種別に応じた順番で所定の時間間隔をもって表示画面に複数の特徴領域画像を表示するので、複雑な処理を必要とせず、短時間で効率よく所望の画像データを得ることができる。
以下、図面を参照し、本発明の実施形態について説明する。
図1は本発明の一実施形態に係る画像検索装置の概略構成を示すブロック図である。同図において、画像検索装置はスキャナ等の画像入力部1、液晶ディスプレイ等の入力された画像データや保存されている画像データを表示する画像表示部2、マウスやタッチパネル等、画像データに対して指定領域や注目点などの情報を入力する情報入力部3、画像データから代表的な特徴領域を抽出する特徴領域抽出部4、処理するデータを一時的に記憶する主メモリ5、画像データと関連付けられた複数の代表的な特徴領域とを関連づけて保存する補助記憶装置6、ネットワークを通じて外部とデータをやりとりする場合に使用する通信装置7、及び処理を制御する中央演算装置8からなる。
図2は図1の中央演算装置8によって実行される前記画像処理装置の処理手順を示すフローチャートで、図2(a)が画像データ入力時、図2(b)が画像データ出力時の手順を示している。
まず、図2(a)において、画像が入力されると(ステップS101)、入力された画像データに対して、特徴領域抽出部4によって、レイアウトの解析(ステップS102)、領域の切り出し(ステップS103)、切り出された領域を文章、タイトル、図、写真、表などに識別する属性識別(ステップS104)を順次実行し、代表的な特徴領域を抽出する。レイアウトの解析、領域の切り出し、領域属性の識別には、ここで特に述べないが、例えば特開平7−37036号公報、あるいは特開平9−114923号公報に開示されているような公知の方法が使用できる。
一般に、視覚によって複数の画像データから所望の画像データを選択するとき、文書全体の内容を理解するよりも、含まれる図や写真、タイトルなどの目立つ特徴的な領域をざっと見ることで見当をつけることが多い。したがって、代表的な特徴領域としては、図6に示すように原稿10から切り出された領域の中から図R1、写真、表R2、タイトルR3といった属性(種別)の領域を、代表的な特徴領域として画像データに関連づけて保存する。画像データは、補助記憶装置6の他に、通信装置を介してネットワークに接続された他の補助記憶装置に保存することも可能である。なお、R4は文字領域を示す。
図7は図6に示した原稿10とこの原稿10に類似した原稿10’全体を縮小して画像表示部(表示画面)2に並べて表示した状態を示す図である。この表示からレイアウトは同一なので、原稿の細部を見なければこの原稿(文書)の内容を理解することは難しい。そこで、本実施形態では、以下のように表示する。
すなわち、保存された画像データが呼び出されたときには、画像表示部2に対して該画像データに関連づけられた1つ以上の領域R1,R2,R3と該画像データの代表的な(部分)領域画像R1a,R2a,R3aとが並列に表示された表示画面が、一定の時間おきに(1)→(2)→(3)のように順次送られ、図8に示すように該画像データの代表的な(部分)領域画像として切り替えて画像表示部2に表示される。このように属性領域R1,R2,R3と代表的特徴領域R1a,R2a,R3aを複数関連づけて保有しておき、それらを順次表示することによって、類似した代表的特徴領域を含む画像データ間での識別を可能にし、所望の画像データの選択を容易にすることができる。図2(b)はこのときの処理手順を示すもので、画像データがロードされ(ステップS201)、特徴領域の表示が更新され(ステップS202)、順次表示され(ステップS203)、この表示から画像を選択して(ステップS204)出力させる(ステップS205)。
図8に示したように複数の属性領域R1,R2,R3と代表的特徴領域R1a,R2a,R3aを一定時間で切り替えて表示する代わりオペレータからの指示によって切り替えて表示することもできる。このときの処理手順を図3に示す。図3はオペレータからの指示によって切り替えて表示する処理手順を示すフローチャートである。
この処理手順では、図2(b)に示した処理手順のステップS203で特徴領域が表示された後、オペレータから指示があると、表示の切り替えが行われ(ステップS301)、ステップS202に戻って再度特徴量の表示を更新し、順次表示するように設定されている。
このように処理すると、代表的特徴領域の数が多い場合、一定時間での切り替えを待ちきれない場合がある。その切り替えのタイミングをオペレータが指示することによって、より効率的に所望の画像データを選択することができる。
前記ステップS101から画像が入力されるが、入力された画像データの内容によっては、レイアウト解析、領域切り出し、領域属性識別の結果としての代表的な特徴領域に誤りがあったり、不要な図などを含む場合がある。そのため、代表的な特徴領域を抽出した後、表示手段に順次表示し、オペレータに画像データに関連づけて保存すべきかどうか取捨選択を促す。オペレータがすべての代表的な特徴領域として抽出された領域の取捨選択が終了してから、画像データと選ばれた代表的特徴領域とを関連づけて保存する。
このときの処理手順を図4に示す。図4はオペレータが画像データに代表的な特徴領域を関連づけて保存すべきかどうかを取捨選択する処理の処理手順を示すフローチャートである。図4において、画像が入力されると(ステップS101)、入力された画像データに対して、特徴領域抽出部4によって、レイアウトの解析(ステップS102)、領域の切り出し(ステップS103)、切り出された領域を文章、タイトル、図、写真、表などに識別する属性識別(ステップS104)を順次実行し、代表的な特徴領域を抽出する。次いで、代表的な特徴領域を抽出した後、表示手段に順次表示する(ステップS401)。オペレータが画像データに関連づけて保存すべきかどうか取捨選択し(ステップS402)、すべての代表的な特徴領域として抽出された領域の取捨選択が終了すると(ステップS403)、画像データと選ばれた代表的特徴領域とを関連づけて保存する(ステップS105’)。
このように代表的な特徴領域の取捨を実施することによって、誤りや不要な領域を削減することが可能となり、効率的に所望の画像データを選択することができる。
また、前述のように前記ステップS101から画像が入力されるが、入力された画像データの内容によっては、レイアウト解析、領域切り出し、領域属性識別の結果としての代表的な特徴領域に抽出もれを含む場合がある。そのため、代表的な特徴領域を抽出した後、表示手段に順次表示し、オペレータが代表的な特徴領域を情報入力手段によって指定するかどうかの判断を促す。領域を指定するとしたならば、表示手段に画像データを表示し、情報入力手段によって指定したい領域を入力し、それによって得られた領域を代表的な特徴領域として、画像データと関連づけて保存する。
このときの処理手順を図5に示す。図5はオペレータが情報入力手段によって指定するかどうかを取捨選択する処理の処理手順を示すフローチャートである。図4において、画像が入力されると(ステップS101)、入力された画像データに対して、特徴領域抽出部4によって、レイアウトの解析(ステップS102)、領域の切り出し(ステップS103)、切り出された領域を文章、タイトル、図、写真、表などに識別する属性識別(ステップS104)を順次実行し、代表的な特徴領域を抽出する。次いで、代表的な特徴領域を抽出した後、表示手段に順次表示する(ステップS501)。オペレータが代表的な特徴領域を追加するかどうかを取捨選択し(ステップS502)、追加分が全て終了すると(ステップS503→S502)、画像データと選ばれた代表的特徴領域とを関連づけて保存する(ステップS105’)。
このようにオペレータによる代表的な特徴領域の指定を可能にすることによって、代表的な特徴領域の抽出漏れを防ぐことが可能となり、効率的に所望の画像データを選択することができる。
ところで、前述のような各処理では、ステップS102のレイアウト解析、ステップS103の領域切り出し、ステップS104の領域属性識別の結果としての代表的な特徴領域が得られる。そこで、これら特徴領域についての特性に応じて各種ソートを行ってデータ識別を行うこともできる。例えば、特徴領域の重心など特定部分の位置、大きさ、種類などである。
1)特徴領域の重心など、特定部分の位置の順にソートしておき、代表的な特徴領域を切り替えて表示するときの表示する順序を、そのソートした順に従うようにする場合
この場合は、特徴領域の重心など、特定部分の位置の順にソートしておき、代表的な特徴領域を切り替えて表示するときの表示する順序を、そのソートした順に従うようにする。一般的に、横書きの文書画像では左上から右方向に視線を動かし、徐々に下へ見ていくが、その順に代表的な特徴領域を表示すれば、文書画像データを読むときに現れる順序で代表的な特徴領域を表示することが可能となり、それによって画像データを区別することがある。
このように位置情報に応じた順序で代表的な特徴領域を表示すると、画像データの内容の直感的な理解を助け、効率的に所望の画像データを選択することができる。
2)特徴領域の大きさの順にソートしておき、代表的な特徴領域を切り替えて表示するときの表示する順序を、そのソートした順に従うようにする場合
この場合は、特徴領域の面積など、大きさの順にソートしておき、代表的な特徴領域を切り替えて表示するときの表示する順序を、そのソートした順に従うようにする。一般的に、画像データに含まれる代表的な特徴領域は、大きいほうがより目立つ。したがって、画像データに含まれる代表的な特徴領域のうち、小さい特徴領域よりも大きい特徴領域によって画像データを区別することがある。
このように大きさ情報に応じた順序で代表的な特徴領域を表示すると、画像データの内容の直感的な理解を助け、効率的に所望の画像データを選択することができる。
3)特徴領域の種類などの属性の順にソートしておき、代表的な特徴領域を切り替えて表示するときの表示する順序を、そのソートした順に従うようにする場合
この場合は、特徴領域の種類などの属性の順にソートしておき、代表的な特徴領域を切り替えて表示するときの表示する順序を、そのソートした順に従うようにする。一般的に、画像データに含まれる代表的な特徴領域のうち、タイトル等の文字情報よりも、写真や図等のより印象的な属性のものによって画像データを区別することがある。
このように属性情報に応じた順序で代表的な特徴領域を表示すると、画像データの内容の直感的な理解を助け、効率的に所望の画像データを選択することができる。
図2のステップS202では一定時間ごとに代表的な特徴領域を表示手段に送って(更新させて)表示させているが、特徴領域の属性に応じて表示する時間を変更することもできる。特徴領域が図や写真であるのに比べタイトル等の文字を含む場合、その内容を読むことになり、図や写真などと同じ表示時間では、内容を確認できないことがある。そのため、ステップS104で入力時に識別した属性をチェックし、その属性が文字を含むような領域であったときには表示時間を長めに設定する。これにより文字を読む時間が確保され、画像データの内容の理解を助けることになる。その結果、効率的に所望の画像データを選択することができる。なお、特徴領域画像の表示する順番あるいは時間等はユーザが任意に変更できるようにすることもできる。
ところで、画像表示部2の代表的な特徴領域の表示では、図8に示すようにそのままの大きさで表示していたが、表示の大きさを変更することもできる。一般にMFPなどの画像処理(形成)装置では、小さな表示装置(画像表示部2)しか持たないものが多い。したがって、画像データの部分領域である特徴領域も、表示装置の表示可能な領域に収まらない可能性がある。また、逆に表示装置の表示可能な大きさに比べ、特徴領域が小さくて判別しづらい可能性もある。そこで、図9に示すように属性領域と代表的な特徴領域を画像表示部2に表示可能な大きさに変倍して見やすく表示する。これにより効率的に所望の画像データを選択することができる。図9に示す例では、拡大された属性領域をR1b,R2b,R3b、代表的な特徴領域をR3c,R1c,R2cで示している。この場合も(1)→(2)→(3)というように表示の切り替えが行われる。
図9に示すように代表的な特徴領域R1c,R2c,R3cを画像表示部2の表示可能な大きさに変倍して表示するときに、各領域R1,R2,R3の相対的大きさの比を保存しながら図10に示すように変倍することもできる。すなわち、最も大きな代表的特徴領域R3を画像表示部2の表示可能な大きさ(鎖線で示す枠2a)の画像R3bに変倍した倍率で各属性領域及び特徴領域を変倍する。図では、タイトル領域R3を変倍した変倍率で変倍した図領域R1dと表領域R2d、及び当該領域に対応する同一倍率で変倍された代表的特徴領域R1e及びR2eを示している。これにより変倍後であっても元画像の相対的な大きさの違いを保持しているので、それぞれの代表的特徴領域どうしの大きさの違いで直感的に画像データを区別できることがある。ただし、あまりに表示する大きさが小さくなって、画像の判別が不能になることを防ぐため、倍率の下限は必要である。なお、この場合も(1)→(2)→(3)というように表示の切り替えが行われる。
このように代表的な特徴領域の大きさの比を保存することによって、より直感的に画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
代表的な特徴領域を表示手段の表示可能な大きさに変倍して表示するときに、各代表的な特徴領域の属性によって変倍する倍率を変更する。特に、タイトル等の文字を含む代表領域の場合、図や写真の領域よりも、表示する大きさが小さくなると判別が困難になる傾向がある。したがって、文字を含むような属性をもつ領域の場合、他の領域よりも大きめに倍率を変更するようにする。属性が文字を含むような領域であったときに、表示する倍率を大きめにすることで、画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
また、オペレータの操作に応じて、指定した画像データの代表的な特徴領域のすべてを画像表示部2に一覧表示できるようにすることもできる。このような一覧表示するモードを加えることにより、直感的に画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
なお、表示する代表的な特徴領域の1つとして、図7に示したような画像データ全体の縮小画像を加えることもできる。縮小画像を加えることにより代表的な特徴領域を順次切り替えて表示させるだけでなく、それらの配置に関する情報も得られることになる。これにより、画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
以上のように本実施形態によれば、
(1)画像データに含まれる複数の代表的特徴領域を抽出して関連づけて保有しておき、それらを順次切り替えて表示することによって、類似した代表的特徴領域を含む画像データ間での表示手段における識別を可能にし、所望の画像データの選択を容易にすることができる。
(2)オペレータからの指示によって複数の代表的特徴領域を順次切り替えて表示することによって、より効率的に所望の画像データを選択することができる。
(3)特徴領域抽出手段によって抽出された代表的な特徴領域を取捨選択することによって、誤りや不要な領域を削減することが可能となり、効率的に所望の画像データを選択することができる。
(4)オペレータによる代表的な特徴領域の指定を可能にすることによって、代表的な特徴領域の抽出漏れを防ぐことが可能となり、効率的に所望の画像データを選択することができる。
(5)位置情報に応じた順序で代表的な特徴領域を表示、あるいは、大きさ情報に応じた順序で代表的な特徴領域を表示し、あるいは、属性情報に応じた順序で代表的な特徴領域を表示することによって、より直感的に画像データの内容の理解を助けることが可能となり、効率的に所望の画像データを選択することができる。
(6)属性が文字を含むような領域であったときに、表示時間を長めにすることによって、あるいは表示する倍率を大きめにすることによって、画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
(7)代表的な特徴領域を表示手段の表示可能な大きさに変倍して見やすく表示することによって、効率的に所望の画像データを選択することができる。
(8)代表的な特徴領域の大きさの比を保存しながら表示することによって、より直感的に画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
(9)一覧表示するモードを加えることによって直感的に画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
(10)代表的な特徴領域の一つとして画像データ全体の縮小画像を加えることによって画像データの内容の理解するのを助け、効率的に所望の画像データを選択することができる。
等の効果を奏する。
本発明の一実施形態に係る画像検索装置の概略構成を示すブロック図である。 図1の中央演算装置によって実行される前記画像処理装置の処理手順を示すフローチャートである。 オペレータからの指示によって切り替えて表示する処理手順を示すフローチャートである。 オペレータが画像データに代表的な特徴領域を関連づけて保存すべきかどうかを取捨選択する処理の処理手順を示すフローチャートである。 オペレータが情報入力手段によって指定するかどうかを取捨選択する処理の処理手順を示すフローチャートである。 原稿とその原稿から切り出された代表的な特徴領域との関係を示す図である。 類似した画像データ全体の縮小画像を並べて表示した状態を示す図である。 類似した画像データの代表的特徴領域を並べ、切り替えて表示した状態を示す図である。 図8に表示した画像データを表示枠に最大限大きく変倍した状態を示す図である。 図8に表示した画像データを相対的な大きさの比を保持して変倍した状態を示す図である。
符号の説明
1 画像入力部
2 画像表示部
3 情報入力部
4 特徴領域抽出部
5 主メモリ
6 補助記憶装置
7 通信装置
8 中央演算装置

Claims (15)

  1. 指定した画像データに類似する画像を検索する画像検索装置において、
    前記画像データに類似する画像を検索する手段と、
    前記検索する手段により検索された前記画像をキーとして当該画像と関連付けて保存されている特徴領域画像を抽出し、表示画面に表示させる手段と、
    を備え、
    前記表示させる手段は、当該特徴領域画像の種別に応じた順番で所定の時間間隔をもって前記表示画面に複数の前記特徴領域画像を表示させることを特徴とする画像検索装置。
  2. 請求項1記載の画像検索装置において、
    前記表示させる手段は、前記特徴領域画像の種別に応じた大きさで表示させることを特徴とする画像検索装置。
  3. 請求項1又は2記載の画像検索装置において、
    前記表示させる手段は、前記特徴領域画像の種別に応じ、表示する特徴領域画像と表示しない特徴領域画像とに区別し、表示する特徴画像のみを表示させることを特徴とする画像検索装置。
  4. 請求項1ないし3のいずれか1項に記載の画像検索装置において、
    前記表示させる手段は、代表的な特徴領域の位置情報を求めておき、複数の代表的な特徴領域を切り替えて表示するときに表示する特徴領域の順位を位置情報によって決定することを特徴とする画像検索装置。
  5. 請求項1ないし3のいずれか1項に記載の画像検索装置において、
    前記表示させる手段は、代表的な特徴領域の大きさ情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を大きさ情報によって決定することを特徴とする画像検索装置。
  6. 請求項1ないし5のいずれか1項に記載の画像検索装置において、
    前記表示させる手段は、代表的な特徴領域の属性情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を属性情報によって決定することを特徴とする画像検索装置。
  7. 請求項1ないし6のいずれか1項に記載の画像検索装置において、
    前記表示画面の表示可能な大きさに代表的特徴領域を変倍して表示することを特徴とする画像検索装置。
  8. 指定した画像データに類似する画像をコンピュータによって検索する画像検索方法において、
    前記画像データに類似する画像を演算装置が検索する工程と、
    検索された前記画像をキーとして当該画像と関連付けて保存されている特徴領域画像を前記コンピュータのメモリに抽出する工程と、
    前記メモリに抽出された特徴領域画像の種別に応じた順番で所定の時間間隔で表示画面に複数の前記特徴領域画像を表示する工程と、
    を備え、表示された前記特徴領域画像に基づいて画像検索を行うことを特徴とする画像検索方法。
  9. 請求項8記載の画像検索方法において、
    前記特徴領域画像を表示する工程で当該特徴領域画像を表示する際、当該特徴領域画像の種別に応じた大きさで表示させることを特徴とする画像検索方法。
  10. 請求項8又は9記載の画像検索方法において、
    前記特徴領域画像を表示する工程で当該特徴領域画像を表示する際、前記特徴領域画像の種別に応じ、表示する特徴領域画像と表示しない特徴領域画像とに区別し、表示する特徴画像のみを表示することを特徴とする画像検索方法。
  11. 請求項8ないし10のいずれか1項に記載の画像検索方法において、
    前記特徴領域画像を表示する工程で当該特徴画像領域を表示する際、代表的な特徴領域の位置情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を位置情報によって決定することを特徴とする画像検索方法。
  12. 請求項8ないし10のいずれか1項に記載の画像検索装置において、
    前記特徴領域画像を表示する工程で当該特徴画像領域を表示する際、代表的な特徴領域の大きさ情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を大きさ情報によって決定することを特徴とする画像検索方法。
  13. 請求項8ないし12のいずれか1項に記載の画像検索方法において、
    前記特徴領域画像を表示する工程で当該特徴画像領域を表示する際、代表的な特徴領域の属性情報を求めておき、複数の代表的な特徴領域を切り替えて表示するとき、表示する特徴領域の順位を属性情報によって決定することを特徴とする画像検索方法。
  14. 請求項8ないし13のいずれか1項に記載の画像検索方法において、
    前記特徴領域画像を表示する工程で前記表示画面の表示可能な大きさに代表的特徴領域を変倍して表示することを特徴とする画像検索方法。
  15. 請求項8ないし14の画像検索方法における前記工程をコンピュータ実行させることを特徴とするコンピュータプログラム。
JP2007063606A 2007-03-13 2007-03-13 画像検索装置、画像検索方法、及びコンピュータプログラム Expired - Fee Related JP4951373B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007063606A JP4951373B2 (ja) 2007-03-13 2007-03-13 画像検索装置、画像検索方法、及びコンピュータプログラム
CN200810083622XA CN101266612B (zh) 2007-03-13 2008-03-12 图像检索装置及图像检索方法
US12/076,020 US8400466B2 (en) 2007-03-13 2008-03-13 Image retrieval apparatus, image retrieving method, and storage medium for performing the image retrieving method in the image retrieval apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007063606A JP4951373B2 (ja) 2007-03-13 2007-03-13 画像検索装置、画像検索方法、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2008225871A JP2008225871A (ja) 2008-09-25
JP4951373B2 true JP4951373B2 (ja) 2012-06-13

Family

ID=39762348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007063606A Expired - Fee Related JP4951373B2 (ja) 2007-03-13 2007-03-13 画像検索装置、画像検索方法、及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US8400466B2 (ja)
JP (1) JP4951373B2 (ja)
CN (1) CN101266612B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8392842B1 (en) * 2008-06-19 2013-03-05 Adobe Systems Incorporated Quick search for replacement of portion of image
BR112012004693A2 (pt) * 2009-09-04 2019-09-24 Koninl Philips Electronics Nv sistema para recuperar uma imagem a partir do armazenamento de imagens, sistema de base de dados, aparelho para aquisição de imagem, estação de trabalho, método (m) de recuperação de uma imagem a partir do armazenamento de imagens e produto de programa de computador a ser carregado por uma organização de computador
CN101853297A (zh) * 2010-05-28 2010-10-06 英华达(南昌)科技有限公司 一种在电子设备中快速获得期望图像的方法
US9183261B2 (en) 2012-12-28 2015-11-10 Shutterstock, Inc. Lexicon based systems and methods for intelligent media search
US20170061935A1 (en) * 2015-08-31 2017-03-02 Sap Se Adaptive message display duration
JP6876914B2 (ja) * 2017-03-21 2021-05-26 富士フイルムビジネスイノベーション株式会社 情報処理装置
CN114413442B (zh) * 2022-01-07 2023-02-17 Tcl空调器(中山)有限公司 避风区识别方法、空调器、电子设备及可读存储介质

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01106268A (ja) * 1987-10-20 1989-04-24 Nippon Telegr & Teleph Corp <Ntt> 画像蓄積・表示方法
JPH041846A (ja) 1990-04-19 1992-01-07 Toshiba Corp 情報処理方式
JP2816241B2 (ja) * 1990-06-20 1998-10-27 株式会社日立製作所 画像情報検索装置
JPH07325934A (ja) * 1992-07-10 1995-12-12 Walt Disney Co:The 仮想世界に向上したグラフィックスを提供する方法および装置
JP3344774B2 (ja) 1993-06-25 2002-11-18 株式会社リコー 矩形分類方法
JPH07121557A (ja) * 1993-10-22 1995-05-12 Fuji Xerox Co Ltd 画像検索装置
JPH07271819A (ja) * 1994-03-31 1995-10-20 Toshiba Corp 画像検索装置
JPH0981583A (ja) * 1995-09-12 1997-03-28 Toshiba Corp ドキュメントファイリング装置および方法
JPH09114923A (ja) 1995-10-23 1997-05-02 Ricoh Co Ltd 領域分割装置
US6008807A (en) * 1997-07-14 1999-12-28 Microsoft Corporation Method and system for controlling the display of objects in a slide show presentation
US6243501B1 (en) * 1998-05-20 2001-06-05 Canon Kabushiki Kaisha Adaptive recognition of documents using layout attributes
US6463432B1 (en) * 1998-08-03 2002-10-08 Minolta Co., Ltd. Apparatus for and method of retrieving images
US6970602B1 (en) * 1998-10-06 2005-11-29 International Business Machines Corporation Method and apparatus for transcoding multimedia using content analysis
US7281199B1 (en) * 1999-04-14 2007-10-09 Verizon Corporate Services Group Inc. Methods and systems for selection of multimedia presentations
DE60119418T2 (de) * 2000-03-22 2007-05-24 Kabushiki Kaisha Toshiba, Kawasaki Gesichtsbildaufnehmendes Erkennungsgerät und Passüberprüfungsgerät
US7432940B2 (en) * 2001-10-12 2008-10-07 Canon Kabushiki Kaisha Interactive animation of sprites in a video production
JP4040905B2 (ja) 2002-05-16 2008-01-30 株式会社リコー 縮小画像表示装置、方法、プログラムおよびプログラムを記録した記録媒体
WO2004047026A1 (ja) * 2002-11-20 2004-06-03 Fujitsu Limited 画像検索プログラム
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2004334339A (ja) * 2003-04-30 2004-11-25 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP4388301B2 (ja) * 2003-05-08 2009-12-24 オリンパス株式会社 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体
JP4001846B2 (ja) 2003-06-25 2007-10-31 株式会社リコー 画像表示装置、画像表示方法、画像表示プログラムおよび画像表示プログラムを格納した記録媒体
US7171618B2 (en) * 2003-07-30 2007-01-30 Xerox Corporation Multi-versioned documents and method for creation and use thereof
JP4391157B2 (ja) 2003-08-15 2009-12-24 株式会社リコー 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体
US7386789B2 (en) * 2004-02-27 2008-06-10 Hewlett-Packard Development Company, L.P. Method for determining logical components of a document
JP2006065368A (ja) * 2004-08-24 2006-03-09 Sony Corp 画像表示装置,画像表示方法,およびコンピュータプログラム
US7801392B2 (en) * 2005-07-21 2010-09-21 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
JP4730775B2 (ja) * 2005-12-14 2011-07-20 株式会社リコー 画像処理装置
JP4764231B2 (ja) * 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
US8612847B2 (en) * 2006-10-03 2013-12-17 Adobe Systems Incorporated Embedding rendering interface

Also Published As

Publication number Publication date
US8400466B2 (en) 2013-03-19
US20080225316A1 (en) 2008-09-18
JP2008225871A (ja) 2008-09-25
CN101266612A (zh) 2008-09-17
CN101266612B (zh) 2011-08-17

Similar Documents

Publication Publication Date Title
JP4951373B2 (ja) 画像検索装置、画像検索方法、及びコンピュータプログラム
US7610274B2 (en) Method, apparatus, and program for retrieving data
JP5665125B2 (ja) 画像処理方法、及び、画像処理システム
JP2008108200A (ja) 情報抽出装置及び方法、並びにプログラム及び記憶媒体
JP2007288769A (ja) 画像形成装置、メール配信サーバおよび情報処理装置
JP2008097175A (ja) 電子ファイル検索装置
JPWO2017061253A1 (ja) 表示制御装置、表示制御方法及び表示制御プログラム
JP2008003669A (ja) 画像表示装置及び表示方法
JP2006189924A (ja) 画像表示プログラム及び画像表示装置
JP2006018630A (ja) データ検索方法及び装置、プログラム、コンピュータ可読メモリ
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP2007323474A (ja) Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体
JP2008176764A (ja) 画像処理システム、画像処理方法、画像処理プログラム
JP2010020590A (ja) スケジュール管理装置およびスケジュール管理プログラム
JP2008071311A (ja) 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体
JP2005115457A (ja) 文書ファイル検索方法
JP2004334530A (ja) ウェブサイト編集支援システム及び方法
JP4960401B2 (ja) 画像表示プログラム及び画像表示装置
JP4842246B2 (ja) 情報検索装置及びプログラム
US20230252000A1 (en) Information processing system, information processing method, and non-transitory computer readable medium
US11914654B2 (en) Document management apparatus, document management system, and non-transitory computer readable medium storing program
JP2010097296A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2007026263A (ja) 文字認識装置及びコンピュータプログラム
US20150062660A1 (en) File management apparatus and file management method
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20120130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120312

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4951373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees