JPH1125113A - 画像検索装置,画像検索用キーテキストの生成方法,並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
画像検索装置,画像検索用キーテキストの生成方法,並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体Info
- Publication number
- JPH1125113A JPH1125113A JP9181610A JP18161097A JPH1125113A JP H1125113 A JPH1125113 A JP H1125113A JP 9181610 A JP9181610 A JP 9181610A JP 18161097 A JP18161097 A JP 18161097A JP H1125113 A JPH1125113 A JP H1125113A
- Authority
- JP
- Japan
- Prior art keywords
- image
- key
- area
- search
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 60
- 238000000605 extraction Methods 0.000 claims description 76
- 239000000284 extract Substances 0.000 claims description 29
- 210000000746 body region Anatomy 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
いることにより、格納した文書中の画像を容易に検索で
きるようにすること。 【解決手段】 図,表,写真等の画像および文字列が混
在した文書を入力し、入力した文書から画像を含む画像
領域および文字列を含む文字領域を認識して抽出する領
域識別・分割処理部202と、文字領域の文字列から画
像領域の画像に関連づけするキーテキストと定義した文
字列を抽出するキーテキスト抽出部205と、画像領域
の画像およびキーテキストを関連づけて格納する画像D
B102およびテキストDB103と、検索語を入力す
るための入力装置211と、入力装置211を介して入
力した検索語に基づいて、該当するキーテキストを検索
する検索要求・結果出力部213および検索実行部21
4と、検索結果を入力し、入力した検索結果を画面表示
する出力装置212と、を少なくとも備えている。
Description
画像および文字列が混在した文書中の画像を検索するも
のであって、文書中の画像およびその画像について記述
した文字列を抽出し、かつ、それらを関連づけして格納
し、任意の検索語に基づいて、格納した文字列を検索し
て、該当する文字列に関連づけられた画像を出力する画
像検索装置,画像検索用キーテキストの生成方法,並び
にその装置としてコンピュータを機能させるためのプロ
グラムおよびその方法をコンピュータに実行させるため
のプログラムを記録したコンピュータ読み取り可能な記
録媒体に関する。
来は紙をファイリングすることによって保存していた文
書を、電子化された情報として保存することが一般的と
なってきている。その結果、電子化された情報として保
存した文書を有効に活用するために、保存した大量の情
報の中から必要な情報を検索する技術が重要となってき
ている。
字情報だけではなく、図,表,写真等の画像情報も含ま
れる。文字情報を検索する際には、検索語を入力し、入
力した検索語と文字情報とのマッチング処理等を行うこ
とにより、検索語に該当する文字情報を見つけ出すこと
ができる。ところが、画像情報自身は、検索語とマッチ
ング処理するための情報を有していないため、以下の第
1から第3の例として説明するような方法で検索対象と
なる情報を生成して各画像に付与し、付与した情報を用
いて、所望の画像を検索できるようにしている。
文字列が混在した文書中の画像を検索する方法に関する
ものであって、文書から抽出した画像中に存在する文字
列をさらに抽出し、抽出した文字列を文字認識して画像
検索用のキーワードとしたものである(特開平1−19
6560号公報『文書検索方法及び文書検索装置』)。
すなわち、この方法は、画像自身に含まれた文字列を抽
出してその画像のキーワードとし、このキーワードを検
索することにより、該当する画像を出力することができ
るようにしたものである。
人手により各画像にキーワードを付与し、付与したキー
ワードを検索することにより、該当する画像を出力する
ことができるようにしたものである(電子情報通信学会
論文誌,D−II,Vol.J73−D−II,No.
4,pp.526−534,1990年4月)。
し、画像の色や構造等の特徴を抽出してデータベース化
し、画像を検索する際に、データベース化した画像の特
徴を指定することにより、該当する画像を出力すること
ができるようにしたものである(Query by I
mage and Video Content:Th
e QBIC System,Computer,Se
ptember 1995)。
1の例によれば、画像中の文字列をキーワードとして用
いるため、文字列を含まない画像からはキーワードを得
ることができないという問題点があった。加えて、キー
ワードを得ることができたとしても、得たキーワードは
画像中の文字列であるため、画像検索の対象として十分
な情報ではない場合があるという問題点があった。
画像にキーワードを付与する処理が必要となるため、大
量の画像を検索することができるようにするためには莫
大な労力が必要であるという問題点があった。
像の色や構造等の特徴を抽出し、抽出した画像の特徴を
画像検索用の情報とするため、色等を指定した極めて低
い次元の検索しか行うことができず、「画像検索の構成
を示した図」等の検索語を用いた高次元の検索を行うこ
とができないという問題点があった。
中の文字列を用いたキーワード,人手により付与したキ
ーワードおよび画像の特徴のみを用いて単に画像を検索
するものであるため、検索に関する知識の少ないユーザ
が、ノイズのない検索処理や、漏れのない検索処理を選
択的に行うことは非常に困難であるという問題点があっ
た。
像中の文字列を用いたキーワード,人手により付与した
キーワードおよび画像の特徴のみを用いて画像を検索
し、検索結果を表示するのみであるため、大量の画像が
検索結果としてヒットした場合等においては、ユーザが
所望の画像を容易に選択することが困難であるという問
題点があった。
て、図,表,写真等の画像および文字列が混在した文書
中の画像を検索対象として格納し、文書中の文字列を検
索用のテキストとして用いて、格納した画像を容易に検
索できるようにすることを目的とする。
であって、図,表,写真等の画像および文字列が混在し
た文書中の画像を検索するための画像検索用のテキスト
として、文書中から画像について記述した文字列を自動
的に抽出することができるようにすることを目的とす
る。
であって、入力した検索語に対する漏れのない検索や、
ノイズの少ない検索をユーザの要求に応じて容易に行う
ことができるようにすることを目的とする。
のであって、検索結果を表示する際に、所望の画像を容
易に選択することができるようにすることを目的とす
る。
め、請求項1の画像検索装置は、画像の検索に用いる任
意の文字列をキーテキストと定義し、前記キーテキスト
を検索対象となる画像毎に用意すると共に、用意したキ
ーテキストおよび対応する前記画像をそれぞれ関連づけ
て格納しておき、任意の検索語に基づいて前記キーテキ
ストを検索し、該当するキーテキストに関連づけられた
画像を出力する画像検索装置であって、図,表,写真等
の画像および文字列が混在した文書を入力する文書入力
手段と、前記文書入力手段を介して入力した文書から前
記画像を含む画像領域および文字列を含む文字領域を認
識して抽出する領域抽出手段と、前記領域抽出手段で抽
出した文字領域の文字列から前記画像領域の画像に関連
づけする前記キーテキストを抽出するキーテキスト抽出
手段と、前記領域抽出手段で抽出した画像領域の画像お
よび前記キーテキスト抽出手段で抽出したキーテキスト
を関連づけて格納する格納手段と、前記検索語を入力す
るための入力手段と、前記入力手段を介して入力した検
索語に基づいて、該当するキーテキストを検索する検索
手段と、前記検索手段から検索結果を入力し、入力した
検索結果を画面表示する表示手段と、を備えたものであ
る。
1に記載の画像検索装置において、前記文書が、前記文
字列および画像が記録された紙文書であり、前記文書入
力手段が、前記紙文書を光学的に読み取って電子化した
文書を得るための読取手段であり、さらに、前記領域抽
出手段で抽出した文字領域中の文字列の文字認識を行う
文字認識手段を備えたものである。
1または2に記載の画像検索装置において、さらに、前
記文書入力手段を介して入力した文書がフルカラーの文
書である場合に、前記入力した文書を2値化処理する2
値化処理手段を備えたものである。
1〜3のいずれか1つに記載の画像検索装置において、
前記画像のキャプションを構成する文字列をキーキャプ
ションと定義し、前記キーテキスト抽出手段が、前記画
像に関連づけするキーテキストとして、前記領域抽出手
段で抽出した文字領域の文字列から前記キーキャプショ
ンを抽出するものである。
1〜3のいずれか1つに記載の画像検索装置において、
前記画像について記述したセンテンスを構成する文字列
をキーセンテンスと定義し、前記キーテキスト抽出手段
が、前記画像に関連づけするキーテキストとして、前記
領域抽出手段で抽出した文字領域の文字列から前記キー
センテンスを抽出するものである。
1〜3のいずれか1つに記載の画像検索装置において、
前記画像について記述したパラグラフを構成する文字列
をキーパラグラフと定義し、前記キーテキスト抽出手段
が、前記画像に関連づけするキーテキストとして、前記
領域抽出手段で抽出した文字領域の文字列から前記キー
パラグラフを抽出するものである。
1〜3のいずれか1つに記載の画像検索装置において、
前記画像について記述したページを構成する文字列をキ
ーページと定義し、前記キーテキスト抽出手段が、前記
画像に関連づけするキーテキストとして、前記領域抽出
手段で抽出した文字領域の文字列から前記キーページを
抽出するものである。
1〜3のいずれか1つに記載の画像検索装置において、
前記画像のキャプション並びに前記画像について記述し
たセンテンス,パラグラフおよびページを構成する文字
列をそれぞれキーキャプション,キーセンテンス,キー
パラグラフおよびキーページと定義し、前記キーテキス
ト抽出手段が、前記画像に関連づけするキーテキストと
して、前記領域抽出手段で抽出した文字領域の文字列か
ら前記キーキャプション,キーセンテンス,キーパラグ
ラフおよびキーページをそれぞれ抽出するものである。
1〜8のいずれか1つに記載の画像検索装置において、
前記キーテキスト抽出手段が、前記領域抽出手段で抽出
した画像領域と前記画像領域の近傍に位置する文字領域
との間の距離に基づいて、特定の文字領域の文字列から
前記画像領域の画像に関連づけする前記キーテキストを
抽出するものである。
項9に記載の画像検索装置において、前記画像領域と前
記画像領域の近傍に位置する文字領域との間の距離が、
互いに対向する前記画像領域の辺と前記文字領域の辺と
の間の距離であって、画素を単位とするものである。
項9または10に記載の画像検索装置において、前記文
字領域が、前記画像のキャプションを構成する文字列が
属するキャプション領域と、前記キャプションを構成す
る文字列以外の文字列が属する本文領域とからなり、前
記キーテキスト抽出手段が、前記画像領域から最も近い
距離に位置する前記キャプション領域を特定し、前記特
定したキャプション領域の文字列を前記画像領域の画像
に関連づけする前記キーキャプションとして抽出するも
のである。
項11に記載の画像検索装置において、前記キーテキス
ト抽出手段が、前記キーキャプションを構成する文字列
から前記画像に付与された番号を特定する番号語を抽出
し、前記本文領域の文字列から前記抽出した番号語を検
索して、該当する番号語を含むセンテンス単位の文字列
を前記画像領域の画像に関連づけする前記キーセンテン
スとして抽出するものである。
項9または10に記載の画像検索装置において、前記キ
ーテキスト抽出手段が、前記文字領域の文字列から画像
が存在する方向または位置を指し示す指示語を検索し、
該当する指示語を含むセンテンス単位の文字列を、前記
指示語で示された方向または位置に存在し、前記指示語
を含む文字領域と最も近い画像領域の画像に関連づけす
る前記キーセンテンスとして抽出するものである。
項12または13に記載の画像検索装置において、前記
キーテキスト抽出手段が、前記キーセンテンスを含むパ
ラグラフ単位の文字列を前記画像領域の画像に関連づけ
する前記キーパラグラフとして抽出するものである。
項9または10に記載の画像検索装置において、前記キ
ーテキスト抽出手段が、前記画像領域から最も近い距離
に位置する文字領域を特定し、前記特定した文字領域が
前記画像領域の上方に位置する場合、前記文字領域中の
最も下方に位置するパラグラフ単位の文字列を前記画像
領域の画像に関連づけするキーパラグラフとして抽出
し、前記特定した文字領域が前記画像領域の下方に位置
する場合、前記文字領域中の最も上方に位置するパラグ
ラフ単位の文字列を前記画像領域の画像に関連づけする
キーパラグラフとして抽出し、前記特定した文字領域が
前記画像領域の左方または右方に位置する場合、前記文
字領域の文字列を前記画像領域の画像に関連づけするキ
ーパラグラフとして抽出するものである。
項14または15に記載の画像検索装置において、前記
キーテキスト抽出手段が、前記キーパラグラフが存在す
るページを特定し、特定したページ中の全ての文字領域
の文字列を前記画像領域の画像に関連づけする前記キー
ページとして抽出するものである。
項8または16に記載の画像検索装置において、さら
に、前記格納手段に格納されたキーキャプション,キー
センテンス,キーパラグラフおよびキーページからなる
キーテキストの1部または全てを検索対象として指定す
るための指定手段を備えたものである。
項8または16に記載の画像検索装置において、前記表
示手段が、前記キーキャプションのみの検索結果を示し
た第1の検索結果と、前記キーキャプションおよびキー
センテンスの検索結果の論理和を検索結果として示した
第2の検索結果と、前記キーキャプション,キーセンテ
ンスおよびキーパラグラフの検索結果の論理和を検索結
果として示した第3の検索結果と、前記キーキャプショ
ン,キーセンテンス,キーパラグラフおよびキーページ
の検索結果の論理和を検索結果として示した第4の検索
結果と、をそれぞれ画面表示するものである。
項8または16に記載の画像検索装置において、前記表
示手段が、前記キーキャプションの検索結果を示した第
1の検索結果と、前記第1の検索結果と重複する検索結
果を除いて前記キーセンテンスの検索結果を示した第2
の検索結果と、前記第1および第2の検索結果と重複す
る検索結果を除いて前記キーパラグラフの検索結果を示
した第3の検索結果と、前記第1〜第3の検索結果と重
複する検索結果を除いて前記キーページの検索結果を示
した第4の検索結果と、をそれぞれ画面表示するもので
ある。
項1〜19のいずれか1つに記載の画像検索装置におい
て、前記格納手段が、前記画像を格納する際に、前記画
像を他の画像から識別するための識別情報を付して格納
し、前記表示手段が、前記検索結果として、該当する画
像の識別情報を表示するものである。
項1〜20のいずれか1つに記載の画像検索装置におい
て、前記表示手段が、前記検索結果として、該当するキ
ーテキストを表示するものである。
項1〜21のいずれか1つに記載の画像検索装置におい
て、さらに、前記領域抽出手段で抽出した画像領域の画
像を縮小して、縮小画像を生成する縮小画像生成手段を
備え、前記表示手段が、前記検索結果として、前記縮小
画像生成手段で生成した縮小画像を表示するものであ
る。
項20〜22のいずれか1つに記載の画像検索装置にお
いて、さらに、前記表示手段で画面表示した識別情報,
キーテキストまたは/および縮小画像を選択するための
選択手段を備え、前記表示手段が、前記選択手段を介し
て前記識別情報,キーテキストまたは/および縮小画像
が選択された場合に、該当する前記画像または/および
文書入力手段で入力した文書を画面表示するものであ
る。
トの生成方法は、画像の検索に用いる任意の文字列をキ
ーテキストと定義し、前記キーテキストを検索対象とな
る画像毎に用意すると共に、用意したキーテキストを対
応する前記画像にそれぞれ関連づけて格納しておき、任
意の検索語に基づいて前記キーテキストを検索し、該当
するキーテキストに関連づけられた画像を出力する画像
検索装置における画像検索用キーテキストの生成方法で
あって、図,表,写真等の画像および文字列が混在した
文書を入力する文書入力工程と、前記文書入力工程で入
力した文書から前記画像を含む画像領域および文字列を
含む文字領域を認識して抽出する領域抽出工程と、前記
領域抽出工程で抽出した文字領域の文字列から前記画像
のキャプションを構成する文字列を前記画像領域の画像
に関連づけする前記キーテキストとして抽出する第1の
キーテキスト抽出工程と、前記第1のキーテキスト抽出
工程で抽出した前記文字列から前記画像領域の画像に付
与された番号語を抽出し、前記文字領域の文字列から前
記抽出した番号語を検索して、該当する番号語を含むセ
ンテンス単位の文字列を前記画像領域の画像に関連づけ
する前記キーテキストとして抽出する第2のキーテキス
ト抽出工程と、前記第1のキーテキスト抽出工程で前記
文字列を抽出することができない場合に、前記文字領域
の文字列から前記画像領域の画像が存在する方向または
位置を指し示す指示語を検索し、該当する指示語を含む
センテンス単位の文字列を前記画像領域の画像に関連づ
けする前記キーテキストとして抽出する第3のキーテキ
スト抽出工程と、前記第2または第3のキーテキスト抽
出工程で抽出した前記文字列を含むパラグラフ単位の文
字列を前記画像領域の画像に関連づけする前記キーテキ
ストとして抽出する第4のキーテキスト抽出工程と、前
記第3のキーテキスト抽出工程で前記文字列を抽出する
ことができない場合に、前記画像領域の最も近傍に位置
する文字領域の文字列を前記画像領域の画像に関連づけ
する前記キーテキストとして抽出する第5のキーテキス
ト抽出工程と、前記第4または第5のキーテキスト抽出
工程で抽出した前記文字列を含むページを特定し、特定
したページ中の全ての文字領域中の文字列を前記画像領
域の画像に関連づけする前記キーテキストとして抽出す
る第6のキーテキスト抽出工程と、を含むものである。
可能な記録媒体は、前記請求項1〜23のいずれか1つ
に記載の画像検索装置の各手段としてコンピュータを機
能させるためのプログラムを記録したものである。
り可能な記録媒体は、前記請求項24に記載の画像検索
用キーテキストの生成方法の各工程をコンピュータに実
行させるためのプログラムを記録したものである。
像検索用キーテキストの生成方法,並びにその装置とし
てコンピュータを機能させるためのプログラムおよびそ
の方法をコンピュータに実行させるためのプログラムを
記録したコンピュータ読み取り可能な記録媒体の実施の
形態について、添付の図面を参照しつつ詳細に説明す
る。
装置は、図や表,写真等の画像および文字列が混在した
文書から画像を抽出して格納すると共に、文書中の文字
列を検索用のテキストとして画像に関連づけし、画像に
関連づけした文字列を検索することにより、該当する画
像を得ることができるようにするものである。なお、上
記画像に関連づけする文書中の文字列のことを、キーテ
キストと定義することにする。
像検索システム)のブロック構成図である。図1に示す
画像検索装置は、図や表、写真等の画像および文字列が
混在した紙文書を光学的に読み取って、電子化された文
書を得るためのスキャナ101を備え、入力した文書中
の画像を画像DB(データベース)102に登録し、か
つ、画像について記述した文字列、即ちキーテキストを
文書から抽出し、抽出したキーテキストを画像DB10
2に登録された画像に関連づけしてテキストDB103
に登録する登録サーバ100と、複数の検索クライアン
ト105,106,107からの検索要求に応じて、テ
キストDB103に登録されたキーテキストを検索する
ことにより、該当する画像を画像DB102から出力す
る検索サーバ104と、上記各部を接続するネットワー
ク108と、から構成される。
成図である。実施の形態1の画像検索装置は、大きく登
録処理部200および検索処理部210から構成され
る。登録処理部200は、図1に示した登録サーバ10
0に該当し、検索処理部210は、図1に示した画像D
B102およびテキストDB103,並びに検索要求・
結果出力部213および検索実行部214から構成され
る。なお、検索処理部210の検索要求・結果出力部2
13および検索実行部214は、それぞれ検索クライア
ント105,106,107および検索サーバ104に
該当する。
ャナ101を用いて、図や表、写真等の画像および文字
列が混在した紙文書をフルカラーで読み取ることによっ
て電子化された文書を入力し、入力した文書の全てのペ
ージについて2値化処理を行う2値化処理部201と、
2値化処理部201で2値化処理された文書の各ページ
から画像を含む画像領域および文字列を含む文字領域
(後述するキャプション領域および本文領域)を識別し
て分割する領域識別・分割処理部202と、領域識別・
分割処理部202で分割された画像領域中の画像を画像
DB102に登録する画像DB登録部203と、領域識
別・分割処理部202で分割された文字領域中の文字列
について文字認識を行うOCR部204と、OCR部2
04で文字認識された文字列からキーテキストを抽出す
るキーテキスト抽出部205と、キーテキスト抽出部2
05で抽出したキーテキストを画像DB102に登録さ
れた画像に関連づけてテキストDB103に登録するテ
キストDB登録部206と、を有している。
においては、スキャナ101で読み取った文書を中心に
して説明を行うが、図2に示した登録処理部200は、
スキャナ101で読み取った文書以外に、ワードプロセ
ッサ等のアプリケーションプログラムで作成した文書
や、SGML,HTML等の構造化文書等、いかなる形
式の文書についても扱うことができるものである。ただ
し、ワードプロセッサ等のアプリケーションプログラム
で作成した文書等の場合は、スキャナ101による読み
取りを行う必要がないため、OCR204による文字認
識処理は不要となる。
部202は、文書中の画像領域と文字領域とを識別して
分割すると共に、識別した文字領域をさらに画像、例え
ば図や表に付与されたキャプションを含むキャプション
領域とキャプション以外の文字列を含む本文領域とを識
別して分割するものである。キャプションとは、図や
表、写真等の説明であって、具体的には「図1 画像検
索装置のブロック構成図」のような図や表に対して付与
された文字列である。なお、以下の説明において単に
「画像」という場合には、「図,表,写真等」を意味す
るものとし、また、領域識別・分割処理部202による
領域識別・分割処理については、後に図を参照しつつ詳
細に説明する。
R部204で文字認識された文字列からキーテキストを
自動的に抽出するものである。キーテキストとしては、
文書中の画像の内容を記述した文字列が用いられる。
明図である。ここではキーテキストとして、4種類の文
字列を用意することにする。キーテキストの1つ目は、
文書300(1ページ分)中の画像301に付与された
キャプション、例えば、図3中に示された「図1:シス
テム構成」であり、このキャプションをキーキャプショ
ン302と新たに定義することにする。キーキャプショ
ン302は、画像301に直接対応づけて文書300中
に記載されたものであるため、キーテキストの関連づけ
の対象となる画像301を特定することができる。な
お、キーキャプション302は、領域識別・分割処理部
202で分割されたキャプション領域から得ることがで
きる。このキャプション領域については、後に詳細に説
明する。
いて記述したセンテンス(文)であり、このセンテンス
をキーテキスト303と新たに定義することにする。キ
ーキャプション302には、図3に示すように、画像を
指し示す画像番号語、例えば、図1や表1、写真1等が
含まれている。この画像番号語を含むキーキャプション
302以外の本文中の文字列は、画像番号語で特定され
る画像について記述したものであると考えることができ
る。したがって、この画像番号語を本文領域の文字列か
ら見つけ出し、画像番号語を含む文字列をキーセンテン
ス303として抽出する。
いて記述したパラグラフ(段落)であり、このパラグラ
フをキーパラグラフ304と新たに定義することにす
る。キーパラグラフ304は、キーセンテンス303を
含んだパラグラフ単位の文字列であって、キーセンテン
ス303を取得することによって抽出することができ
る。
いて記述したページ全体の文字列であり、このページ全
体の文字列をキーページ305と新たに定義することに
する。キーページ305は、キーパラグラフ304(キ
ーセンテンス303)を含んだページ単位の文字列であ
って、キーパラグラフ304(キーセンテンス303)
を取得することにより抽出することができる。
トを4つ用意したのは、それぞれに大きな特徴があるか
らである。すなわち、キーキャプション302は、画像
301を極めて端的に説明した文字列であるため、キー
キャプション302を用いて画像を検索した場合には、
検索語に直接対応する画像がヒットし易く、その反面、
関連する画像がヒットすることはほとんどあり得ないと
いう特徴がある(ノイズが少ない)。一方、キーページ
305は、複数のトピックを含んでいる可能性があるた
め、キーページ305を用いて画像を検索した場合に
は、検索語に直接対応する画像のみならず、関連する図
も同時に検索することが可能となるが、その反面、ノイ
ズが多くなるという特徴がある。さらに、キーセンテン
ス303およびキーパラグラフ304は、上記キーキャ
プション302およびキーページ305の中間的な特徴
を有するものである。したがって、漏れのない画像検索
をしたい場合や、漏れがあっても良いが検索語に最も関
連のある画像を検索したい場合等の要求に応じて上記キ
ーテキストを使い分けることにより、所望の検索結果を
得ることができる。
録部206は、キーテキスト抽出部205で抽出したキ
ーテキストを該当する画像301、即ち、画像DB登録
部203で画像DB102に登録する画像301に関連
づけ、テキストDB103に登録する。
ついて説明する。検索要求・結果出力部213は、検索
語等を入力するキーボード等からなる入力装置211
と、検索実行部214から検索結果を入力して出力する
CRT等の出力装置212とを備えている。また、検索
実行部214は、検索要求・結果出力部213から検索
語を入力し、入力した検索語に基づいて、テキストDB
103から該当するキーテキストを検索し、検索したキ
ーテキストに関連づけられた画像を画像DB102から
取得して検索要求・結果出力部213に出力する。な
お、画像検索処理については、後に詳細に説明する。
置の動作について、(1)キーテキスト・画像登録処理
(画像検索用キーテキストの生成方法),(2)画像検
索処理の順で詳細に説明する。
検索用キーテキストの生成方法) 図4は、キーテキスト・画像登録処理を示すフローチャ
ートである。スキャナ101は、用意されたフルカラー
の紙文書を読み取り、電子化された文書300を得る
(S401)。なお、電子化された文書300を得た後
に、孤立点ノイズの除去処理や、傾き補正処理等を行う
ことができる。
読み取ったフルカラーの文書300を入力し、入力した
フルカラーの文書300の2値化処理を行う(S40
2)。2値化処理を行うに当たっては、スキャナ101
で得たRGBのフルカラーデータを一旦HSI(色相,
彩度,明度)データに変換した後、明度に基づいて特定
の閾値で分離して2値化する。2値化処理部201にお
いて、フルカラーの文書300が2値化されるため、後
の領域識別処理や文字認識処理の高速化を図ることがで
きる。
理部201で2値化した文書300を入力し、文書30
0の各ページ毎に、画像領域,キャプション領域および
本文領域を認識し、分割する処理を行う(S403)。
また、領域識別・分割処理部202は、分割した画像領
域,キャプション領域および本文領域の位置情報を取得
する。
は、連結する黒点を包含し、矩形のサイズが大きいもの
を画像領域として認識し、画像領域に近接する1〜3行
程度のテキストを包含する小領域をキャプション領域と
して認識し、その他の領域を本文領域として認識する。
なお、キャプション領域502を特定するに当たって
は、互いに対向する画像領域501の辺とキャプション
領域502の辺との間の画素を単位とした距離を基準と
する。
を示す説明図である。図5において、501は画像30
1を含む画像領域を、502はキャプション領域を、5
03は本文領域をそれぞれ示している。キャプション領
域502は、上述したキャプション、例えば、図5に示
す「図1:システム構成」等の文字列を含む領域であ
る。
域抽出・分割処理部202から領域識別・分割処理の結
果を入力し、スキャナ101で読み取ったフルカラーの
文書から、画像領域501に該当する領域の画像301
を抽出し、抽出した画像301にIDを付与して画像D
B102に登録する(S404)。このIDは、画像3
01を他の画像と識別するために用いるものであると共
に、画像検索により画像301がヒットした場合に、そ
の検索結果として表示するためのものである。
には、領域抽出・分割処理部202で取得した画像領域
501の位置情報も合わせて登録する。これは、画像D
B102に登録される画像が、画像301を単位とする
のではなく、実際には文書を構成する各ページを読み取
ることによって得たページ画像を単位とするものである
からである。すなわち、画像DB102には、ページ画
像として、ページ画像IDおよびページ画像データが登
録されると共に、画像301として、画像ID,画像3
01が存在するページのページ画像IDおよび画像領域
の位置情報が登録される。
する際には、登録する画像301の縮小画像を生成し、
生成した縮小画像を元の画像301に関連づけして登録
することができる。この縮小画像は、検索結果を表示す
る際に、画像301に代えて表示するためのものであ
る。さらに、画像DB102には、画像領域501を含
む文書のページおよび/または文書全体を画像301に
関連づけて登録することができる。その結果、画像30
1を画面表示する際に、文書全体および/または画像3
01を含んだページを画面表示することができる。
202から領域識別・分割処理の結果を入力し、分割さ
れたキャプション領域502および本文領域503につ
いて、行切り出しや文字切り出し処理を行って、文字認
識処理を行う(S405)。OCR部204は、キャプ
ション領域502および本文領域503の位置情報と共
に、文字認識処理の結果をキーテキスト抽出部205に
出力する。
04から文字認識結果並びにキャプション領域502お
よび本文領域503の位置情報を、領域識別・分割処理
部202から画像領域501の位置情報をそれぞれ入力
し、文字認識された文字列から上述したキーテキストを
抽出する処理を行う(S406)。
キストの抽出処理を具体的に説明する。図6は、キーテ
キスト抽出処理を示すフローチャートである。キーテキ
スト抽出部205は、領域識別・分割処理部202で識
別されたキャプション領域502の文字列をキーキャプ
ション302として設定する(S601)。なお、領域
識別・分割処理部202でキャプション領域502を認
識する処理を行わなかった場合には、画像領域501に
近接する1〜3行程度のテキストを包含する小領域をキ
ャプション領域502として特定することができる。キ
ャプション領域502を特定するに当たっては、互いに
対向する画像領域501の辺とキャプション領域502
の辺との間の画素を単位とした距離を基準とする。
したキーキャプション302から画像番号語、例えば、
図1,表1,写真1等を抽出する(S602)。キーテ
キスト抽出部205には、予め図1,図−1,図
(1),図1.2,図1.12,図1.a等の図や,
表,写真,Figure,Fig.等の画像番号語が登
録されており、これら登録された画像番号語とキーキャ
プション302を構成する文字列との照合を行うことに
よって、キーキャプション302から画像番号語を抽出
する。ここではキーキャプション302の「図1:シス
テムの構成」から「図1」が抽出される(図3および図
5参照)。キーキャプション302から画像番号語「図
1」を抽出することにより、画像領域501の画像30
1を直接指し示す語を得ることができる。
テップS602で抽出した画像番号語「図1」を含む文
字列を文書300全ての本文領域503から見つけ出す
(S603)。
03から見つけた場合には、画像番号語「図1」を含む
文字列をセンテンス(文)単位で抽出し、キーセンテン
ス303とする(S604)。
列をパラグラフ単位で抽出し、キーパラグラフ304と
する(S605)。
テンス303)を含む文字列をページ単位で抽出し、キ
ーページ305とする(S606)。
6は、キーテキスト抽出部205で抽出したキーキャプ
ション302,キーセンテンス303,キーパラグラフ
304およびキーページ305からなるキーテキストを
入力すると共に、画像DB登録部203から該当する画
像に付与した画像IDを入力し、入力したキーテキスト
を画像IDと共にテキストDB103に登録する(S4
07)。キーテキストを画像IDと共にテキストDB1
03に登録することにより、キーテキストと画像301
との関連づけを行うことができる。
文書300中に存在する各画像それぞれについて行われ
る。
を用いて、画像DB102に登録された画像を検索する
処理について説明する。
チャートである。検索要求・結果出力部213は、入力
装置211からキーテキスト、即ちキーキャプション3
02,キーセンテンス303,キーパラグラフ304お
よびキーページ305のいずれを対象として画像を検索
するかの指定を入力する(S701)。なお、キーテキ
ストを指定する際には、キーキャプション302等を1
つ指定するのみならず、キーテキストのいずれかを組み
合わせて複数指定したり、キーテキストの全てを指定す
ることができる。
きるようにすることにより、漏れがあっても良いが、検
索語に直接関連した画像を検索したい場合(ノイズの少
ない検索)にはキーキャプションを指定し、漏れのない
広範囲の検索を行いたい場合にはキーページを指定する
等、ユーザの検索要求に応じた検索方法の指定を行うこ
とができる。したがって、検索の目的に応じて、どのよ
うな検索語を入力したら良いかを考える必要をなくすこ
とができる。
入力装置211から検索語を入力し、入力した検索語と
ステップS701で入力したキーテキストの指定(検索
対象の指定)とを検索実行部214に出力する(S70
2)。なお、キーテキストの指定と検索語の入力につい
ては、いずれを先に行っても良い。
部213から検索語およびキーテキストの指定を入力
し、入力した検索語に基づいて、テキストDB103中
の該当するキーテキストをそれぞれ検索する(パターン
マッチ検索:S703)。
703で検索した結果を検索要求・結果出力部213に
出力し、検索要求・結果出力部213は入力した検索結
果を出力装置212に出力する(S704)。
図である。この図8は、検索語を「検索」とし、検索対
象のキーテキストとしてキーキャプション302を指定
した場合の検索結果を示したものである。図8において
は、検索結果として画像IDと、画像に関連づけされた
キーテキストの全てが一覧表示されている。もちろん、
検索結果として画像IDのみを表示しても良いし、キー
テキストの全てではなく、該当するキーキャプション3
02のみを表示しても良い。ユーザは、一覧表示された
キーテキストの内容を確認することにより、所望の画像
を選択することができる。
0を選択すると、図9に示すように、一覧表示された画
像IDに該当する画像の縮小画像が一覧表示される。こ
の縮小画像は、画像DB登録部203によって生成・登
録されたものである(図4のステップS404参照)。
キーテキストのみでは所望の画像であるかを判断するこ
とができない場合に、縮小画像を一覧表示することがで
きるようにすることによって、所望の画像を容易に選択
することができる。また、縮小画像であるため、データ
量が少なく、高速に表示することが可能となる。なお、
図8に示した検索結果に、図9に示した縮小画像を合わ
せて表示することにしても良い。
トまたは図9に示す縮小画像を選択することにより、該
当する画像301や、必要に応じて、この画像301を
含む文書全体,画像301が存在するページが表示され
る。なお、画像301を画像DB102に登録する際
に、同一文書中の他の画像と関連づけしておくことによ
り、1つの画像から同一文書中の他の画像を辿って表示
することができる。また、文書中のページについても、
同一文書中の他のページと関連づけしておくことによ
り、表示したページに基づいて他のページを表示するこ
とができる。
は全てを検索対象として指定して検索し、その検索の結
果を表示することにしたが、次のような検索対象の指定
および検索結果の表示を行うこともできる。すなわち、 a キーキャプション302を検索対象として検索し、
検索結果を表示し、 b キーキャプションおよびキーセンテンスを検索対象
として検索し、それぞれの検索結果のOR(論理和)を
検索結果として表示し、 c キーキャプション,キーセンテンスおよびキーパラ
グラフを検索対象として検索し、それぞれの検索結果の
ORを検索結果として表示し、 d キーキャプション,キーセンテンス,キーパラグラ
フおよびキーページを検索対象として検索し、それぞれ
の検索結果のORを検索結果として表示する、というよ
うに、検索対象に包含関係を作り、4つの検索結果のリ
ストを表示するというものである。
要求に応じた検索結果であって、かつ、ユーザが画像を
選択しやすい検索結果を得ることができる。すなわち、
aの場合は、画像を極めて端的に説明した文字列である
キーキャプション302が検索対象となっているため、
検索語に最も関連のある画像を得ることができる。一
方、b〜d、特にdの場合は、aの場合で得た画像に関
連する画像も同時に得ることができる。なお、a〜dに
示す全ての方法で同時に検索・結果表示を行わなければ
ならないのではなく、いずれか一つまたは複数を選択す
ることができるようにしても良い。
検索結果の表示を行うこともできる。すなわち、 a 最初にキーキャプションを検索対象として検索し、
検索結果を一覧表示し、 b 次にキーセンテンスを検索対象として検索し、既に
一覧表示された結果を除いた検索結果を一覧表示し、 c 次にキーパラグラフを検索対象として検索し、既に
一覧表示された結果を除いた検索結果を一覧表示し、さ
らに、 d 最後にキーページを検索対象として検索し、既に一
覧表示された結果を除いた検索結果を一覧表示する、と
いうものである。
り、検索語に関連のある順序で検索結果が一覧表示され
るため、ユーザは上から順にキーテキストを参照するこ
とで容易に所望の画像を得ることができる。すなわち、
aの場合の検索結果から、検索語に最も関連のある画像
を得ることができ、また、b〜dの検索結果に向かうに
従って、関連の深い画像から浅い画像へと段階的な検索
結果を得ることができる。
ントにそれぞれの検索や登録という役割を持たせ、ネッ
トワーク108を介して画像検索システムを構成した例
を示したが、1つのコンピュータに全ての機能を持た
せ、スタンドアローンという形態で本実施の形態の画像
検索装置を構成することもできる。また、図1において
は、画像DB102およびテキストDB103がそれぞ
れ独立して存在するように示したが、これらを検索サー
バ104の管理下に置くように構成することもできる。
によれば、文字列および図,表,写真等の画像が混在し
た文書から抽出した画像を検索対象とする場合に、検索
対象の画像について記述した文書中の文字列を画像検索
用のキーテキストとして用いることにしたため、文書中
に記述された画像の説明を用いて所望の画像を検索する
ことができ、画像検索処理の利便性の向上を図ることが
できる。
連のあるキャプションを構成する文字列,キャプション
に基づいて抽出したセンテンス,パラグラフおよびペー
ジを構成する文字列を用いることにしたため、画像検索
用のキーテキストとして、適切な文字列を抽出すること
ができる。すなわち、上述した画像番号語を含むキーキ
ャプション302,キーセンテンス303,キーパラグ
ラフ304およびキーセンテンス305は、画像番号語
によって特定される画像について記述していると考えら
れるため、画像番号語によって特定される画像を検索す
るためのキーテキストとして適切なものとなる。
関連のあるキャプションを構成する文字列,キャプショ
ンに基づいて抽出したセンテンス,パラグラフおよびペ
ージを構成する文字列を用いることにしたため、キーテ
キストを使い分けることにより、ノイズの少ない検索や
漏れのない検索等、ユーザの要求に応じた検索を容易に
行うことができる。したがって、検索に関する知識が少
ないユーザであっても、いかなる検索語を入力するかを
悩むことなく、所望の方法で検索を行うことができる。
装置の実施の形態2について説明する。上述した実施の
形態1においては、キーキャプション302を抽出する
と共に、キーキャプション302中の画像番号語を用い
て、キーセンテンス303,キーパラグラフ304およ
びキーセンテンス305を抽出し、これらをキーテキス
トとするという方法について説明したが、実施の形態2
の画像検索装置では、本文領域503から画像301の
方向または位置を指し示す語(以下、「画像指示語」と
記述する)を抽出し、抽出した画像指示語に基づいて、
キーテキストを抽出するというものである。
については、実施の形態1で説明したものと同様である
ため、ここでは詳細な説明を省略する。また、キーテキ
スト・画像登録処理および画像検索処理において、キー
テキストの抽出処理以外については実施の形態1で説明
した通りであるため、これらについても説明を省略す
る。
ーチャートであり、図11はキーテキスト抽出処理によ
って抽出されるキーテキストを説明するための説明図で
ある。キーテキスト抽出部205には、予め、上(の)
図,下(の)図,右(の)図,左(の)図,前(の)ペ
ージの図,次(の)ページの図,上(の)表,下(の)
表,右(の)表,左(の)表,前(の)ページの表,次
(の)ページの表,上(の)写真,下(の)写真,右
(の)写真,左(の)写真,前(の)ページの写真,次
(の)ページの写真等の画像指示語が登録されている。
これらの画像指示語は、上の図や下の図等の画像301
が存在する方向を指し示す語と、前のページや次のペー
ジ等の画像301が存在する位置を指し示す語とがあ
る。キーテキスト抽出部205は、登録された画像指示
語と本文領域503の文字列との照合を行うことによっ
て、本文領域503に存在する画像指示語を検索する
(S1001)。
本文領域503から画像指示語、例えば「左の図」を見
つけ出したとする。キーテキスト抽出部205は、画像
指示語「左の図」を含む文字列をセンテンス単位で抽出
してキーセンテンス303を取得する(S1002)。
換言すれば、本文領域503の文字列から画像301が
存在する方向または位置を指し示す画像指示語を検索
し、該当する指示語を含むセンテンス単位の文字列を、
画像指示語で示された方向または位置に存在し、画像指
示語を含む本文領域503と最も近い画像領域501の
画像301に関連づけするキーセンテンス303として
抽出することになる。
ーセンテンス303を含む文字列をパラグラフ単位で抽
出し、キーパラグラフ304を取得する(S100
3)。
ーパラグラフ304(キーセンテンス303)を含む文
字列をページ単位で抽出し、キーページ305を取得す
る(S1004)。
ーテキスト抽出部205で抽出したキーセンテンス30
3,キーパラグラフ304およびキーページ305から
なるキーテキストを入力すると共に、画像DB登録部2
03から該当する画像に付与した画像IDを入力し、入
力したキーテキストを画像IDと共にテキストDB10
3に登録する(図4のS407参照)。キーテキストを
画像IDと共にテキストDB103に登録することによ
り、キーテキストと画像301との関連づけを行うこと
ができる。
文書300中に存在する各画像毎にそれぞれ行われ、抽
出されたキーテキストは、実施の形態1で説明したよう
に、画像を検索するための検索対象とされる。
によれば、画像検索用のキーテキストとして、画像が存
在する方向または位置を特定する画像指示語を含むセン
テンス,パラグラフおよびページを構成する文字列を用
いることにしたため、画像検索用のキーテキストとし
て、適切な文字列を抽出することができる。すなわち、
画像指示語を含むセンテンス等は、画像指示語によって
指し示された画像について記述していると考えられるた
め、画像指示語によって指し示された画像の検索のため
のキーテキストとして適切なものとなる。
索装置の実施の形態3について説明する。実施の形態3
の画像検索装置は、実施の形態1で説明した画像番号語
や実施の形態2で説明した画像指示語を用いることなし
に、キーテキストを抽出することができるようにするも
のである。すなわち、実施の形態3の画像検索装置は、
文書300中の画像領域501に対して最も近傍に位置
する本文領域503からキーテキストを抽出するもので
ある。
については、実施の形態1で説明したものと同様である
ため、ここでは詳細な説明を省略する。また、キーテキ
スト・画像登録処理および画像検索処理において、キー
テキストの抽出処理以外については実施の形態1で説明
した通りであるため、これらについても説明を省略す
る。
ーチャートであり、図13はキーテキスト抽出処理によ
って抽出されるキーテキストを説明するための説明図で
ある。キーテキスト抽出部205は、OCR部204か
ら文字認識処理の結果および本文領域の位置情報を入力
すると共に、領域識別・分割処理部202から画像領域
の位置情報を入力する。そして、キーテキスト抽出部2
05は、画像領域501と隣接する本文領域503との
間の距離を演算して求める(S1201)。図13にお
いては、画像領域501および本文領域503aの間の
距離aと、画像領域501および本文領域503bの間
の距離bを求めることになる。
aのように、画像領域501に対して本文領域503が
左右いずれかに存在するような場合は、両方の領域の垂
直の辺同士の距離(距離a)を画素単位で演算する。一
方、画像領域501と本文領域503bのように、画像
領域501に対して本文領域503が上下いずれかに存
在するような場合は、両方の領域の水平の辺同士の距離
(距離b)を画素単位で演算する。なお、文書が2段組
等で構成されているような場合であって、段と段との間
にセパレータが設けられているような場合には、その間
の距離を論理的に遠くなるような演算を行うことができ
る。
テップS1201における演算結果に基づいて、画像領
域501に対して最も近傍に位置する本文領域503中
の文字列をパラグラフ単位で抽出し、抽出した文字列を
キーパラグラフ304とする(S1202)。図13に
おいては、距離bが距離aに比べて短いため、本文領域
503bが画像領域501に対して最も近傍に位置して
いることになる。そこで、本文領域503bにおいて、
画像領域501に最も近い文字列をパラグラフ単位で抽
出して、キーパラグラフ304とする。
ーパラグラフ304を含む文字列をページ単位で抽出
し、キーページ305を取得する(S1203)。
ーテキスト抽出部205で抽出したキーパラグラフ30
4およびキーページ305からなるキーテキストを入力
すると共に、画像DB登録部203から該当する画像に
付与した画像IDを入力し、入力したキーテキストを画
像IDと共にテキストDB103に登録する(図4のS
407参照)。キーテキストを画像IDと共にテキスト
DB103に登録することにより、キーテキストと画像
301との関連づけを行うことができる。
00中に存在する各画像毎にそれぞれ行われ、抽出され
たキーテキストは、実施の形態1で説明したように、画
像を検索するための検索対象とされる。
1を挟んで本文領域503a,503bが上下に存在す
る場合には、画像領域501と本文領域503aおよび
本文領域503bとにおける水平の辺同士の距離を演算
し、最も近傍に位置する本文領域を選択する。画像領域
501に対して上に位置する本文領域503aが本文領
域503bより画像領域501に近接している場合に
は、画像領域503a内の最も下(画像領域501に最
も近い)のパラグラフをキーパラグラフ304として抽
出する。一方、画像領域501に対して下に位置する本
文領域503bが本文領域503aより画像領域501
に近接している場合には、画像領域503b内の最も上
(画像領域501に最も近い)のパラグラフをキーパラ
グラフ304として抽出する。もし、画像領域501と
本文領域503aおよび本文領域503bとの間の距離
がそれぞれ等しい場合には、両方からキーパラグラフ3
04を抽出することにしても良い。
1を挟んで本文領域503a,503bが左右に存在す
る場合には、画像領域501と本文領域503aおよび
本文領域503bとにおける垂直の辺同士の距離を演算
し、最も近傍に位置する本文領域を選択する。画像領域
501を挟んで本文領域503a,503bが左右に存
在する場合は、図14に示す上下の場合と異なり、画像
領域501に最も近接する本文領域の全ての文字列をキ
ーパラグラフとして抽出する。もし、画像領域501と
本文領域503aおよび本文領域503bとの間の距離
がそれぞれ等しい場合には、本文領域503a,503
bの全ての文字列をキーパラグラフ304として抽出す
ることにしても良い。
によれば、画像検索用のキーテキストとして、画像領域
501に対して最も近傍に位置する本文領域503中の
文字列およびその文字列を含むページ単位の文字列を用
いることにしたため、画像検索用のキーテキストとし
て、適切な文字列を抽出することができる。すなわち、
画像の最も近傍に位置する本文領域の文字列は、該当す
る画像について記述したものあると考えられるため、画
像検索用のキーテキストとして適切なものとなる。
索装置の実施の形態4について説明する。実施の形態4
の画像検索装置は、実施の形態1〜3で説明したキーテ
キスト抽出処理を組み合わせて、あらゆる種類の文書か
らキーテキストを抽出することができるようにしたもの
である。
については、実施の形態1で説明したものと同様である
ため、ここでは詳細な説明を省略する。また、キーテキ
スト・画像登録処理および画像検索処理において、キー
テキストの抽出処理以外については実施の形態1で説明
した通りであるため、これらについても説明を省略す
る。
ーチャートである。キーテキスト抽出部205は、OC
R部204から文字認識処理の結果および本文領域の位
置情報を入力すると共に、領域識別・分割処理部202
から画像領域の位置情報を入力する。そして、キーテキ
スト抽出部205は、実施の形態1で説明したキーキャ
プション302を抽出する処理を行う(S1601)。
ション302を抽出することができた場合には、キーキ
ャプションから画像番号語を抽出する処理を行う(S1
602)。
ーキャプションから画像番号語を抽出することができた
場合には、実施の形態1で説明したように、画像番号語
に基づいて、キーセンテンス303,キーキャプション
304およびキーページ305を抽出する(S160
3)。
ションがない場合や、ステップS1602において画像
番号語を抽出することができなかった場合には、ステッ
プS1604に進み、実施の形態2で説明したように、
本文領域503に存在する画像指示語を検索する(S1
604)。
03から画像指示語を見つけ出すことができた場合に
は、実施の形態2で説明したように、画像指示語に基づ
いて、キーセンテンス303,キーパラグラフ304お
よびキーページ305を抽出する(S1605)。
域503から画像指示語を見つけ出すことができなかっ
た場合には、実施の形態3で説明したように、画像領域
501と画像領域501に隣接する本文領域503との
間の距離を演算する(S1606)。
結果に基づいて、画像領域501に対して最も近傍に位
置する本文領域503を特定し、特定した本文領域50
3に基づいて、キーパラグラフ304およびキーページ
305を抽出する。
ーテキスト抽出部205で抽出したキーテキストを入力
すると共に、画像DB登録部203から該当する画像に
付与した画像IDを入力し、入力したキーテキストを画
像IDと共にテキストDB103に登録する(図4のS
407参照)。キーテキストを画像IDと共にテキスト
DB103に登録することにより、キーテキストと画像
301との関連づけを行うことができる。
00中に存在する各画像毎にそれぞれ行われ、抽出され
たキーテキストは、実施の形態1で説明したように、画
像を検索するための検索対象とされる。
によれば、実施の形態1〜3で説明した画像検索用キー
テキストの生成方法を組み合わせることにより、あらゆ
る種類の文書から検索対象となる画像について記述した
文字列をキーテキストとして抽出することができる。
索装置においては、キーテキストとしてキーキャプショ
ン302,キーセンテンス303,キーパラグラフ30
4およびキーページ305を用いることにしたが、これ
らに加えて、画像の種類(ブロック図,フローチャー
ト,棒グラフ,折れ線グラフ等),画像のサイズ,画像
の色等の画像の属性情報や、画像中の文字列等をキーテ
キストとして用いることにしても良い。
章,節等のタイトルや、章,節を構成する文字列、ヘッ
ダ,フッダ等をキーテキストとして用いることにしても
良い。この場合は、キーテキストを抽出する際に、文書
のレイアウトを詳細に解析する必要がある。
テキストを用いて画像を検索することについて説明した
が、最初に画像を表示してブラウジングすることができ
るようにし、画像から関連のあるキーテキストを表示す
ることができるようにしても良い。
に、特定の種類のグループにグルーピングしておき、画
像から画像を検索することができるようにすることもで
きる。グルーピングは、画像の種類や、文書の種類等、
任意の条件に基づいて行うことができる。
出ルールを予め作成しておき、キーテキストを抽出する
際に、文書の種類を自動的に認識しまたはユーザが指定
することにより、作成したルールに従って、キーテキス
トを抽出することができるようにしても良い。
画像に対して複数得られることがあるため、複数得られ
た場合は、画像との距離に基づいて重み付けを行い、同
一画像に対する複数のキーセンテンス303等を表示す
る際の順位付けを行うこともできる。
は、「写真」を「写具」と認識してしまうような誤認識
が起こることがある。このような誤認識が画像番号語や
画像指示語に発生したような場合には、キーテキストを
正確に抽出することが困難となってしまう。そこで、予
め誤認識の起こりやすい語、例えば上記「写真」等にお
いては、誤認識した結果である「写具」についても正し
い「写真」と同様に扱うことができるようにすることが
できる。なお、誤認識した語を検出した場合について
は、正しい語に変換する処理を行うことにしても良い。
と画像とが別々のページに配置されているような文書
(例えば特許明細書)であっても、画像番号語等を抽出
することにより、容易にキーテキストを抽出することが
できる。
ピュータを機能させるプログラムや、画像検索用キーテ
キストの生成方法をコンピュータに実行させるためのプ
ログラムを作成し、これらをハードディスク,フロッピ
ーディスク,CD−ROM,MO,DVD等のコンピュ
ータ読み取り可能な記録媒体に記録して、記録媒体を介
してプログラムを配布することができる。そして、記録
媒体に記録されたプログラムをコンピュータで読み出し
て実行することにより、上述した画像検索装置や画像検
索用キーテキストの生成方法を実現することできる。
装置(請求項1)によれば、画像の検索に用いる任意の
文字列をキーテキストと定義し、キーテキストを検索対
象となる画像毎に用意すると共に、用意したキーテキス
トおよび対応する画像をそれぞれ関連づけて格納してお
き、任意の検索語に基づいてキーテキストを検索し、該
当するキーテキストに関連づけられた画像を出力する画
像検索装置であって、図,表,写真等の画像および文字
列が混在した文書を入力する文書入力手段と、文書入力
手段を介して入力した文書から画像を含む画像領域およ
び文字列を含む文字領域を認識して抽出する領域抽出手
段と、領域抽出手段で抽出した文字領域の文字列から画
像領域の画像に関連づけするキーテキストを抽出するキ
ーテキスト抽出手段と、領域抽出手段で抽出した画像領
域の画像およびキーテキスト抽出手段で抽出したキーテ
キストを関連づけて格納する格納手段と、検索語を入力
するための入力手段と、入力手段を介して入力した検索
語に基づいて、該当するキーテキストを検索する検索手
段と、検索手段から検索結果を入力し、入力した検索結
果を画面表示する表示手段と、を備えたため、文書中の
文字列からキーテキストを自動的に抽出することがで
き、格納した画像を容易に検索できるようにすることが
できる。
によれば、請求項1に記載の画像検索装置において、文
書は、文字列および画像が記録された紙文書であり、文
書入力手段は、紙文書を光学的に読み取って電子化した
文書を得るための読取手段であり、さらに、領域抽出手
段で抽出した文字領域中の文字列の文字認識を行う文字
認識手段を備えたため、紙文書であっても、文書中の画
像に関連づけするキーテキストを自動的に抽出すること
ができる。
によれば、請求項1または2に記載の画像検索装置にお
いて、さらに、文書入力手段を介して入力した文書がフ
ルカラーの文書である場合に、入力した文書を2値化処
理する2値化処理手段を備えたため、後の領域識別処理
や文字認識処理の高速化を図ることができる。また、入
力した文書について2値化処理を行うことにしても、文
書はフルカラーで入力されているため、検索結果として
表示される画像等はフルカラーのままで表示することが
可能となる。
によれば、請求項1〜3のいずれか1つに記載の画像検
索装置において、画像のキャプションを構成する文字列
をキーキャプションと定義し、キーテキスト抽出手段
は、画像に関連づけするキーテキストとして、領域抽出
手段で抽出した文字領域の文字列からキーキャプション
を抽出するため、画像に関連のある適切な文字列をキー
テキストとして用いることができ、画像検索精度の向上
を図ることができる。また、キーキャプションは、関連
づけされた画像を最も端的に示す文字列であるため、キ
ーキャプションをキーテキストとして画像検索を行うこ
とにより、検索語に最も関連のある画像を得ることがで
きる。すなわち、キーキャプションを検索対象として用
いることにより、検索結果に漏れがあっても良いが、最
も検索語に関連のある画像を検索することが可能とな
る。
によれば、請求項1〜3のいずれか1つに記載の画像検
索装置において、画像について記述したセンテンスを構
成する文字列をキーセンテンスと定義し、キーテキスト
抽出手段は、画像に関連づけするキーテキストとして、
領域抽出手段で抽出した文字領域の文字列からキーセン
テンスを抽出するため、画像に関連のある適切な文字列
をキーテキストとして用いることができ、画像検索精度
の向上を図ることができる。
によれば、請求項1〜3のいずれか1つに記載の画像検
索装置において、画像について記述したパラグラフを構
成する文字列をキーパラグラフと定義し、キーテキスト
抽出手段は、画像に関連づけするキーテキストとして、
領域抽出手段で抽出した文字領域の文字列からキーパラ
グラフを抽出するため、画像に関連のある適切な文字列
をキーテキストとして用いることができ、画像検索精度
の向上を図ることができる。
によれば、請求項1〜3のいずれか1つに記載の画像検
索装置において、画像について記述したページを構成す
る文字列をキーページと定義し、キーテキスト抽出手段
は、画像に関連づけするキーテキストとして、領域抽出
手段で抽出した文字領域の文字列からキーページを抽出
するため、画像に関連のある適切な文字列をキーテキス
トとして用いることができ、画像検索精度の向上を図る
ことができる。また、キーページは、様々なトピックを
含み、他の画像に関連づけられることがあることから、
キーページをキーテキストとして画像検索を行うことに
より、互いに関連のある画像まで検索対象を広げること
ができる。すなわち、キーページを検索対象として用い
ることにより、検索結果に漏れのない画像検索を行うこ
とが可能となる。
によれば、請求項1〜3のいずれか1つに記載の画像検
索装置において、画像のキャプション並びに画像につい
て記述したセンテンス,パラグラフおよびページを構成
する文字列をそれぞれキーキャプション,キーセンテン
ス,キーパラグラフおよびキーページと定義し、キーテ
キスト抽出手段は、画像に関連づけするキーテキストと
して、領域抽出手段で抽出した文字領域の文字列からキ
ーキャプション,キーセンテンス,キーパラグラフおよ
びキーページをそれぞれ抽出するため、画像に関連のあ
る適切な文字列をキーテキストとして用いることがで
き、画像検索精度の向上を図ることができる。また、キ
ーキャプション,キーセンテンス,キーパラグラフおよ
びキーページのすべてを検索対象として用いることによ
り、検索結果に漏れがあっても良いが、最も検索語に関
連のある画像を検索したいという要求と、検索結果に漏
れのない画像検索を行いたいという要求を同時に満たす
ことができる。
によれば、請求項1〜8のいずれか1つに記載の画像検
索装置において、キーテキスト抽出手段は、領域抽出手
段で抽出した画像領域と画像領域の近傍に位置する文字
領域との間の距離に基づいて、特定の文字領域の文字列
から画像領域の画像に関連づけするキーテキストを抽出
するため、画像について記述した文字列は画像の近くに
存在するということが多いということを利用して、画像
に関連のある適切な文字列をキーテキストとして抽出す
ることができる。
0)によれば、請求項9に記載の画像検索装置におい
て、画像領域と画像領域の近傍に位置する文字領域との
間の距離は、互いに対向する画像領域の辺と文字領域の
辺との間の距離であって、画素を単位とするため、画像
領域に対して最も近傍に位置する文字領域を容易に特定
することができる。
1)によれば、請求項9または10に記載の画像検索装
置において、文字領域は、画像のキャプションを構成す
る文字列が属するキャプション領域と、キャプションを
構成する文字列以外の文字列が属する本文領域とからな
り、キーテキスト抽出手段は、画像領域から最も近い距
離に位置するキャプション領域を特定し、前記特定した
キャプション領域の文字列を画像領域の画像に関連づけ
するキーキャプションとして抽出するため、画像に関連
のあるキーキャプションを極めて容易に抽出することが
できる。その結果、適切なキーテキストを得ることがで
きる。
2)によれば、請求項11に記載の画像検索装置におい
て、キーテキスト抽出手段は、キーキャプションを構成
する文字列から画像に付与された番号を特定する番号語
を抽出し、本文領域の文字列から抽出した番号語を検索
して、該当する番号語を含むセンテンス単位の文字列を
画像領域の画像に関連づけするキーセンテンスとして抽
出するため、画像に関連のあるキーセンテンスを極めて
容易に抽出することができる。その結果、適切なキーテ
キストを得ることができる。
3)によれば、請求項9または10に記載の画像検索装
置において、キーテキスト抽出手段は、文字領域の文字
列から画像が存在する方向または位置を指し示す指示語
を検索し、該当する指示語を含むセンテンス単位の文字
列を、指示語で示された方向または位置に存在し、指示
語を含む文字領域と最も近い画像領域の画像に関連づけ
するキーセンテンスとして抽出するため、画像に関連の
あるキーセンテンスを極めて容易に抽出することができ
る。その結果、適切なキーテキストを得ることができ
る。
4)によれば、請求項12または13に記載の画像検索
装置において、キーテキスト抽出手段は、キーセンテン
スを含むパラグラフ単位の文字列を画像領域の画像に関
連づけするキーパラグラフとして抽出するため、画像に
関連のあるキーパラグラフを極めて容易に抽出すること
ができる。その結果、適切なキーテキストを得ることが
できる。
5)によれば、請求項9または10に記載の画像検索装
置において、キーテキスト抽出手段は、画像領域から最
も近い距離に位置する文字領域を特定し、特定した文字
領域が画像領域の上方に位置する場合、文字領域中の最
も下方に位置するパラグラフ単位の文字列を画像領域の
画像に関連づけするキーパラグラフとして抽出し、特定
した文字領域が画像領域の下方に位置する場合、文字領
域中の最も上方に位置するパラグラフ単位の文字列を画
像領域の画像に関連づけするキーパラグラフとして抽出
し、特定した文字領域が画像領域の左方または右方に位
置する場合、文字領域の文字列を画像領域の画像に関連
づけするキーパラグラフとして抽出するため、画像に関
連のあるキーパラグラフを極めて容易に抽出することが
できる。その結果、適切なキーテキストを得ることがで
きる。
6)によれば、請求項14または15に記載の画像検索
装置において、キーテキスト抽出手段は、キーパラグラ
フが存在するページを特定し、特定したページ中の全て
の文字領域の文字列を画像領域の画像に関連づけするキ
ーページとして抽出するため、画像に関連のあるキーペ
ージを極めて容易に抽出することができる。その結果、
適切なキーテキストを得ることができる。
7)によれば、請求項8または16に記載の画像検索装
置において、さらに、格納手段に格納されたキーキャプ
ション,キーセンテンス,キーパラグラフおよびキーペ
ージからなるキーテキストの1部または全てを検索対象
として指定するための指定手段を備えたため、ユーザの
要求に応じて、入力した検索語に対して漏れのない検索
や、ノイズの少ない検索を選択的に行うことができる。
8)によれば、請求項8または16に記載の画像検索装
置において、表示手段は、キーキャプションのみの検索
結果を示した第1の検索結果と、キーキャプションおよ
びキーセンテンスの検索結果の論理和を検索結果として
示した第2の検索結果と、キーキャプション,キーセン
テンスおよびキーパラグラフの検索結果の論理和を検索
結果として示した第3の検索結果と、キーキャプショ
ン,キーセンテンス,キーパラグラフおよびキーページ
の検索結果の論理和を検索結果として示した第4の検索
結果と、をそれぞれ画面表示するため、ユーザが所望の
画像を容易に選択することができる。すなわち、入力し
た検索語に対してノイズの少ない検索結果から入力した
検索語に対して漏れのない検索結果へ段階的に検索結果
を表示することができるため、所望の画像を容易に選択
することができる。
9)によれば、請求項8または16に記載の画像検索装
置において、表示手段は、キーキャプションの検索結果
を示した第1の検索結果と、第1の検索結果と重複する
検索結果を除いてキーセンテンスの検索結果を示した第
2の検索結果と、第1および第2の検索結果と重複する
検索結果を除いてキーパラグラフの検索結果を示した第
3の検索結果と、第1〜第3の検索結果と重複する検索
結果を除いてキーページの検索結果を示した第4の検索
結果と、をそれぞれ画面表示するため、ユーザが所望の
画像を容易に選択することができる。すなわち、入力し
た検索語に最も関連が深い画像についての検索結果から
関連の浅い検索結果へ段階的に検索結果を表示すること
ができるため、所望の画像を容易に選択することができ
る。
0)によれば、請求項1〜19のいずれか1つに記載の
画像検索装置において、格納手段は、画像を格納する際
に、画像を他の画像から識別するための識別情報を付し
て格納し、表示手段は、検索結果として、該当する画像
の識別情報を表示するため、最終的な検索結果である画
像自体を表示する場合に比べて、高速に検索結果を表示
することができる。
1)によれば、請求項1〜20のいずれか1つに記載の
画像検索装置において、表示手段は、検索結果として、
該当するキーテキストを表示するため、検索によってヒ
ットした画像の内容を容易に理解することができる。ま
た、表示されたキーテキストを用いて、絞り込み用の検
索語をユーザに与えることが可能となる。
2)によれば、請求項1〜21のいずれか1つに記載の
画像検索装置において、さらに、領域抽出手段で抽出し
た画像領域の画像を縮小して、縮小画像を生成する縮小
画像生成手段を備え、表示手段は、検索結果として、縮
小画像生成手段で生成した縮小画像を表示するため、検
索結果からユーザが所望する画像を容易に選択すること
ができる。
3)によれば、請求項20〜22のいずれか1つに記載
の画像検索装置において、さらに、表示手段で画面表示
した識別情報,キーテキストまたは/および縮小画像を
選択するための選択手段を備え、表示手段は、選択手段
を介して識別情報,キーテキストまたは/および縮小画
像が選択された場合に、該当する画像または/および文
書入力手段で入力した文書を画面表示するため、ユーザ
が所望する画像を検索結果から選択する際の操作性の向
上を図ることができる。
4)によれば、画像の検索に用いる任意の文字列をキー
テキストと定義し、キーテキストを検索対象となる画像
毎に用意すると共に、用意したキーテキストを対応する
画像にそれぞれ関連づけて格納しておき、任意の検索語
に基づいてキーテキストを検索し、該当するキーテキス
トに関連づけられた画像を出力する画像検索装置におけ
る画像検索用キーテキストの生成方法であって、図,
表,写真等の画像および文字列が混在した文書を入力す
る文書入力工程と、文書入力工程で入力した文書から画
像を含む画像領域および文字列を含む文字領域を認識し
て抽出する領域抽出工程と、領域抽出工程で抽出した文
字領域の文字列から画像のキャプションを構成する文字
列を画像領域の画像に関連づけするキーテキストとして
抽出する第1のキーテキスト抽出工程と、第1のキーテ
キスト抽出工程で抽出した文字列から画像領域の画像に
付与された番号語を抽出し、文字領域の文字列から抽出
した番号語を検索して、該当する番号語を含むセンテン
ス単位の文字列を画像領域の画像に関連づけするキーテ
キストとして抽出する第2のキーテキスト抽出工程と、
第1のキーテキスト抽出工程で文字列を抽出することが
できない場合に、文字領域の文字列から画像領域の画像
が存在する方向または位置を指し示す指示語を検索し、
該当する指示語を含むセンテンス単位の文字列を画像領
域の画像に関連づけするキーテキストとして抽出する第
3のキーテキスト抽出工程と、第2または第3のキーテ
キスト抽出工程で抽出した文字列を含むパラグラフ単位
の文字列を画像領域の画像に関連づけするキーテキスト
として抽出する第4のキーテキスト抽出工程と、第3の
キーテキスト抽出工程で文字列を抽出することができな
い場合に、画像領域の最も近傍に位置する文字領域の文
字列を画像領域の画像に関連づけするキーテキストとし
て抽出する第5のキーテキスト抽出工程と、第4または
第5のキーテキスト抽出工程で抽出した文字列を含むペ
ージを特定し、特定したページ中の全ての文字領域中の
文字列を画像領域の画像に関連づけするキーテキストと
して抽出する第6のキーテキスト抽出工程と、を含むた
め、いかなる種類の文書であっても、適切なキーテキス
トを自動的に抽出することができる。
な記録媒体(請求項25)によれば、請求項1〜23の
いずれか1つに記載の画像検索装置の各手段としてコン
ピュータを機能させるためのプログラムを記録したた
め、記録したプログラムをコンピュータに実行させるこ
とにより、文書中の文字列からキーテキストを自動的に
抽出することができ、格納した画像を容易に検索できる
ようにすることができる画像検索装置を実現することが
できる。
能な記録媒体(請求項26)によれば、請求項24に記
載の画像検索用キーテキストの生成方法の各工程をコン
ピュータに実行させるためのプログラムを記録したた
め、記録したプログラムをコンピュータに実行させるこ
とにより、いかなる種類の文書であっても、適切なキー
テキストを自動的に抽出することができる画像検索用キ
ーテキストの生成方法を実現することができる。
である。
キストを説明するための説明図である。
キスト・画像登録処理を示すフローチャートである。
別・分割処理を行った結果を示す説明図である。
キスト抽出処理を示すフローチャートである。
索処理の概略を示すフローチャートである。
索結果の表示例を示す説明図である。
索結果の表示例を示す説明図である。
キスト抽出処理を示すフローチャートである。
テキスト抽出処理によって抽出されるキーテキストを説
明するための説明図である。
キスト抽出処理を示すフローチャートである。
テキスト抽出処理によって抽出されるキーテキストを説
明するための説明図である。
領域を挟んで本文領域が上下に存在する場合の抽出処理
を説明する説明図である。
領域を挟んで本文領域が左右に存在する場合のキーテキ
スト抽出処理を説明する説明図である。
キスト抽出処理を示すフローチャートである。
Claims (26)
- 【請求項1】 画像の検索に用いる任意の文字列をキー
テキストと定義し、前記キーテキストを検索対象となる
画像毎に用意すると共に、用意したキーテキストおよび
対応する前記画像をそれぞれ関連づけて格納しておき、
任意の検索語に基づいて前記キーテキストを検索し、該
当するキーテキストに関連づけられた画像を出力する画
像検索装置であって、 図,表,写真等の画像および文字列が混在した文書を入
力する文書入力手段と、 前記文書入力手段を介して入力した文書から前記画像を
含む画像領域および文字列を含む文字領域を認識して抽
出する領域抽出手段と、 前記領域抽出手段で抽出した文字領域の文字列から前記
画像領域の画像に関連づけする前記キーテキストを抽出
するキーテキスト抽出手段と、 前記領域抽出手段で抽出した画像領域の画像および前記
キーテキスト抽出手段で抽出したキーテキストを関連づ
けて格納する格納手段と、 前記検索語を入力するための入力手段と、 前記入力手段を介して入力した検索語に基づいて、該当
するキーテキストを検索する検索手段と、 前記検索手段から検索結果を入力し、入力した検索結果
を画面表示する表示手段と、 を備えたことを特徴とする画像検索装置。 - 【請求項2】 前記文書は、前記文字列および画像が記
録された紙文書であり、 前記文書入力手段は、前記紙文書を光学的に読み取って
電子化した文書を得るための読取手段であり、 さらに、前記領域抽出手段で抽出した文字領域中の文字
列の文字認識を行う文字認識手段を備えたことを特徴と
する請求項1に記載の画像検索装置。 - 【請求項3】 さらに、前記文書入力手段を介して入力
した文書がフルカラーの文書である場合に、前記入力し
た文書を2値化処理する2値化処理手段を備えたことを
特徴とする請求項1または2に記載の画像検索装置。 - 【請求項4】 前記画像のキャプションを構成する文字
列をキーキャプションと定義し、 前記キーテキスト抽出手段は、前記画像に関連づけする
キーテキストとして、前記領域抽出手段で抽出した文字
領域の文字列から前記キーキャプションを抽出すること
を特徴とする請求項1〜3のいずれか1つに記載の画像
検索装置。 - 【請求項5】 前記画像について記述したセンテンスを
構成する文字列をキーセンテンスと定義し、 前記キーテキスト抽出手段は、前記画像に関連づけする
キーテキストとして、前記領域抽出手段で抽出した文字
領域の文字列から前記キーセンテンスを抽出することを
特徴とする請求項1〜3のいずれか1つに記載の画像検
索装置。 - 【請求項6】 前記画像について記述したパラグラフを
構成する文字列をキーパラグラフと定義し、 前記キーテキスト抽出手段は、前記画像に関連づけする
キーテキストとして、前記領域抽出手段で抽出した文字
領域の文字列から前記キーパラグラフを抽出することを
特徴とする請求項1〜3のいずれか1つに記載の画像検
索装置。 - 【請求項7】 前記画像について記述したページを構成
する文字列をキーページと定義し、 前記キーテキスト抽出手段は、前記画像に関連づけする
キーテキストとして、前記領域抽出手段で抽出した文字
領域の文字列から前記キーページを抽出することを特徴
とする請求項1〜3のいずれか1つに記載の画像検索装
置。 - 【請求項8】 前記画像のキャプション並びに前記画像
について記述したセンテンス,パラグラフおよびページ
を構成する文字列をそれぞれキーキャプション,キーセ
ンテンス,キーパラグラフおよびキーページと定義し、 前記キーテキスト抽出手段は、前記画像に関連づけする
キーテキストとして、前記領域抽出手段で抽出した文字
領域の文字列から前記キーキャプション,キーセンテン
ス,キーパラグラフおよびキーページをそれぞれ抽出す
ることを特徴とする請求項1〜3のいずれか1つに記載
の画像検索装置。 - 【請求項9】 前記キーテキスト抽出手段は、前記領域
抽出手段で抽出した画像領域と前記画像領域の近傍に位
置する文字領域との間の距離に基づいて、特定の文字領
域の文字列から前記画像領域の画像に関連づけする前記
キーテキストを抽出することを特徴とする請求項1〜8
のいずれか1つに記載の画像検索装置。 - 【請求項10】 前記画像領域と前記画像領域の近傍に
位置する文字領域との間の距離は、互いに対向する前記
画像領域の辺と前記文字領域の辺との間の距離であっ
て、画素を単位とすることを特徴とする請求項9に記載
の画像検索装置。 - 【請求項11】 前記文字領域は、前記画像のキャプシ
ョンを構成する文字列が属するキャプション領域と、前
記キャプションを構成する文字列以外の文字列が属する
本文領域とからなり、 前記キーテキスト抽出手段は、前記画像領域から最も近
い距離に位置する前記キャプション領域を特定し、前記
特定したキャプション領域の文字列を前記画像領域の画
像に関連づけする前記キーキャプションとして抽出する
ことを特徴とする請求項9または10に記載の画像検索
装置。 - 【請求項12】 前記キーテキスト抽出手段は、前記キ
ーキャプションを構成する文字列から前記画像に付与さ
れた番号を特定する番号語を抽出し、前記本文領域の文
字列から前記抽出した番号語を検索して、該当する番号
語を含むセンテンス単位の文字列を前記画像領域の画像
に関連づけする前記キーセンテンスとして抽出すること
を特徴とする請求項11に記載の画像検索装置。 - 【請求項13】 前記キーテキスト抽出手段は、前記文
字領域の文字列から画像が存在する方向または位置を指
し示す指示語を検索し、該当する指示語を含むセンテン
ス単位の文字列を、前記指示語で示された方向または位
置に存在し、前記指示語を含む文字領域と最も近い画像
領域の画像に関連づけする前記キーセンテンスとして抽
出することを特徴とする請求項9または10に記載の画
像検索装置。 - 【請求項14】 前記キーテキスト抽出手段は、前記キ
ーセンテンスを含むパラグラフ単位の文字列を前記画像
領域の画像に関連づけする前記キーパラグラフとして抽
出することを特徴とする請求項12または13に記載の
画像検索装置。 - 【請求項15】 前記キーテキスト抽出手段は、前記画
像領域から最も近い距離に位置する文字領域を特定し、
前記特定した文字領域が前記画像領域の上方に位置する
場合、前記文字領域中の最も下方に位置するパラグラフ
単位の文字列を前記画像領域の画像に関連づけするキー
パラグラフとして抽出し、前記特定した文字領域が前記
画像領域の下方に位置する場合、前記文字領域中の最も
上方に位置するパラグラフ単位の文字列を前記画像領域
の画像に関連づけするキーパラグラフとして抽出し、前
記特定した文字領域が前記画像領域の左方または右方に
位置する場合、前記文字領域の文字列を前記画像領域の
画像に関連づけするキーパラグラフとして抽出すること
を特徴とする請求項9または10に記載の画像検索装
置。 - 【請求項16】 前記キーテキスト抽出手段は、前記キ
ーパラグラフが存在するページを特定し、特定したペー
ジ中の全ての文字領域の文字列を前記画像領域の画像に
関連づけする前記キーページとして抽出することを特徴
とする請求項14または15に記載の画像検索装置。 - 【請求項17】 さらに、前記格納手段に格納されたキ
ーキャプション,キーセンテンス,キーパラグラフおよ
びキーページからなるキーテキストの1部または全てを
検索対象として指定するための指定手段を備えたことを
特徴とする請求項8または16に記載の画像検索装置。 - 【請求項18】 前記表示手段は、前記キーキャプショ
ンのみの検索結果を示した第1の検索結果と、前記キー
キャプションおよびキーセンテンスの検索結果の論理和
を検索結果として示した第2の検索結果と、前記キーキ
ャプション,キーセンテンスおよびキーパラグラフの検
索結果の論理和を検索結果として示した第3の検索結果
と、前記キーキャプション,キーセンテンス,キーパラ
グラフおよびキーページの検索結果の論理和を検索結果
として示した第4の検索結果と、をそれぞれ画面表示す
ることを特徴とする請求項8または16に記載の画像検
索装置。 - 【請求項19】 前記表示手段は、前記キーキャプショ
ンの検索結果を示した第1の検索結果と、前記第1の検
索結果と重複する検索結果を除いて前記キーセンテンス
の検索結果を示した第2の検索結果と、前記第1および
第2の検索結果と重複する検索結果を除いて前記キーパ
ラグラフの検索結果を示した第3の検索結果と、前記第
1〜第3の検索結果と重複する検索結果を除いて前記キ
ーページの検索結果を示した第4の検索結果と、をそれ
ぞれ画面表示することを特徴とする請求項8または16
に記載の画像検索装置。 - 【請求項20】 前記格納手段は、前記画像を格納する
際に、前記画像を他の画像から識別するための識別情報
を付して格納し、 前記表示手段は、前記検索結果として、該当する画像の
識別情報を表示することを特徴とする請求項1〜19の
いずれか1つに記載の画像検索装置。 - 【請求項21】 前記表示手段は、前記検索結果とし
て、該当するキーテキストを表示することを特徴とする
請求項1〜20のいずれか1つに記載の画像検索装置。 - 【請求項22】 さらに、前記領域抽出手段で抽出した
画像領域の画像を縮小して、縮小画像を生成する縮小画
像生成手段を備え、 前記表示手段は、前記検索結果として、前記縮小画像生
成手段で生成した縮小画像を表示することを特徴とする
請求項1〜21のいずれか1つに記載の画像検索装置。 - 【請求項23】 さらに、前記表示手段で画面表示した
識別情報,キーテキストまたは/および縮小画像を選択
するための選択手段を備え、 前記表示手段は、前記選択手段を介して前記識別情報,
キーテキストまたは/および縮小画像が選択された場合
に、該当する前記画像または/および文書入力手段で入
力した文書を画面表示することを特徴とする請求項20
〜22のいずれか1つに記載の画像検索装置。 - 【請求項24】 画像の検索に用いる任意の文字列をキ
ーテキストと定義し、前記キーテキストを検索対象とな
る画像毎に用意すると共に、用意したキーテキストを対
応する前記画像にそれぞれ関連づけて格納しておき、任
意の検索語に基づいて前記キーテキストを検索し、該当
するキーテキストに関連づけられた画像を出力する画像
検索装置における画像検索用キーテキストの生成方法で
あって、 図,表,写真等の画像および文字列が混在した文書を入
力する文書入力工程と、 前記文書入力工程で入力した文書から前記画像を含む画
像領域および文字列を含む文字領域を認識して抽出する
領域抽出工程と、 前記領域抽出工程で抽出した文字領域の文字列から前記
画像のキャプションを構成する文字列を前記画像領域の
画像に関連づけする前記キーテキストとして抽出する第
1のキーテキスト抽出工程と、 前記第1のキーテキスト抽出工程で抽出した前記文字列
から前記画像領域の画像に付与された番号語を抽出し、
前記文字領域の文字列から前記抽出した番号語を検索し
て、該当する番号語を含むセンテンス単位の文字列を前
記画像領域の画像に関連づけする前記キーテキストとし
て抽出する第2のキーテキスト抽出工程と、 前記第1のキーテキスト抽出工程で前記文字列を抽出す
ることができない場合に、前記文字領域の文字列から前
記画像領域の画像が存在する方向または位置を指し示す
指示語を検索し、該当する指示語を含むセンテンス単位
の文字列を前記画像領域の画像に関連づけする前記キー
テキストとして抽出する第3のキーテキスト抽出工程
と、 前記第2または第3のキーテキスト抽出工程で抽出した
前記文字列を含むパラグラフ単位の文字列を前記画像領
域の画像に関連づけする前記キーテキストとして抽出す
る第4のキーテキスト抽出工程と、 前記第3のキーテキスト抽出工程で前記文字列を抽出す
ることができない場合に、前記画像領域の最も近傍に位
置する文字領域の文字列を前記画像領域の画像に関連づ
けする前記キーテキストとして抽出する第5のキーテキ
スト抽出工程と、 前記第4または第5のキーテキスト抽出工程で抽出した
前記文字列を含むページを特定し、特定したページ中の
全ての文字領域中の文字列を前記画像領域の画像に関連
づけする前記キーテキストとして抽出する第6のキーテ
キスト抽出工程と、 を含むことを特徴とする画像検索用キーテキストの生成
方法。 - 【請求項25】 前記請求項1〜23のいずれか1つに
記載の画像検索装置の各手段としてコンピュータを機能
させるためのプログラムを記録したことを特徴とするコ
ンピュータ読み取り可能な記録媒体。 - 【請求項26】 前記請求項24に記載の画像検索用キ
ーテキストの生成方法の各工程をコンピュータに実行さ
せるためのプログラムを記録したことを特徴とするコン
ピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18161097A JP3694149B2 (ja) | 1997-07-07 | 1997-07-07 | 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US09/111,458 US6169998B1 (en) | 1997-07-07 | 1998-07-07 | Method of and a system for generating multiple-degreed database for images |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18161097A JP3694149B2 (ja) | 1997-07-07 | 1997-07-07 | 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1125113A true JPH1125113A (ja) | 1999-01-29 |
JP3694149B2 JP3694149B2 (ja) | 2005-09-14 |
Family
ID=16103822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18161097A Expired - Fee Related JP3694149B2 (ja) | 1997-07-07 | 1997-07-07 | 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6169998B1 (ja) |
JP (1) | JP3694149B2 (ja) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005332385A (ja) * | 2004-04-29 | 2005-12-02 | Microsoft Corp | リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム |
JP2008040753A (ja) * | 2006-08-04 | 2008-02-21 | Ricoh Co Ltd | 画像処理装置、方法、プログラムおよび記録媒体 |
JP2008134954A (ja) * | 2006-11-29 | 2008-06-12 | Canon Inc | 情報処理装置、その制御方法、及びプログラム |
JP2008152522A (ja) * | 2006-12-18 | 2008-07-03 | Hitachi Ltd | データマイニングシステム、データマイニング方法及びデータ検索システム |
JP2009118340A (ja) * | 2007-11-08 | 2009-05-28 | Canon Inc | 画像処理装置、画像処理方法、プログラム、および記憶媒体 |
EP2107478A1 (en) | 2008-03-17 | 2009-10-07 | Ricoh Company, Limited | Information processing apparatus for tracking changes of images |
JP2010205060A (ja) * | 2009-03-04 | 2010-09-16 | Nomura Research Institute Ltd | 文書内画像検索方法および文書内画像検索システム |
JP2010204705A (ja) * | 2009-02-27 | 2010-09-16 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2010267021A (ja) * | 2009-05-13 | 2010-11-25 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2011192145A (ja) * | 2010-03-16 | 2011-09-29 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
US8181108B2 (en) | 2008-05-08 | 2012-05-15 | Canon Kabushiki Kaisha | Device for editing metadata of divided object |
US8190563B2 (en) | 2008-04-24 | 2012-05-29 | Ricoh Company, Ltd. | Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program |
US8260051B2 (en) | 2008-10-20 | 2012-09-04 | Ricoh Company, Ltd. | Image processing apparatus for generating and transmitting push-type data |
JP2012212290A (ja) * | 2011-03-31 | 2012-11-01 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム |
US8514462B2 (en) | 2010-07-06 | 2013-08-20 | Canon Kabushiki Kaisha | Processing document image including caption region |
US8584009B2 (en) | 2008-06-13 | 2013-11-12 | Ricoh Company, Ltd. | Automatically propagating changes in document access rights for subordinate document components to superordinate document components |
JP2019049945A (ja) * | 2017-09-12 | 2019-03-28 | ヤフー株式会社 | 抽出装置、抽出方法、抽出プログラム、及びモデル |
JP2022541890A (ja) * | 2019-07-12 | 2022-09-28 | 智慧芽信息科技(蘇州)有限公司 | 画像データベース構築方法、検索方法、電子機器及び記憶媒体 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100350789B1 (ko) * | 1999-03-04 | 2002-08-28 | 엘지전자 주식회사 | 이미지 검색시스템의 분위기 칼라 자동추출 및 원래 칼라 조정방법 |
US6708309B1 (en) * | 1999-03-11 | 2004-03-16 | Roxio, Inc. | Method and system for viewing scalable documents |
US6813395B1 (en) * | 1999-07-14 | 2004-11-02 | Fuji Photo Film Co., Ltd. | Image searching method and image processing method |
US6356908B1 (en) * | 1999-07-30 | 2002-03-12 | International Business Machines Corporation | Automatic web page thumbnail generation |
US7620622B1 (en) * | 2001-03-08 | 2009-11-17 | Yahoo! Inc. | Method and system for indexing information and providing results for a search including objects having predetermined attributes |
US7137064B2 (en) * | 2002-02-02 | 2006-11-14 | International Business Machines Corporation | System and method for facilitating document imaging requests |
US7050630B2 (en) * | 2002-05-29 | 2006-05-23 | Hewlett-Packard Development Company, L.P. | System and method of locating a non-textual region of an electronic document or image that matches a user-defined description of the region |
JP2004062804A (ja) * | 2002-07-31 | 2004-02-26 | Ricoh Co Ltd | 画像の分類方法、画像特徴量空間表示方法、プログラムおよび記録媒体 |
US20040095377A1 (en) * | 2002-11-18 | 2004-05-20 | Iris Technologies, Inc. | Video information analyzer |
US20040101156A1 (en) * | 2002-11-22 | 2004-05-27 | Dhiraj Kacker | Image ranking for imaging products and services |
US8775436B1 (en) * | 2004-03-19 | 2014-07-08 | Google Inc. | Image selection for news search |
JP4700452B2 (ja) * | 2005-09-16 | 2011-06-15 | 株式会社リコー | 情報管理装置、情報管理方法、情報管理プログラムおよび記録媒体 |
JP4626509B2 (ja) * | 2005-12-19 | 2011-02-09 | セイコーエプソン株式会社 | 画像一覧表示におけるユーザの利便性向上 |
US8504932B2 (en) | 2006-04-13 | 2013-08-06 | Shutterfly, Inc. | Image collage builder |
US7467222B2 (en) * | 2006-05-12 | 2008-12-16 | Shutterfly, Inc. | Image ranking for imaging products and services |
US20080002225A1 (en) * | 2006-06-27 | 2008-01-03 | Masajiro Iwasaki | Printing control method, printing control device, printing sytem, terminal device, program, and recording medium |
US8140525B2 (en) * | 2007-07-12 | 2012-03-20 | Ricoh Company, Ltd. | Information processing apparatus, information processing method and computer readable information recording medium |
JP5167821B2 (ja) * | 2008-01-11 | 2013-03-21 | 株式会社リコー | 文書検索装置、文書検索方法及び文書検索プログラム |
JP5132416B2 (ja) * | 2008-05-08 | 2013-01-30 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
US8437575B2 (en) * | 2009-03-18 | 2013-05-07 | Shutterfly, Inc. | Proactive creation of image-based products |
US8363888B2 (en) * | 2009-03-18 | 2013-01-29 | Shutterfly, Inc. | Proactive creation of photobooks |
CA2781753A1 (en) * | 2009-11-25 | 2011-06-03 | David J. Vining | Advanced multimedia structured reporting |
US8655893B2 (en) | 2010-07-16 | 2014-02-18 | Shutterfly, Inc. | Organizing images captured by multiple image capture devices |
JP2013068981A (ja) * | 2011-09-20 | 2013-04-18 | Fujitsu Ltd | 電子計算機及び画像検索方法 |
GB2513431B (en) * | 2013-04-25 | 2018-12-05 | Testplant Europe Ltd | Method for creating a label |
US20140351678A1 (en) * | 2013-05-22 | 2014-11-27 | European Molecular Biology Organisation | Method and System for Associating Data with Figures |
US11238215B2 (en) | 2018-12-04 | 2022-02-01 | Issuu, Inc. | Systems and methods for generating social assets from electronic publications |
JP7439435B2 (ja) * | 2019-09-30 | 2024-02-28 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2022149283A (ja) * | 2021-03-25 | 2022-10-06 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及びプログラム |
JP7380653B2 (ja) * | 2021-05-31 | 2023-11-15 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63245556A (ja) * | 1987-03-31 | 1988-10-12 | Toshiba Corp | 図表データ割付け方法 |
JPH0362169A (ja) | 1989-07-31 | 1991-03-18 | Agency Of Ind Science & Technol | 文書検索方法及び文書検索装置 |
US5191525A (en) * | 1990-01-16 | 1993-03-02 | Digital Image Systems, Corporation | System and method for extraction of data from documents for subsequent processing |
US5325297A (en) * | 1992-06-25 | 1994-06-28 | System Of Multiple-Colored Images For Internationally Listed Estates, Inc. | Computer implemented method and system for storing and retrieving textual data and compressed image data |
JPH06208654A (ja) * | 1993-01-08 | 1994-07-26 | Hitachi Software Eng Co Ltd | ペン入力図形編集システム |
US5845288A (en) * | 1995-12-11 | 1998-12-01 | Xerox Corporation | Automated system for indexing graphical documents having associated text labels |
-
1997
- 1997-07-07 JP JP18161097A patent/JP3694149B2/ja not_active Expired - Fee Related
-
1998
- 1998-07-07 US US09/111,458 patent/US6169998B1/en not_active Expired - Lifetime
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005332385A (ja) * | 2004-04-29 | 2005-12-02 | Microsoft Corp | リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム |
JP4634214B2 (ja) * | 2004-04-29 | 2011-02-16 | マイクロソフト コーポレーション | リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム |
JP2008040753A (ja) * | 2006-08-04 | 2008-02-21 | Ricoh Co Ltd | 画像処理装置、方法、プログラムおよび記録媒体 |
JP2008134954A (ja) * | 2006-11-29 | 2008-06-12 | Canon Inc | 情報処理装置、その制御方法、及びプログラム |
JP2008152522A (ja) * | 2006-12-18 | 2008-07-03 | Hitachi Ltd | データマイニングシステム、データマイニング方法及びデータ検索システム |
JP2009118340A (ja) * | 2007-11-08 | 2009-05-28 | Canon Inc | 画像処理装置、画像処理方法、プログラム、および記憶媒体 |
US8176025B2 (en) | 2008-03-17 | 2012-05-08 | Ricoh Company, Ltd. | Information processing apparatus for storing documents with partial images |
EP2107478A1 (en) | 2008-03-17 | 2009-10-07 | Ricoh Company, Limited | Information processing apparatus for tracking changes of images |
US8190563B2 (en) | 2008-04-24 | 2012-05-29 | Ricoh Company, Ltd. | Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program |
US8181108B2 (en) | 2008-05-08 | 2012-05-15 | Canon Kabushiki Kaisha | Device for editing metadata of divided object |
US8584009B2 (en) | 2008-06-13 | 2013-11-12 | Ricoh Company, Ltd. | Automatically propagating changes in document access rights for subordinate document components to superordinate document components |
US8260051B2 (en) | 2008-10-20 | 2012-09-04 | Ricoh Company, Ltd. | Image processing apparatus for generating and transmitting push-type data |
JP2010204705A (ja) * | 2009-02-27 | 2010-09-16 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2010205060A (ja) * | 2009-03-04 | 2010-09-16 | Nomura Research Institute Ltd | 文書内画像検索方法および文書内画像検索システム |
JP2010267021A (ja) * | 2009-05-13 | 2010-11-25 | Canon Inc | 情報処理装置及び情報処理方法 |
DE102011005579A1 (de) | 2010-03-16 | 2011-11-10 | Canon Kabushiki Kaisha | Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Speichermedium |
JP2011192145A (ja) * | 2010-03-16 | 2011-09-29 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
US8355578B2 (en) | 2010-03-16 | 2013-01-15 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
US8514462B2 (en) | 2010-07-06 | 2013-08-20 | Canon Kabushiki Kaisha | Processing document image including caption region |
JP2012212290A (ja) * | 2011-03-31 | 2012-11-01 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム |
JP2019049945A (ja) * | 2017-09-12 | 2019-03-28 | ヤフー株式会社 | 抽出装置、抽出方法、抽出プログラム、及びモデル |
JP2022541890A (ja) * | 2019-07-12 | 2022-09-28 | 智慧芽信息科技(蘇州)有限公司 | 画像データベース構築方法、検索方法、電子機器及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP3694149B2 (ja) | 2005-09-14 |
US6169998B1 (en) | 2001-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3694149B2 (ja) | 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US6353840B2 (en) | User-defined search template for extracting information from documents | |
US7647303B2 (en) | Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program | |
JP4366108B2 (ja) | 文書検索装置、文書検索方法及びコンピュータプログラム | |
US8825592B2 (en) | Systems and methods for extracting data from a document in an electronic format | |
US20070171473A1 (en) | Information processing apparatus, Information processing method, and computer program product | |
US6621941B1 (en) | System of indexing a two dimensional pattern in a document drawing | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
WO2000052645A1 (fr) | Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document | |
JP2008022159A (ja) | 文書処理装置及び文書処理方法 | |
JP2011248596A (ja) | 画像入り文書の検索システム及び検索方法 | |
JP2004341940A (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
CN113806472B (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP2005151127A5 (ja) | ||
JPH1166196A (ja) | 文書画像認識装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5414334B2 (ja) | 擬似文書検索システム及び擬似文書検索方法 | |
JP2005107931A (ja) | 画像検索装置 | |
JPH11238072A (ja) | 文書保管装置 | |
JP7252818B2 (ja) | デジタル文書からのデータ抽出システム | |
JP2000020549A (ja) | 文書データベースシステムへの入力支援装置 | |
JPH10307837A (ja) | 検索装置並びに検索プログラムを記録した記録媒体 | |
JP4384736B2 (ja) | 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPS62106574A (ja) | 文書画像フアイル登録検索方式 | |
JP2021033743A (ja) | 情報処理装置、文書識別方法、及び情報処理システム | |
US20140156593A1 (en) | Information processing apparatus, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050623 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080701 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090701 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100701 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110701 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120701 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120701 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130701 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |