JPH0793374A - 文書検索方法及びシステム - Google Patents

文書検索方法及びシステム

Info

Publication number
JPH0793374A
JPH0793374A JP6094421A JP9442194A JPH0793374A JP H0793374 A JPH0793374 A JP H0793374A JP 6094421 A JP6094421 A JP 6094421A JP 9442194 A JP9442194 A JP 9442194A JP H0793374 A JPH0793374 A JP H0793374A
Authority
JP
Japan
Prior art keywords
document
search
text data
image data
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6094421A
Other languages
English (en)
Other versions
JP3491962B2 (ja
Inventor
Debitsuto Jiyonasan
デビット ジョナサン
Gaarando Harii
ガーランド ハリー
Emu Hantaa Kenisu
エム. ハンター ケニス
Ei Mei Jierarudo
エイ. メイ ジェラルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH0793374A publication Critical patent/JPH0793374A/ja
Application granted granted Critical
Publication of JP3491962B2 publication Critical patent/JP3491962B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Abstract

(57)【要約】 【目的】 予め保存文書に対してインデックスを作成す
ることなく、操作者が選択したどんな検索項目に対して
も選択的に文書を検索可能である文書検索方法及びシス
テムを提供することを目的とする。 【構成】 ステップS202で文書のイメージデータ部
を生成し、ステップS204でOCRによりイメージデ
ータ部からテキストデータ部を抽出・生成する。そして
ステップS206でテキストデータ部の語句のイメージ
データ部における座標情報を保持するTICテーブルを
生成する。ステップS208で検索基準が入力されると
ステップS210で検索語句がCPUにより生成され、
ステップS212でテキストデータ部から検索語句が選
択・確定され、ステップS214でTICテーブルより
検索語句の座標情報を得ることにより、ステップS21
4で検索語句を含む部分の表示を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は複数の文書を取り扱う文
書検索方法及びシステムに関し、特にテキストとグラフ
ィックの両形式で格納された文書を検索項目により検索
し、該検索項目を含むページ部分をグラフィック表示す
る文書検索方法及びシステムに関するものである。
【0002】
【従来の技術】従来より、文書の電子保存システムは病
院や大学、政府関係機関等における大量の文書の取り扱
いを容易なものにしている。文書の電子保存システムで
は、文書の文字情報を電子保存システムで取扱可能な形
式のデータに変換可能なスキャナを用いて、文書を大容
量の記憶装置に入力している。この方法によれば、文字
情報を含む文書を走査して読み取ることは容易であり、
種々のデータ形式で格納可能である。また、文書の文字
情報とイメージ情報との両方を作成するために、スキャ
ナによる文書の走査と、OCR(Optical character re
cognition:光学的文字認識装置)による文書上の文字
認識処理との両方を実行することも可能である。
【0003】また、電子保存システムに複数の文書が保
存されると、その文書の中から、選択された文書全体、
又は選択されたページを検索する必要性が生じる。例え
ば、病院では電子保存システムに保存されている全患者
の経過情報を保守しなければならず、従ってそれを検索
して更新するために、文書を選択的に呼び出すことが可
能となっている。即ち、文書検索システムが導入されて
いる。
【0004】これら一般的な文書検索システムにおいて
は、記憶装置に入力された文書にインデックスを割りあ
てることにより、文書の選択的な検索を可能としてい
た。尚、従来の文書検索システムにおけるインデックス
とは、システムで生成されたり、又は操作者により定義
される文字コードであり、文書と共に保存される。従っ
て文書を検索するためには、操作者は目的の文書に対応
した適切な文字コードをシステムに入力せねばならなか
った。
【0005】一方、その他の文書検索システムとして
は、予め文書より抜き出されたキーワードを使用して、
操作者の目的とする文書を検索するものもある。
【0006】しかしながら上述した従来の文書検索シス
テムにおいては、操作者は検索しようとする文書に対応
するインデックス又は文字コードを知っていなければな
らないという問題がある。もしも操作者が不適切なイン
デックス又は文字コードを入力した場合、目的とする文
書は検索されない。
【0007】また、現在実用に供されている文書検索シ
ステムにおいては、文書はテキストとグラフィックの両
形式で保存されている。操作者は、予め決定されたイン
デックスの文字列に限定されることなく、文書内のどん
な文字列でも検索項目として入力できる。そして、検索
された文書はテキスト形式とグラフィック形式の両方で
表示される。
【0008】
【発明が解決しようとする課題】しかしながら、上述し
た従来の文書検索システムでは、検索項目を含んだ文書
のページ全てを検索するが、ほとんどの表示装置は全ペ
ージのテキスト情報を表示するのに十分な容量を持って
いないため、操作者は画面上に表示されたテキスト情報
から検索項目を探さねばならない。このような処理は時
間の浪費となるばかりでなく、特に大量の文書検索処理
を行う操作者にとっては、大変不便なものである。
【0009】従って本発明においては、予め保存文書に
対してインデックスを作成することなく、操作者が選択
したどんな検索項目に対しても選択的に文書を検索可能
である文書検索方法及びシステムを提供することを目的
とする。
【0010】更に、本発明においてはページ内の検索項
目を含む部分も検索可能であり、該検索項目は検索され
たページ内において明示されることを目的とする。
【0011】
【課題を解決するための手段】本発明は上述した目的を
達成するために、以下の工程を備える。
【0012】即ち、少なくとも1ページの文書部に含ま
れる情報を格納して検索する文書検索方法であって、文
書部に含まれる情報を示すイメージデータを生成するイ
メージデータ生成工程と、前記イメージデータを第1の
記憶部に格納するイメージデータ記憶工程と、前記文書
部に含まれる情報のテキスト部を示すテキストデータを
生成するテキストデータ生成工程と、前記テキストデー
タを第2の記憶部に格納するテキストデータ記憶工程
と、前記文書部の各語句の座標情報を示すデータを有し
前記テキストデータと前記イメージデータとを関連付け
るテーブルを生成するテーブル生成工程と、前記テキス
トデータ内で操作者が定義した検索基準に従って検索語
句を確定する検索語句確定工程と、前記テキストデータ
内で確定された検索語句に従って前記テーブルより座標
情報を確定する座標情報確定工程と、確定された座標情
報に基づいて検索語句の少なくとも一部を含んだ文書部
のページの部分表示を行う部分表示工程とを有すること
を特徴とする。
【0013】更に、前記部分表示工程は検索語句の少な
くとも一部を明示することを特徴とする。
【0014】例えば、前記テキストデータ生成工程は格
納されたイメージデータより光学的文字認識処理により
テキストデータを生成すること特徴とする。
【0015】更に、前記文字認識処理は更に文書部に含
まれた情報をテキスト部分とグラフィック部分とに分割
することを特徴とする。
【0016】例えば、前記イメージデータはビットマッ
プで構成されることを特徴とする。
【0017】例えば、前記テキストデータ生成工程は光
学的文字認識処理により格納されたイメージデータ部よ
りテキストデータを生成することを特徴とする。
【0018】例えば、前記テキストデータはASCI
I,Unicode,EBCDIC及びJISコードの
うちの1つであることを特徴とする。
【0019】更に、前記イメージデータ部記憶工程はイ
メージデータを圧縮することを特徴とする。
【0020】例えば、前記部分表示工程はそれぞれ検索
語句の少なくとも一部を含んでいるような複数のページ
の部分表示を行うことを特徴とする。
【0021】
【作用】以上の工程により、文書のイメージデータ部を
生成し、イメージデータ部からテキストデータ部を抽出
・生成し、そしてテキストデータ部の語句のイメージデ
ータ部における位置情報を保持するテーブルを生成す
る。そして入力された検索基準に従って検索語句を生成
し、テキストデータ部において検索語句を選択・確定
し、テーブルより検索語句の位置情報を得ることによ
り、検索語句を含む部分の表示を行うことができるとい
う特有の作用効果がある。
【0022】
【実施例】まず、本発明に係る一実施例の概要を説明す
る。本実施例の文書検索システムにおいては、操作者が
定義した検索基準に基づいて、文書部から例えば単語等
の検索情報を検索する また、文書部に含まれる情報から、例えばスキャナ等で
走査することによってイメージデータ部を生成する。該
イメージデータ部は例えばビットマップとして、その後
にアクセスするメモリに格納される。
【0023】そして、文書に含まれる情報のテキスト部
分から、例えばASCII,Unicode,EBCD
IC,JIS等のテキストのデータ形式を生成する文字
認識装置によってテキストデータ部を生成する。
【0024】次に、イメージデータ部内の語句の座標情
報を含むテキスト―イメージ対応テーブル(Text-Image
Correspondence table:以下、TICテーブル)を生
成する。尚、該TICテーブルはテキストデータ部の情
報と関連するデータを含んでもよい。
【0025】そして、検索語句が例えば操作者によって
定義された検索基準に従って、確定される。該検索語句
は操作者が定義した検索語句に正確に一致していてもよ
いし、所定の、または操作者により定められたいくつか
の規則に従って生成されてもよい。本実施例においては
検索語句を生成するための種々の方法及びシステムが使
用可能であるが、詳細は後述する。
【0026】尚、検索語句はテキストデータ部内で確定
されるが、検索語句のイメージデータ部における座標情
報を得るために、上述したTICテーブルが参照され
る。検索語句を含んだページの部分表示は、検索語句の
座標情報を参照して行われる。この時、検索語句を含ん
だ表示は1ページであったり、各ページが検索語句の一
部をそれぞれ含んだ複数のページの部分であったりす
る。
【0027】以上説明したように本実施例における文書
検索方法及びシステムでは、イメージデータ部、テキス
トデータ部、及びTICテーブルを備える。尚、本実施
例の文書検索システムはプロセッサを備え、操作者によ
り定義された検索基準に従ってテキストデータ部の検索
語句を確定し、検索語句に対応するTICテーブルの座
標情報を抽出する。更に、本実施例の文書検索システム
は抽出された座標情報に基づいて、検索語句を含むペー
ジの部分を表示する表示装置を含む。
【0028】以下、図面を参照して本実施例について詳
細に説明する。
【0029】本実施例は文書の格納及び選択的な情報検
索を行うにあたりコンピュータを利用した方法及びシス
テムである。尚、以下「文書部」とは1ページ又は複数
のページからなる1つの文書と、連結、グループ化、及
び検索を行うために操作者によりまとめられて扱われる
文書の組み合わせとを意味する。従って、文書部は1ペ
ージから多数ページまでの種々のサイズを取り得る。ま
た、文書部は通常紙に印刷されているが、他の媒体に情
報を含んでいてもよい。また、各文書部はテキストの
み、グラフィックのみ、又はテキストとグラフィックと
の混在する文書であってもよい。
【0030】図1は、本実施例の文書検索システムの構
成を示すブロック図である。図1において、100は文
書である原稿、102は原稿100を走査するスキャナ
部、104は本実施例における各部を制御するCPU、
106はRAM等により構成される記憶部、108は光
学的文字認識処理を行うOCR、110はCRT等の表
示部、112はキーボード等の操作部である。
【0031】スキャナ部102は原稿100を走査する
センサ列を備えており、原稿100を読みとったイメー
ジ信号をデジタル信号列に変換する。尚、このセンサ列
は一般的に実用化されているものであればどんな形式の
ものでも適用可能である。原稿100を走査することに
よりセンサ列から得られた情報は、デジタルの信号列と
してCPU104に送出される。尚、本実施例において
CPU104は適当な汎用のコンピュータである。そし
て、得られた原稿100のイメージデータはCPU10
4の制御により記憶部106にビットマップの形式で格
納される。
【0032】また、イメージデータは例えばファクシミ
リ装置や電子メール等の不図示の電子媒体を介して、C
PU104に入力されてもよい。この時、ファクシミリ
装置や電子メールシステム等は、本実施例の文書検索シ
ステムと共に使用される。
【0033】そしてCPU104は、ビットマップ形式
のイメージデータを例えばASCII文字のテキストデ
ータに変換するためのプログラムを制御する。本実施例
においてビットマップ形式のイメージデータからテキス
トを認識して、即座にテキストデータを生成する文字認
識プログラムは、汎用のソフトウェアそのものでも、ま
た、汎用のソフトウェアを流用して文字認識プログラム
を製造しても、過度の検査を行うことなく利用可能であ
る。
【0034】本実施例においては、既存のソフトウェア
のみによる方法によっても、または最も汎用的かつ効果
的であるとされるソフトウェアと特別の処理との組み合
わせから成る方法によっても、文字認識処理を行うこと
ができる。尚、本実施例において「文字認識」とは、文
字を示すイメージの形式である信号を、該文字を示すコ
ードに変換することを意味する。例えば文字認識によ
り、イメージの形式であった文字信号がASCIIコー
ドに変換されれば、他のプログラム等への入出力や、そ
の他の一般的な処理の実行も可能となる。また、例えば
UnicodeやEBCDIC、又はJIS等の他のコ
ードももちろん使用可能である。尚、本実施例における
スキャナ部102は、種々の汎用のスキャナ装置が適用
可能である。
【0035】次に、図2を参照して、上述した構成にお
ける文書検索処理について詳細に説明する。図2は、本
実施例における文書検索処理を示すフローチャートであ
る。
【0036】まず、ステップS200において原稿10
0がスキャナ部102に装填され、原稿100のイメー
ジ信号を生成するための走査及び光電変換が行われる。
尚、ステップS200においては、上述したようにスキ
ャナ部102で文書部の印刷原稿の走査を行う代わり
に、文書情報をCPU104へ電気的に出力するような
処理を行ってもよい。
【0037】ステップS200の文書入力処理に続い
て、ステップS202においてはCPU104の制御に
従って、走査された原稿100の情報からイメージデー
タ部を生成し、記憶部106の所定領域に格納する。こ
の時、イメージデータ部はJPEGまたはその他の公知
の圧縮方法により、圧縮されている。イメージデータ部
において圧縮を適用することにより、イメージの画質の
低下を伴うこともあるが、記憶部106での必要容量が
削減できる。
【0038】続いてステップS204において、イメー
ジデータ部よりOCR108や他の同等の文字認識装置
を使用して得られた情報に従って、テキストデータ部を
生成し、記憶部106の所定領域に格納する。
【0039】そして処理はステップS206に進み、後
述するようにしてテキストデータ部の語句情報とそれに
対応するとイメージデータ部の座標情報とを持つTIC
テーブルを生成する。
【0040】以上説明したステップS200からステッ
プS206迄の処理により、本実施例における文書部の
保存データが完成する。
【0041】以下、図3を参照して上述した図2のステ
ップS200からステップS206迄の処理を更に詳細
に説明する。図3は、本実施例における文書保存処理を
示すフローチャートである。尚、図3において上述した
図2と同様の処理を行うステップについては、同一ステ
ップ番号を付してある。
【0042】図3においてまずステップS200では、
上述したように原稿100の文書情報がスキャナ部10
2において走査されるか、又は他の方法によって入力さ
れる。そして、続くステップS202でイメージデータ
部が生成され、格納される。そしてステップS304に
進み、イメージデータ部においてテキストとグラフィッ
クとが判別され、更に所定のサイズに応じて、イメージ
データ部は領域分割される。ここで、図4の(a)にス
テップS304において分割されたイメージデータ部の
例を示す。図4の(a)において、分割されたイメージ
データ部の各領域は、図中の行間の横線で区切られてい
る。
【0043】次に、ステップS306において分割され
たイメージデータ部は、更に各単語毎に分割されること
により、文字切り出しが行われる。図4の(b)に、文
字切り出しが行われたイメージデータ部の例を示す。図
4の(b)において、ステップS306における文字切
り出し処理は各単語間の縦線によって示され、イメージ
データ部には各単語毎に小領域が生成される。
【0044】上述したステップS304における領域分
割と、ステップS306における文字切り出し処理とに
より得られた情報により、各小領域の相対的な位置を確
定することが可能となる。この相対的な位置の確定は、
イメージデータ部においてステップS304における領
域分割処理と、ステップS306における文字切り出し
処理とにより形成された交線に従って、行われる。図4
の(c)に、この相対位置確定の例を示す。図4の
(c)においては、各単語の小領域を形成する矩形の左
上点、及び右下点の座標を求めることにより、相対位置
を確定する。
【0045】尚、ステップS306における文字切り出
し処理において、例えば句読点付けや段落構成等により
存在しているデータは、データ量の削減のために除去さ
れる。そしてステップS204において、保存されたイ
メージデータ部より、例えばOCRによってイメージデ
ータ部で認識された文字データと同様の文字コードを含
むテキストデータ部が生成され、同様に保存される。
【0046】次に、処理はステップS206に進み、T
ICテーブルが生成される。TICテーブルは、イメー
ジデータ部の各小領域における座標情報を保持するTI
Cテーブルが生成される。本実施例におけるTICテー
ブルの例を図5に示す。図5に示すTICテーブルにお
いて、例えばテキストデータ部に存在する文字コード
「This」は、イメージデータ部においては、「x
1,y1 x2,y2」の位置、即ち、(x1,y1)
〜(x2,y2)で囲まれる矩形に位置する文字データ
に対応していることが分かる。
【0047】本実施例において、TICテーブルはCP
U104がアクセス可能であるルックアップテーブルと
して記憶部104に保持されている。以上説明したよう
に、即ちTICテーブルは、テキストデータ部に保持さ
れ、かつイメージデータ部において位置定義がなされて
いる文書中の語句に対応している。
【0048】以下、図2に戻って本実施例において実際
に検索を行う処理について説明する。以上説明したよう
に、TICテーブルおよびテキストデータ部、イメージ
データ部は既に記憶部106に格納されている。まずス
テップS208において、格納された文書内で語句を位
置付けるための検索基準を、操作者が決定する。本実施
例においては予め定められた複数の検索基準より操作者
が選択する形式で、検索基準を決定する。例えば、予め
定められた複数の検索基準を表示部110にグラフィカ
ルなリストやオプションメニューの形式で表示するか、
または他の方法により、決定される検索基準に一定の制
限を設ける。
【0049】尚、本実施例において「語句」とは、単
語、熟語、文字、又は操作者が文書部から選択した文字
列等を含む。また句読点については、システムに応じて
語句として扱うか否かを決定すればよい。また、TIC
テーブルに保持されている座標情報は、独立した文書に
おける語句の領域として、矩形の対角上の点に対応して
いることが好ましい。また、文書内の語句の位置を識別
するための他の方法として、例えば他の幾何学的な定義
点を識別する方法を用いてもよい。
【0050】続いてステップS210において、CPU
104によって、検索基準に基づいて検索語句が生成さ
れる。例えば病院を例とすると、ステップS208にお
いて検索基準として単純に「Jonesさんの全記録」
が設定されていれば、その結果、ステップS210にお
いて検索語句「Jones」が生成される。また、その
他の例として検索基準と検索語句とが正確に一致する場
合を考える。例えば操作者が検索基準として「Jone
s」を指定すると、検索語句も「Jones」であり、
その結果、検索語句「Jones」と正確に一致した文
書の部分のみが検索される。
【0051】同様に、検索基準を文字以外(非文字)で
指定することも可能である。例えば、結果として検索語
句が所定のグループやクラスを意味するのであれば、操
作者はその検索語句を生成するような検索基準を指定す
ることができる。例えば、病院においては操作者が「名
前の頭文字が『P』である」という検索基準を指定した
とする。すると、検索語句としては例えば「Pau
l」,「Pauline」,「Peter」等が生成さ
れる。以上説明したように、本実施例においては種々の
検索方法が適用可能であり、システムの特性等により、
適用する検索方法を適当に決定すればよい。
【0052】ステップS210においてCPU104に
より検索基準より検索語句が生成されると、次にステッ
プS212において、テキストデータ部内で検索語句が
検索・確定される。ステップS212においては、本実
施例の文書検索システムにおいて容易に適用できる一般
的な検索方法を使用して、テキストデータ部から検索語
句を検索する。尚、この検索方法には、上述したTIC
テーブルの参照や、その他の検索に有用な方法の使用を
含む。
【0053】そしてステップS214に進み、ステップ
S212においてテキストデータ部で確定された検索語
句の座標情報が、TICテーブルを参照することにより
確定される。尚、この座標情報は、文書部における検索
語句の位置情報として確定される。本実施例において
は、ステップS214でテキストデータ部内で検索語句
が検索・確定される毎に、ステップS214でTICテ
ーブルを参照して座標情報を確定するが、例えば座標情
報が確定されるよりも先に、ステップS212において
全ての検索語句を検索・確定しておいてもよい。
【0054】ステップS214においてTICテーブル
より全ての検索語句の座標情報が確定されると、続いて
ステップS216に進み、検索語句を含んだ文書の一部
の表示情報がイメージデータ部より生成され、表示部1
10に表示される。表示部110に表示することによ
り、例えば検索された結果、検索語句が分断されている
ような特殊な場合に、操作者に対して報知しやすいとい
う効果がある。ここで、検索語句が2行にまたがってい
た場合(例えば検索語句がハイフンで結ばれていた場
合)や、異なる2ページに分割されていた場合(例えば
検索語句が数単語を含んでいた場合)について考える。
これら検索語句が複数のページに分断されることは起こ
り得ることである。この特殊な事例においても、本実施
例では検索語句の座標情報(TICテーブル)を参照す
ることにより、表示情報が文書部の異なる2ページの部
分を含んでいても全ての検索語句を含む表示情報を生成
することができる。
【0055】また、表示部110には、複数の文書を表
示するためのモードが備えられており、その各文書表示
は、例えばイメージデータ部からグラフィックイメージ
を生成することにより、ステップS200において走査
された原稿の文書と一致するイメージが操作者に提供さ
れる。また、各文書表示においては、文書の文字及び文
字以外の両部分を表示可能である。
【0056】更に、本実施例では表示部110において
検索語句を明示する複数の手段を有する。例えば、テキ
ストデータ部において確定された検索語句を表示する際
にハイライトにしたり、或は何らかのグラフィカルな手
段によって、操作者に対して検索語句を明示する。また
逆に、ステップS216において表示情報がイメージデ
ータ部より生成されるため、その部分をバックライトに
する等、文書部の検索された部分における検索語句を、
その他の手段により指示することも可能である。
【0057】尚、本発明は、複数の機器から構成される
システムに適用しても1つの機器から成る装置に適用し
ても良い。また、本発明は、システム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることはいうまでもない。
【0058】
【発明の効果】以上説明したように本発明によれば、予
め保存文書に対してインデックスを作成することなく、
操作者が選択した検索項目に対して選択的に文書を検索
し、表示することが可能となる。また、ページ内の検索
項目を含む部分も検索可能となり、該検索項目は検索さ
れたページ内において明示的に表示されるため、操作者
にとって非常に視認しやすくなる。
【0059】
【図面の簡単な説明】
【図1】本発明に係る一実施例の画像処理装置の構成を
示すブロック図である。
【図2】本実施例における文書検索処理を示すフローチ
ャートである。
【図3】本実施例における図2のフローチャートの更に
詳細な処理を示すフローチャートである。
【図4】本実施例におけるTICテーブル作成手順を説
明するための図である。
【図5】本実施例におけるTICテーブルの例を示す図
である。
【符号の説明】
100 原稿 102 スキャナ部 104 CPU 106 記憶部 108 OCR 110 表示部 112 操作部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ハリー ガーランド アメリカ合衆国 カリフォルニア州 パ ロ・アルト・ミランダ・アヴェニュー・ス タンフォード・リサーチ・パーク4009 ア ット キヤノン・リサーチ・センター・ア メリカ,インコーポレイテッド内 (72)発明者 ケニス エム. ハンター アメリカ合衆国 カリフォルニア州 パ ロ・アルト・ミランダ・アヴェニュー・ス タンフォード・リサーチ・パーク4009 ア ット キヤノン・リサーチ・センター・ア メリカ,インコーポレイテッド内 (72)発明者 ジェラルド エイ. メイ アメリカ合衆国 カリフォルニア州 パ ロ・アルト・ミランダ・アヴェニュー・ス タンフォード・リサーチ・パーク4009 ア ット キヤノン・リサーチ・センター・ア メリカ,インコーポレイテッド内

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1ページの文書部に含まれる
    情報を格納して検索する文書検索方法であって、 文書部に含まれる情報を示すイメージデータを生成する
    イメージデータ生成工程と、 前記イメージデータ部を第1の記憶部に格納するイメー
    ジデータ記憶工程と、 前記文書部に含まれる情報のテキスト部を示すテキスト
    データを生成するテキストデータ生成工程と、 前記テキストデータを第2の記憶部に格納するテキスト
    データ記憶工程と、 前記文書部の各語句の座標情報を示すデータを有し前記
    テキストデータと前記イメージデータとを関連付けるテ
    ーブルを生成するテーブル生成工程と、 前記テキストデータ内で操作者が定義した検索基準に従
    って検索語句を確定する検索語句確定工程と、 前記テキストデータ内で確定された検索語句に従って前
    記テーブルより座標情報を確定する座標情報確定工程
    と、 確定された座標情報に基づいて検索語句の少なくとも一
    部を含んだ文書部のページの部分表示を行う部分表示工
    程とを有することを特徴とする文書検索方法。
  2. 【請求項2】 前記部分表示工程は更に検索語句の少な
    くとも一部を明示することを特徴とする請求項1記載の
    文書検索方法。
  3. 【請求項3】 前記テキストデータ生成工程は格納され
    たイメージデータより光学的文字認識処理によりテキス
    トデータを生成すること特徴とする請求項1記載の文書
    検索方法。
  4. 【請求項4】 前記文字認識処理は更に文書部に含まれ
    た情報をテキスト部分とグラフィック部分とに分割する
    ことを特徴とする請求項3記載の文書検索方法。
  5. 【請求項5】 前記イメージデータはビットマップで構
    成されることを特徴とする請求項1記載の文書検索方
    法。
  6. 【請求項6】 前記テキストデータ生成工程は光学的文
    字認識処理により、格納されたイメージデータよりテキ
    ストデータを生成することを特徴とする請求項5記載の
    文書検索方法。
  7. 【請求項7】 前記テキストデータはASCII,Un
    icode,EBCDIC及びJISコードのうちの1
    つであることを特徴とする請求項1記載の文書検索方
    法。
  8. 【請求項8】 前記イメージデータ記憶工程は更にイメ
    ージデータを圧縮することを特徴とする請求項1記載の
    文書検索方法。
  9. 【請求項9】 前記部分表示工程はそれぞれ検索語句の
    少なくとも一部を含んでいるような複数のページの部分
    表示を行うことを特徴とする請求項1記載の文書検索方
    法。
  10. 【請求項10】 複数のページからなる文書部に含まれ
    る情報を格納して検索する文書検索方法であって、 前記文書部に含まれる情報を示すイメージデータを生成
    するイメージデータ生成工程と、 前記イメージデータを第1の記憶部に格納するイメージ
    データ記憶工程と、 前記文書部に含まれる情報のテキスト部を示すテキスト
    データを生成するテキストデータ生成工程と、 前記テキストデータを第2の記憶部に格納するテキスト
    データ記憶工程と、 前記文書部の各語句の座標情報を示すデータを有し前記
    テキストデータと前記イメージデータとを関連付けるテ
    ーブルを生成するテーブル生成工程と、 操作者が定義した検索基準に従って予め定められた方法
    により非文字検索項目を生成する非文字検索項目生成工
    程と、 前記テキストデータ内で少なくとも1つの非文字検索項
    目を確定する非文字検索項目確定工程と、 前記テキストデータ内で確定された非文字検索項目に従
    って前記テーブルより座標情報を確定する座標情報確定
    工程と、 確定された座標情報に基づいて非文字検索項目の少なく
    とも一部を含んだ文書部のページの部分表示を行う部分
    表示工程とを有することを特徴とする文書検索方法。
  11. 【請求項11】 前記部分表示工程は更に非文字検索項
    目の少なくとも一部を明示することを特徴とする請求項
    10記載の文書検索方法。
  12. 【請求項12】 前記テキストデータ生成工程は格納さ
    れたイメージデータより光学的文字認識処理によりテキ
    ストデータを生成すること特徴とする請求項10記載の
    文書検索方法。
  13. 【請求項13】 前記文字認識処理は更に文書部に含ま
    れた情報をテキスト部分とグラフィック部分とに分割す
    ることを特徴とする請求項12記載の文書検索方法。
  14. 【請求項14】 前記イメージデータはビットマップで
    構成されることを特徴とする請求項10記載の文書検索
    方法。
  15. 【請求項15】 前記テキストデータ生成工程は光学的
    文字認識処理により格納されたイメージデータよりテキ
    ストデータを生成することを特徴とする請求項14記載
    の文書検索方法。
  16. 【請求項16】 前記テキストデータはASCII,U
    nicode,EBCDIC及びJISコードのうちの
    1つであることを特徴とする請求項10記載の文書検索
    方法。
  17. 【請求項17】 前記イメージデータ記憶工程は更にイ
    メージデータを圧縮することを特徴とする請求項10記
    載の文書検索方法。
  18. 【請求項18】 前記部分表示工程はそれぞれ非文字検
    索項目の少なくとも一部を含んでいるような複数のペー
    ジの部分表示を行うことを特徴とする請求項10記載の
    文書検索方法。
  19. 【請求項19】 少なくとも1ページからなる文書部に
    含まれる情報を格納して検索する文書検索方法であっ
    て、 前記文書部に含まれる情報を示すイメージデータと文書
    部に含まれる情報のうちのテキスト部分を示すテキスト
    データとを保持し、 前記文書部の各語句の座標情報を示すデータを有し前記
    テキストデータと前記イメージデータとを関連付けるテ
    ーブルを生成するテーブル生成工程と、 操作者が定義した検索基準に従って前記テキストデータ
    より検索語句を確定する検索語句確定工程と、 前記テキストデータ内で確定された検索語句に従って前
    記テーブルより座標情報を確定する座標情報確定工程
    と、 確定された座標情報に基づいて検索語句の少なくとも一
    部を含んだ文書部のページの部分表示を行う部分表示工
    程とを有することを特徴とする文書検索方法。
  20. 【請求項20】 少なくとも1ページの文書部に含まれ
    る情報を格納して検索する文書検索方法であって、 前記文書部に含まれる情報を示すイメージデータと文書
    部に含まれる情報のうちのテキスト部分を示すテキスト
    データとを保持し、 前記文書部の各語句の座標情報を示すデータを有し前記
    テキストデータと前記イメージデータとを関連付けるテ
    ーブルを生成するテーブル生成工程と、 操作者が定義した検索基準に従って予め定められた方法
    により非文字検索項目を生成する非文字検索項目生成工
    程と、 前記テキストデータより非文字検索項目を確定する検索
    語句確定工程と、 前記テキストデータ内で確定された非文字検索語句に従
    って前記テーブルより座標情報を確定する座標情報確定
    工程と、 確定された座標情報に基づいて非文字検索項目の少なく
    とも一部を含んだ文書部のページの部分表示を行う部分
    表示工程とを有することを特徴とする文書検索方法。
  21. 【請求項21】 少なくとも1ページからなる文書部に
    含まれる情報を格納して検索する文書検索システムであ
    って、 前記文書部に含まれる情報を示すイメージデータと、 前記文書部に含まれる情報のテキスト部を示すテキスト
    データと、 前記文書部の各語句の座標情報を示すデータを有し前記
    テキストデータと前記イメージデータとを関連付けるテ
    ーブルと、 前記テキストデータ内で操作者が定義した検索基準に従
    って検索語句を確定する検索語句確定手段と、 前記テキストデータ内で確定された検索語句に従って前
    記テーブルより座標情報を確定する座標情報確定手段
    と、 確定された座標情報に基づいて検索語句の少なくとも一
    部を含んだ文書部のページの部分表示を行う部分表示手
    段とを有することを特徴とする文書検索システム。
  22. 【請求項22】 前記部分表示手段は検索語句の少なく
    とも一部を明示する明示手段を更に有することを特徴と
    する請求項21記載の文書検索システム。
  23. 【請求項23】 前記テキストデータ生成手段は格納さ
    れたイメージデータより光学的文字認識装置によりテキ
    ストデータを生成すること特徴とする請求項21記載の
    文書検索システム。
  24. 【請求項24】 前記イメージデータはビットマップで
    構成されることを特徴とする請求項21記載の文書検索
    システム。
  25. 【請求項25】 前記テキストデータはASCII,U
    nicode,EBCDIC及びJISコードのうちの
    1つであることを特徴とする請求項21記載の文書検索
    システム。
  26. 【請求項26】 文書部の各語句の座標情報を示すデー
    タを有しテキストデータとイメージデータとを関連付け
    るテーブルを生成するテーブル生成工程と、 操作者が定義した検索基準に従って文書部に含まれた情
    報のテキスト部分を示すテキストデータより検索語句を
    確定する検索語句確定工程と、 前記テキストデータ内で確定された検索語句に従って前
    記テーブルより座標情報を確定する座標情報確定工程
    と、 確定された座標情報に基づいて検索語句の少なくとも一
    部を含んだ文書部のページの部分表示を行う部分表示工
    程とを有することを特徴とする文書検索方法。
  27. 【請求項27】 前記部分表示工程は更に検索語句の少
    なくとも一部を明示することを特徴とする請求項26記
    載の文書検索方法。
  28. 【請求項28】 前記テキストデータ生成工程は文書部
    のイメージデータにおいて光学的文字認識処理を行うこ
    とを特徴とする請求項26記載の文書検索方法。
  29. 【請求項29】 前記文字認識処理は更に文書部に含ま
    れた情報をテキスト部分とグラフィック部分とに分割す
    ることを特徴とする請求項28記載の文書検索方法。
  30. 【請求項30】 前記イメージデータはビットマップで
    構成されることを特徴とする請求項28記載の文書検索
    方法。
  31. 【請求項31】 前記テキストデータはASCII,U
    nicode,EBCDIC及びJISコードのうちの
    1つであることを特徴とする請求項26記載の文書検索
    方法。
  32. 【請求項32】 前記イメージデータ記憶工程は更にイ
    メージデータを圧縮することを特徴とする請求項28記
    載の文書検索方法。
  33. 【請求項33】 前記部分表示工程はそれぞれ検索語句
    の少なくとも一部を含んでいるような複数のページの部
    分表示を行うことを特徴とする請求項26記載の文書検
    索方法。
JP09442194A 1993-05-07 1994-05-06 文書検索方法及びシステム Expired - Fee Related JP3491962B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US6042993A 1993-05-07 1993-05-07
US08/060429 1993-05-07

Publications (2)

Publication Number Publication Date
JPH0793374A true JPH0793374A (ja) 1995-04-07
JP3491962B2 JP3491962B2 (ja) 2004-02-03

Family

ID=22029422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09442194A Expired - Fee Related JP3491962B2 (ja) 1993-05-07 1994-05-06 文書検索方法及びシステム

Country Status (4)

Country Link
US (1) US5825943A (ja)
EP (1) EP0625757B1 (ja)
JP (1) JP3491962B2 (ja)
DE (1) DE69425607T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2093994A1 (en) 2008-02-19 2009-08-26 Canon Kabushiki Kaisha Electronic document producing device, electronic document producing method and storage medium
KR101495258B1 (ko) * 2005-09-22 2015-02-25 구글 인코포레이티드 이미지 프로세싱 시스템 및 그 방법

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
JPH08180068A (ja) * 1994-12-26 1996-07-12 Canon Inc 電子ファイリング装置
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
US5974406A (en) * 1997-08-18 1999-10-26 International Business Machines Corporation Automated matching, scheduling, and notification system
US6018735A (en) * 1997-08-22 2000-01-25 Canon Kabushiki Kaisha Non-literal textual search using fuzzy finite-state linear non-deterministic automata
US7447626B2 (en) 1998-09-28 2008-11-04 Udico Holdings Method and apparatus for generating a language independent document abstract
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
WO2000062205A1 (en) * 1999-04-13 2000-10-19 Schulze Michael D Method of obtaining an electronically-stored financial document
US20120179715A1 (en) 1999-04-13 2012-07-12 Mirror Imaging L.L.C. Method of Obtaining An Electronically-Stored Financial Document
US6505209B1 (en) 1999-11-02 2003-01-07 Monkeymedia, Inc. Poly vectoral reverse navigation
US6633903B1 (en) 2000-03-23 2003-10-14 Monkeymedia, Inc. Method and article of manufacture for seamless integrated searching
US7398462B1 (en) * 2000-04-25 2008-07-08 Microsoft Corporation Common text framework
US20020126902A1 (en) * 2001-03-08 2002-09-12 Konica Corporation Character information collating correction apparatus
US20020176628A1 (en) * 2001-05-22 2002-11-28 Starkweather Gary K. Document imaging and indexing system
ES2201871B1 (es) * 2001-08-30 2005-05-16 Cultura Y Solidaridad, S.L. Sistema de busquedas bibliograficas mediante consultas de indices.
US7151864B2 (en) * 2002-09-18 2006-12-19 Hewlett-Packard Development Company, L.P. Information research initiated from a scanned image media
US20040260681A1 (en) * 2003-06-19 2004-12-23 Dvorak Joseph L. Method and system for selectively retrieving text strings
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US20060062453A1 (en) * 2004-09-23 2006-03-23 Sharp Laboratories Of America, Inc. Color highlighting document image processing
US20060206546A1 (en) * 2005-03-10 2006-09-14 Kabushiki Kaisha Toshiba Document managing apparatus
EP1758031A1 (en) * 2005-08-25 2007-02-28 Microsoft Corporation Selection and display of user-created documents
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US8903810B2 (en) 2005-12-05 2014-12-02 Collarity, Inc. Techniques for ranking search results
US8429184B2 (en) 2005-12-05 2013-04-23 Collarity Inc. Generation of refinement terms for search queries
US8494280B2 (en) * 2006-04-27 2013-07-23 Xerox Corporation Automated method for extracting highlighted regions in scanned source
US8442972B2 (en) * 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
US20080216009A1 (en) * 2007-03-02 2008-09-04 Paul Drallos Virtual Library File System
US8392454B2 (en) * 2007-03-08 2013-03-05 Xerox Corporation Concordance searching systems and methods
US7751087B2 (en) * 2007-04-03 2010-07-06 Xerox Corporation Automatic colorization of monochromatic printed documents
US20110035662A1 (en) 2009-02-18 2011-02-10 King Martin T Interacting with rendered documents using a multi-function mobile device, such as a mobile phone
JP5098559B2 (ja) * 2007-10-11 2012-12-12 富士ゼロックス株式会社 類似画像検索装置、及び類似画像検索プログラム
JP5233350B2 (ja) * 2008-03-21 2013-07-10 富士ゼロックス株式会社 文書処理装置及び文書処理プログラム
US8438178B2 (en) 2008-06-26 2013-05-07 Collarity Inc. Interactions among online digital identities
US20090323134A1 (en) * 2008-06-30 2009-12-31 Kabushiki Kaisha Toshiba Apparatus and method for generating segmentation data of a scanned image
US8131720B2 (en) 2008-07-25 2012-03-06 Microsoft Corporation Using an ID domain to improve searching
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US8875038B2 (en) 2010-01-19 2014-10-28 Collarity, Inc. Anchoring for content synchronization
DE102019122223A1 (de) * 2019-08-19 2021-02-25 Cortex Media GmbH System und Verfahren zur Identifizierung und/oder Extrahierung von für eine Angebotsabgabe relevanter Information aus einem eine Ausschreibung oder eine Anfrage betreffenden Dokument

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03260768A (ja) * 1990-03-09 1991-11-20 Fuji Electric Co Ltd キーワード強調表示装置
JPH04281559A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0051226B1 (en) * 1980-10-31 1987-03-04 Kabushiki Kaisha Toshiba Document information filing system with a single display device
US4941125A (en) * 1984-08-01 1990-07-10 Smithsonian Institution Information storage and retrieval system
JPH0750483B2 (ja) * 1985-05-22 1995-05-31 株式会社日立製作所 文書画像追加情報の蓄積方法
JPH0797373B2 (ja) * 1985-08-23 1995-10-18 株式会社日立製作所 文書フアイリングシステム
US4829453A (en) * 1987-03-05 1989-05-09 Sharp Kabushiki Kaisha Apparatus for cataloging and retrieving image data
US5146404A (en) * 1986-09-19 1992-09-08 Westinghouse Electric Corporation Electronic maintenance support work station
US4805099A (en) * 1987-04-17 1989-02-14 Wang Laboratories, Inc. Retrieval of related records from a relational database
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JP2745406B2 (ja) * 1988-03-11 1998-04-28 株式会社リコー 画像ファイリングシステムの制御方式
US5202985A (en) * 1988-04-14 1993-04-13 Racal-Datacom, Inc. Apparatus and method for displaying data communication network configuration after searching the network
US5133052A (en) * 1988-08-04 1992-07-21 Xerox Corporation Interactive graphical search and replace utility for computer-resident synthetic graphic image editors
EP0424803B1 (de) * 1989-10-24 1997-07-16 FROESSL, Horst Verfahren zur mindestens teilweisen Umsetzung von Bilddaten in Text mit Vorbereitung für nachfolgende Speicherung oder Weiterverarbeitung
US5133024A (en) * 1989-10-24 1992-07-21 Horst Froessl Image data bank system with selective conversion
US5185857A (en) * 1989-12-13 1993-02-09 Rozmanith A Martin Method and apparatus for multi-optional processing, storing, transmitting and retrieving graphical and tabular data in a mobile transportation distributable and/or networkable communications and/or data processing system
US5179652A (en) * 1989-12-13 1993-01-12 Anthony I. Rozmanith Method and apparatus for storing, transmitting and retrieving graphical and tabular data
JPH03202967A (ja) * 1989-12-28 1991-09-04 Toshiba Corp 電子ファイリング装置
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
US5251316A (en) * 1991-06-28 1993-10-05 Digital Equipment Corporation Method and apparatus for integrating a dynamic lexicon into a full-text information retrieval system
EP0596247A3 (en) * 1992-11-02 1994-10-12 Motorola Inc Method for creating a complete document index, as well as for searching, retrieving and viewing.
US5438630A (en) * 1992-12-17 1995-08-01 Xerox Corporation Word spotting in bitmap images using word bounding boxes and hidden Markov models

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03260768A (ja) * 1990-03-09 1991-11-20 Fuji Electric Co Ltd キーワード強調表示装置
JPH04281559A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101495258B1 (ko) * 2005-09-22 2015-02-25 구글 인코포레이티드 이미지 프로세싱 시스템 및 그 방법
EP2093994A1 (en) 2008-02-19 2009-08-26 Canon Kabushiki Kaisha Electronic document producing device, electronic document producing method and storage medium
US8532386B2 (en) 2008-02-19 2013-09-10 Canon Kabushiki Kaisha Electronic document producing device, electronic document producing method and storage medium

Also Published As

Publication number Publication date
DE69425607T2 (de) 2001-04-19
DE69425607D1 (de) 2000-09-28
JP3491962B2 (ja) 2004-02-03
US5825943A (en) 1998-10-20
EP0625757A1 (en) 1994-11-23
EP0625757B1 (en) 2000-08-23

Similar Documents

Publication Publication Date Title
JP3491962B2 (ja) 文書検索方法及びシステム
US6002798A (en) Method and apparatus for creating, indexing and viewing abstracted documents
US6353840B2 (en) User-defined search template for extracting information from documents
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
US5172245A (en) Electronic information retrieval apparatus for image information using primary and secondary menus
US6532461B2 (en) Apparatus and methodology for submitting search oueries
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
JPH11161681A (ja) 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH08180068A (ja) 電子ファイリング装置
JPH06282584A (ja) 画像情報処理装置
JPH1021043A (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH08161350A (ja) 電子ファイリング方法および装置
JPS63101929A (ja) 情報検索装置
JP3424942B2 (ja) 対訳画像形成装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JPH05298374A (ja) デジタル複写機
JPH07319903A (ja) イメージデータ処理システム
JPH0520323A (ja) 文字列変換装置
JPH07244676A (ja) 文書ファイリング装置および文書ファイリング方法
JPH11120201A (ja) 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JPH0237471A (ja) 情報検索装置
JPS63173163A (ja) 情報検索装置
JPH06282573A (ja) 文字登録検索装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081114

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081114

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091114

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101114

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101114

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121114

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131114

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees