JPH08180068A - 電子ファイリング装置 - Google Patents

電子ファイリング装置

Info

Publication number
JPH08180068A
JPH08180068A JP6322399A JP32239994A JPH08180068A JP H08180068 A JPH08180068 A JP H08180068A JP 6322399 A JP6322399 A JP 6322399A JP 32239994 A JP32239994 A JP 32239994A JP H08180068 A JPH08180068 A JP H08180068A
Authority
JP
Japan
Prior art keywords
image
character
position information
picture
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6322399A
Other languages
English (en)
Inventor
Shigetada Kobayashi
重忠 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6322399A priority Critical patent/JPH08180068A/ja
Priority to US08/576,455 priority patent/US5854860A/en
Publication of JPH08180068A publication Critical patent/JPH08180068A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 画像中に含まれる文字に基づいて検索を行っ
た場合に、検索された画像が所望の画像であるか否かの
判断を容易にする。 【構成】 スキャナ204で画像を入力し、CPU20
1が各文字のコードとその位置情報を認識し、メモリ2
02に格納する。操作者により文字キーワードが入力さ
れ、検索が行われると、検索された画像をディスプレイ
203に表示し、かつ、画像中のキーワードに対応する
文字を反転表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は電子ファイリング装置に
関するものである。
【0002】
【従来の技術】従来の電子ファイリングシステムでは、
登録時には、イメージスキャナ等により原稿を読み取
り、得られた画像データと、キーボード等から付加した
検索のためのキーワードとを、ハードディスクや光磁気
ディスクの保存手段によって保存し、検索時には、ユー
ザが指定した検索語(キーワード)によって検索した結
果の画像を表示し、プリンタよりプリントしていた。さ
らに、入力された画像からOCR(光学的文字認識処
理)によって画像内の文字を抽出し、キーワードとして
利用するものがある。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来例では、入力された画像情報は文字の書かれた文書を
スキャナで読み取って得られたビットマップデータであ
り、検索用の文字情報はユーザが入力した任意の文字コ
ードやOCRによって得られた文字コードの集まりのテ
キストデータである。両者は別々のデータであり、画像
中での位置の関係づけがなかった。
【0004】従って、キーワードを入力して検索した結
果得られた文書の画像において、検索キーワード部分を
反転表示などで示すことや、表示された画像データの所
望の範囲の指定をして、指定範囲に該当する部分の文字
データを取り出すことができなかった。
【0005】本出願に係る第1の発明の目的は、文字デ
ータによって検索して得られた画像の文字列部分を、画
像データ上で示すことであり、本出願に係る第2の発明
の目的は、検索で得られた文書の画像の表示画面上で指
定した任意の領域に対応する文字データを得ることであ
る。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本出願に係る第1の発明は、画像入力手段と、上記
画像入力手段によって入力した画像に対して、文字認識
処理を行う認識手段と、上記認識手段により認識される
1文字ごとの文字コードとその文字の位置情報とを検出
する検出手段と、上記検出手段により検出された文字コ
ードと位置情報とを保存する手段と、検索キーワードを
入力するキーワード入力手段と、上記キーワード入力手
段により入力されたキーワードを画像中に有する画像を
検索する検索手段と、上記検索手段により検索された画
像及び、その画像内に含まれるキーワードを識別表示す
る表示手段と、を有するものである。
【0007】また、第2の発明は、画像入力手段と、上
記画像入力手段によって入力した画像に対して、文字認
識処理を行う認識手段と、上記認識手段により認識され
た1文字ごとの文字コードとその文字の位置情報とを検
出する検出手段と、上記検出手段により検出された文字
コードと位置情報とを保存する手段と所望の画像を検索
する検索手段と、上記検索手段により検索された画像を
表示する表示手段と、上記表示手段に表示された画像中
の所望領域を指定する指定手段と、上記指定手段により
指定された領域の座標と上記保存手段に保存された位置
情報とに基づいて、指定領域内の画像に含まれる文字コ
ードを出力する出力手段と、を有するものである。
【0008】
【実施例】図1は実施例の動作の概念を表す図である。
同図において、101は画像入力部であり、原稿画像を
読み取り、ビットマップ画像を得る。102は文字画像
切り出し部であり、ビットマップ画像から、各文字の外
接矩形による切り出し処理を行う。103は102で切
り出された各々の文字画像に対して、文字認識を行う部
分であり、予め登録されている文字の特徴パラメータの
辞書テーブルと、現在の文字画像から得られた特徴パラ
メータとの比較によって、該当文字画像の文字コードを
推定する。104は103で得られた文字コードを全画
面分集めたプレーンテキストである。105は102よ
り得られる各文字画像の全体画像における位置情報と1
03の文字コードからなる位置情報付きテキストであ
る。
【0009】位置情報については図3を用いて詳しく示
す。301はビットマップ画像中の文字画像部の外接矩
形と、その座標を表す図である。ビットマップ画像の左
上を原点として、各々の文字画像の左上角部と右下角部
の座標が(x1、y1)、(x2、y2)と示される。
302は301で示した座標情報をまとめたテーブルを
示す。例えば、1つの文字について、文字コードに2バ
イト、x1、y1、x2、y2のぞれぞれに2バイトづ
つの合計10バイトを割り当てる構造としてテーブルを
構成する。この実施例ではスキャナの入力解像度を40
0DPIとして、座標情報を400DPIにおけるドッ
ト数で表す。これが図1の105の位置情報付きテキス
トデータとなる。その他にミリメートルの値などを使っ
ても良い。
【0010】図2は本実施例における電子ファイリング
装置のハードウエアの概略ブロック図である。201は
全体を制御するCPUであり、202はCPU201の
作業用のRAMである。また、図3のテーブル302も
記憶する。203は画像表示などを行うディスプレイで
ある。204は原稿を読み取るスキャナであり、205
は検索結果の画像をプリントするプリンタである。20
6は入力された画像を保存するハードディスクであり、
207は検索キーワードや指令等を入力するなどの操作
のためのキーボードであり、208は画像表示上で領域
指定などを行うポインティングデバイスである。
【0011】図4の401は、「画像」というキーワー
ドによって検索された文書の表示の例である。この例は
比較的最初に「画像」という言葉があらわれているの
で、なぜこの文書が検索されたのかがわかりやすいが、
文章の後ろのほうに「画像」という言葉があった場合な
どはわかりにくい。そこで、「画像」という言葉で検索
されたことを強調するために、402のように「画像」
という言葉の部分を反転表示を行う。
【0012】図5はこの処理の手順を示したものであ
る。501は検索キーワードの入力ステップである。検
索したいキーワードを入力する。502はプレーンテキ
スト検索ステップである。指定した検索キーワードに従
って、図1の106で示したプレーンテキストを検索す
る。もし注目文書に、検索キーワードが存在すれば、先
頭の文字から入力キーワードに対応する文字列までの文
字数が得られる。503は位置情報取得ステップであ
る。図1の107及び図3の302に示される構造の位
置情報付きテキストと、502で得られた文字列までの
文字数に基づいて、該当文字列の位置情報を得る。50
4は検索語の反転表示処理ステップである。503で得
られた位置情報にもとづき、表示画像上で、該当文字の
画像を反転処理する。この結果、図4の402のような
表示が得られる。尚、反転表示はディスプレイ203に
設けられたビデオRAMの該当矩形領域のデータを反転
(0→1、1→0)にすれば良い。
【0013】図6は表示画面において領域指定した部分
の文字の取り出しを示したものである。電子ファイリン
グシステムに蓄積されている文書から、所望の文書を検
索して表示した後、文書画像内の任意の部分のテキスト
を取り出して、ほかのアプリケーションにテキストデー
タを複写して利用することが可能となる。601は表示
している1ページの文書全体である602の破線で示し
た矩形は、ユーザがポィンティングデバイスなどで、指
定した領域を示す。領域の指定は表示されているビット
マップ画像上で行う。図7はこの手順を示したものであ
る。701は領域指定ステップである。図6で示したよ
うに指定した領域を表わす2点の座標(xal、ya
l)、(xa2、ya2)が得られる。尚、複数の領域
が指定可能である。702は図3の302で示した位置
情報付きテキストを1文字データづつ読み込むステップ
である。この実施例では1文字につき10バイトつづ読
み込む。703は終了の判断ステップである。全部の位
置情報付きテキストについて処理を終えたら706へ進
み処理を終了する。704は読み込んだ各文字が指定領
域の内部にあるかどうかを判定するステップである。領
域内であれば705の複写処理によって、文字コード部
分を予め用意したバッファへコピーする。領域外であれ
ば、なにもせずそのまま次のデータを読む。706は最
後にバッファに保持された文字コードを指定領域のテキ
ストデータとして出力ステップである。バッファに保持
されたデータはファイルに保存されたり、クリップボー
ドと呼ばれる中間的なバッファへコピーされる。
【0014】上述した実施例では、プレーンテキストと
位置情報付きテキストとを分離して保存する形態を示し
たが、分離する場合は、位置情報付きキストは、位置情
報のみでもかまわない。また、検索のためのプレーンテ
キストは上述の実施例の位置情報付きテキストから生成
できるため、位置情報付きテキストのみでもよい。その
場合は検索処理や指定領域のテキスト取り出し処理のた
びに、位置情報付きテキストの各レコードの最初の2バ
イトを取り出して、プレーンテキストを生成する。
【0015】
【発明の効果】以上説明したように、本発明によれば、
検索結果の表示画像中に検索キーワード部分を反転表示
することにより、検索された画像中に含まれるキーワー
ドを即座に見付けることができ、所望の画像であるか否
かの判断が容易になる。
【0016】さらに検索結果の画像表示画面上で指定し
た任意領域に対応するテキストデータを容易に取り出す
ことができるので、他のアプリケーションの応用を容易
に行える。
【図面の簡単な説明】
【図1】本発明の実施例に係る処理の概略の手順を示す
図である。
【図2】本発明の実施例に係るハードウエア構成を示す
図である。
【図3】本発明の実施例に係る文字の位置情報を説明す
る図である。
【図4】本発明の実施例に係る検索語の反転処理を説明
する図である。
【図5】本発明の実施例に係る検索語の反転処理の手順
を説明する図である。
【図6】本発明の実施例に係る指定領域のテキスト抽出
を説明する図である。
【図7】本発明の実施例に係る指定領域のテキスト抽出
の手順を説明する図である。
【符号の説明】
101 画像入力部 102 文字画像切り出し部 103 文字認識部 104 認識結果のプレーンテキスト 105 認識結果の位置情報付きテキスト
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/62 330 G

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 画像入力手段と、上記画像入力手段によ
    って入力した画像に対して、文字認識処理を行う認識手
    段と、上記認識手段により認識される1文字ごとの文字
    コードとその文字の位置情報とを検出する検出手段と、
    上記検出手段により検出された文字コードと位置情報と
    を保存する手段と、検索キーワードを入力するキーワー
    ド入力手段と、上記キーワード入力手段により入力され
    たキーワードを画像中に有する画像を検索する検索手段
    と、 上記検索手段により検索された画像及び、その画像内に
    含まれるキーワードを識別表示する表示手段と、を有す
    ることを特徴とする電子ファイリング装置。
  2. 【請求項2】 画像入力手段と、上記画像入力手段によ
    って入力した画像に対して、文字認識処理を行う認識手
    段と、上記認識手段により認識される1文字ごとの文字
    コードとその文字の位置情報とを検出する検出手段と、
    上記検出手段により検出された文字コードと位置情報と
    を保存する手段と、所望の画像を検索する検索手段と、
    上記検索手段により検索された画像を表示する表示手段
    と、上記表示手段に表示された画像中の所望領域を指定
    する指定手段と、上記指定手段により指定された領域の
    座標と上記保存手段に保存された位置情報とに基づい
    て、指定領域内の画像に含まれる文字コードを出力する
    出力手段と、を有することを特徴とする電子ファイリン
    グ装置。
JP6322399A 1994-12-26 1994-12-26 電子ファイリング装置 Pending JPH08180068A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6322399A JPH08180068A (ja) 1994-12-26 1994-12-26 電子ファイリング装置
US08/576,455 US5854860A (en) 1994-12-26 1995-12-21 Image filing apparatus having a character recognition function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6322399A JPH08180068A (ja) 1994-12-26 1994-12-26 電子ファイリング装置

Publications (1)

Publication Number Publication Date
JPH08180068A true JPH08180068A (ja) 1996-07-12

Family

ID=18143236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6322399A Pending JPH08180068A (ja) 1994-12-26 1994-12-26 電子ファイリング装置

Country Status (2)

Country Link
US (1) US5854860A (ja)
JP (1) JPH08180068A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120201A (ja) * 1997-10-16 1999-04-30 Bunsei Shoin:Kk 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JP2006255997A (ja) * 2005-03-16 2006-09-28 Kobayashi Kirokushi Co Ltd スキャナ内蔵プリンタおよびデータ保存システム
JP2011159251A (ja) * 2010-02-04 2011-08-18 Toppan Printing Co Ltd 電子チラシ情報検索装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4747828B2 (ja) * 2005-12-21 2011-08-17 富士ゼロックス株式会社 履歴管理装置
JP2009157482A (ja) * 2007-12-25 2009-07-16 Kyocera Corp 文書編集装置及び文書編集方法
JP6525537B2 (ja) 2014-09-30 2019-06-05 キヤノン株式会社 画像処理装置及びその制御方法、プログラム、記憶媒体
JP6491581B2 (ja) 2015-10-06 2019-03-27 キヤノン株式会社 画像処理装置およびその制御方法ならびにプログラム
DE102017103394A1 (de) 2017-02-20 2018-08-23 amagno GmbH & Co. KG Verfahren zum computergestützten Verarbeiten von Dokumenten

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60136877A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd 画像入力装置
JPH03260768A (ja) * 1990-03-09 1991-11-20 Fuji Electric Co Ltd キーワード強調表示装置
JPH03276260A (ja) * 1990-03-24 1991-12-06 Ricoh Co Ltd 文字コードのタイトル処理機能を備えた電子フアイリング装置
JPH06282588A (ja) * 1992-11-02 1994-10-07 Motorola Inc フルテキスト索引の生成、調査、検索および表示方法
EP0625757A1 (en) * 1993-05-07 1994-11-23 Canon Kabushiki Kaisha Selective document retrieval method and system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265242A (en) * 1985-08-23 1993-11-23 Hiromichi Fujisawa Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates
US5165103A (en) * 1986-09-12 1992-11-17 Hitachi, Ltd. Image data processing method for selective partial image storage
US5099340A (en) * 1989-05-15 1992-03-24 Sharp Kabushiki Kaisha Electronic filing apparatus
DE69130546T2 (de) * 1990-05-15 1999-05-12 Canon Kk Verfahren und Gerät zur Bildverarbeitung
US5371807A (en) * 1992-03-20 1994-12-06 Digital Equipment Corporation Method and apparatus for text classification
JP3220886B2 (ja) * 1993-06-23 2001-10-22 株式会社日立製作所 文書検索方法および装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60136877A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd 画像入力装置
JPH03260768A (ja) * 1990-03-09 1991-11-20 Fuji Electric Co Ltd キーワード強調表示装置
JPH03276260A (ja) * 1990-03-24 1991-12-06 Ricoh Co Ltd 文字コードのタイトル処理機能を備えた電子フアイリング装置
JPH06282588A (ja) * 1992-11-02 1994-10-07 Motorola Inc フルテキスト索引の生成、調査、検索および表示方法
EP0625757A1 (en) * 1993-05-07 1994-11-23 Canon Kabushiki Kaisha Selective document retrieval method and system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120201A (ja) * 1997-10-16 1999-04-30 Bunsei Shoin:Kk 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JP2006255997A (ja) * 2005-03-16 2006-09-28 Kobayashi Kirokushi Co Ltd スキャナ内蔵プリンタおよびデータ保存システム
JP2011159251A (ja) * 2010-02-04 2011-08-18 Toppan Printing Co Ltd 電子チラシ情報検索装置

Also Published As

Publication number Publication date
US5854860A (en) 1998-12-29

Similar Documents

Publication Publication Date Title
JP3289968B2 (ja) 電子的文書処理のための装置および方法
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
JP3232144B2 (ja) 文章中の単語文節の出現頻度を求めるための装置
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
US5987448A (en) Methodology for displaying search results using character recognition
JP4271878B2 (ja) 映像中の文字検索方法及び装置並びに文字検索処理プログラム
JP2713622B2 (ja) 表形式文書読取装置
JPH05282488A (ja) 文書画像の復号なしに文書の意味的に重要な部分の自動変更のための方法
JPH08180068A (ja) 電子ファイリング装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH05303619A (ja) 電子スクラップブック
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JP4480109B2 (ja) 画像管理装置および画像管理方法
JP2559356B2 (ja) 文書画像処理方法
JP2000259847A (ja) 情報検索方法、装置および記録媒体
JPH06274551A (ja) 画像ファイリング装置
JPH0757040A (ja) Ocr付きファイリング装置
JP2904849B2 (ja) 文字認識装置
JPH09204511A (ja) ファイリング装置
JPH07152856A (ja) 光学的文字読取装置
JP3424942B2 (ja) 対訳画像形成装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JPH04302070A (ja) 文字認識装置及び方法
JP3243389B2 (ja) 文書識別方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040302