JPS63223964A - 検索装置 - Google Patents

検索装置

Info

Publication number
JPS63223964A
JPS63223964A JP62058313A JP5831387A JPS63223964A JP S63223964 A JPS63223964 A JP S63223964A JP 62058313 A JP62058313 A JP 62058313A JP 5831387 A JP5831387 A JP 5831387A JP S63223964 A JPS63223964 A JP S63223964A
Authority
JP
Japan
Prior art keywords
image
page
document
contents
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62058313A
Other languages
English (en)
Inventor
Yuzuru Tanaka
譲 田中
Kinya Takahashi
欣也 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62058313A priority Critical patent/JPS63223964A/ja
Priority to US07/165,498 priority patent/US4907283A/en
Publication of JPS63223964A publication Critical patent/JPS63223964A/ja
Priority to US08/296,937 priority patent/US5754712A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像として保存される文書の検索をする検索
装置に関する。
〔従来の技術〕
従来、文書を画像として入力し保存しておく電子ファイ
リング装置がある。
しかしながら、上記従来例では、利用者が参照したい頁
を直ちに開いて表示することができず、初めの頁から順
に内容を確認しながら目的の頁を捜さなければならなか
った。1つの文書に頁が多数ある場合には捜し出すのに
非常に時間を浪費するという欠点があった。
〔問題点を解決するための手段(及び作用)〕本発明に
よれば、文書画像から文書内容を分類している項目を抽
出し保持しておき、かつ、抽出した項目と項目に対する
詳細な内容が記述されている本文とを対応付ける手段を
設けることにより、項目だけを表示し、項目を画面上で
、座標値により選択すれば、該当する本文を検索し、表
示することを可能にしたものである。
文書において目次や索引の頁画像から各項目領域とその
内容が記載されている本文掲載ページを認識し、テーブ
ルに保持しておくことにより、目次や索引ページの画像
をディスプレイに表示し、座標指示器により参照したい
項目を画面上で指定すれば、対応する本文を表示するよ
うにしたもめである。
新聞において、紙面から見出し部分を抽出する手段を設
けることにより、見出し画像のみをディスプレイに表示
し、座標指示器により参照したい見出しを画面上で指定
すれば、対応する記事本文を表示するようにしたもので
ある。
〔実施例1〕 第2図は本実施例に用いられる文書の一例を示すもので
ある。通常、書物等、頁数のある文書には目次頁201
と複数枚の本文202がある。目次頁201には、項目
と共にその右端部に項目の内容が書かれている本文の頁
が数字で印字されている。本実施例では、画像として取
り入れた文書の目次画像をディスプレイに表示し、利用
者が参照したい本文の項目を座標指示器により画面上で
指定することにより、目的とする本文を表示する装置を
提供するものである。
第1図は本実施例の構成図である。101は画像読取装
置であり、得られた電気信号は、0又はルベルの2値信
号に変換された後制御装置102に印加される。制御装
置102はRAM103とプログラムを格納するROM
104とCPU105を有す。106は読み取った文書
画像を一頁分を保存する画像メモリ、107は目次画像
を保存する検索用画像メモリ、108は読み取った文書
全ページを保存しておく文書画像記憶装置、109は操
作スイッチ150〜157を有す操作部、110は文書
画像を表示する表示装置、112は目次画像から各文字
を切り出す文字切り出し装置、114は切り出された文
字領域の座標値を保持する位置情報バッファ、113は
数字画像パターンを認識する数字認識装置、111はマ
ウスであり、表示装置110の表示画面上を指示するこ
とにより表示画面上の位置を得ることができるものであ
る。マウスの他にライトペンでもよい。
115.116は主要なレジスタである。
本装置の処理は文書画像を入力する入力部と文書画像を
表示する表示部に分けられる。入力部及び表示部は別の
プログラムでスイッチ5IN150により切り換える。
スイッチ5IN150がOnのとき入力部、offのと
き表示部、のプログラムが起動するとする。
〔文書入力部制御プログラム〕
第3r1!Jはスイッチ5IN150がon時に起動す
るプログラムの制御フローである。まずステップ530
0では、レジスタ116と115の値TYPEとPAG
EをOに初期化する。次にステップ5301でスイッチ
STNMoffであるなら本プログラムを終了し、表示
部プログラムを起動する。SINがonならばステップ
8302〜5304ではスイッチ5O152,5115
3、52154がonになっているかを判定し、onに
なっていたらonのスイッチに対応する値を5305〜
5307で設定する。スイッチSo、Sl、S2は画像
読取装置101で読み込まれる原稿の種類を指定するも
のであり、読み取る原稿が本文の場合にはスイッチSO
を、目次の場合にはスイッチS1を、本文でも目次でも
ない例えば表紙のような頁を入力する場合にはスイッチ
S2を利用者がOnにする。本文、目次、その他に応じ
てTYPEの値は各々0,1゜2になる。
次にステップ8308ではスイッチSRがonになって
いるかを判定する。スイッチSRは画像読取装置101
の起動を指示するスイッチである。スイッチSRがOn
の時はステップ5309にて画像読取装置101を起動
し、予めセットしておいた原稿の一頁分の画像データを
制御装置102へ転送し、ついで、その画像データを画
像メモリ106へ格納する。次ニステップ5310.3
311 ′cTYPEが0かlに応じてステップ531
2,5313の処理を行う。
TYPEが1、即ち読み取った原稿画像が目次の場合に
は、5312で目次画像から項目の領域とその右端部に
ある数字を認識する。(詳細は後述)TYPEがO9即
ち、本文の場合には、PAGEを1インクリメントしT
YPEが2のときは何もせずにステツブ5314へ移る
ステップ5314では画像メモリの内容を本文か目次か
その他かを区別する識別番号とページを記載したヘッダ
部と共に外部記憶装置である文書画像記憶装置lO8に
記録する。
第4図は、文書画像記憶装置108に記録される一頁分
のデータ形式の一例であり、401は画像データ部、4
02はヘッダ一部の識別番号部で本文、目次、その他を
区別する。識別番号はTYPEを用いる。403は本文
ページ部であり、レジスタ115の値PAGEを格納す
る。本文以外の場合には何も格納しない。
以上の操作を文書の初めの頁から最終頁まで、−頁づつ
画像読取装置にセットしながら繰り返すことにより、文
書を画像データとして保存するものである。
ステップ5312を説明する。
ステップ5312では、まず、文字切り出し装置112
を起動し、画像メモリ106に格納されている目次画像
から文字領域を抽出する。第5図は、文字切り出し装置
の挙動の説明図である。501〜503及び505〜5
06は画像メモリ106に格納されている文字パターン
のうち項目の文字であり504及び507〜508はペ
ージを示す文字である。目次画像全体をy軸に射影する
とヒストグラム510が得られ、連続して度数の存在す
る部分が文字行を表している。各度数存在部分の上端Y
Ti (i>1)及び下端YBiを求めた後、YTiと
YBiではさまれる文字行画像をX軸に射影すると、各
文字パターンの左端座標XSj、XEj (j≧1)を
求めることができる(不図示)。こうして得られた文字
パターン領域は、位置情報バッファ114に格納する。
第6図は位置情報バッファ114の内容を示す図であり
、各文字の領域座標値YSj、YEj、XSj、XEj
 (1行におけるX方向の位置)を格納する。YSj、
YEjは文字jが存在する行のYT、YBの値である。
データの最後部にはデータ終了記号“END”を格納す
る。
“END”には例えば−1等を使用する。欄601は文
字番号欄である。
〔項目テーブル作成プログラム〕
次に制御装置102は位置情報バッファ114に格納さ
れているデータのうちページを示す文字を認識し、項目
テーブル117に格納する。第7図はその制御フローで
ある。
まずステップ5701で位置情報バッファ114の文字
番号を示す値jを1に設寓し、項目テーブル1’17の
項目番号を示す値kを1に設定し、数字バッファ750
の格納場所を示すレジスタ751の値PNを数字バッフ
ァ750の先頭を指し示すように設定する。
数字バッファ750はRAM103上に割り当て、レジ
スタ751はCPU内のレジスタを使う。kやjの値も
CPU内のレジスタを使うこととする。(特に図で明記
していない) 次にステップ5702にて位置情報バッファ114にお
いて文字番号jのデータが終了を表すENQであるかを
判定し、そうであるならば、本プログラムを終了する。
そうでなければ、文字番号jの左端X座標XSjが設定
値PXより大きいかどうかを判定する。PXは目次画像
において項目部とその右端にあるページ部の境界となる
X座標値で予め適当な値を設定しておく。また文書によ
って境界の座標値が異る事も考えられるので、目次画像
入力時に目次画像をディスプレイに表示し、項目とペー
ジの境界をマウス等で指示することによりPXの値を設
定するようにしてもよい。
5703でXSj>PXが成立しない場合、即ち、文字
jが項目の文字である場合には、ステップ5710でj
をインクリメントし5702へ移行し、次の文字の判定
に移る。5703でXSj>PXが成立する場合、即ち
、文字jがページ部の数字である場合には、ステップ5
704で文字jの認識を数字認識装置113−で行う。
数字認識装置113は位置情報バッファ114内17)
 YSj、YEj、XSj、XEj テ示されル画像メ
モリ106内の領域にある画像パターンの文字認識を行
い、ASCCII等の文字コードをCPU105へ送る
ものであり、従来の数字認識装置を用いることができる
。ステップ5705では認識結果である文字コードを数
字バッファ750のPNが指し示す場所へ格納し、57
07ではPNが次の数字バッファ格納位置を示すように
PNをインクリメントする。ステップ5707では、文
字jが文字行最後の文字であるかどうかをYSj+lと
YSjを比べることにより判定し、もし、文字jの右側
に未だ文字がある場合にはステップ5710へ、文字j
が文字行最後の文字の場合は、ステップ5708で項目
テーブルの項目番号にの格納域へデータを格納する。項
目テーブル・117は項目番号欄118、項目上端部y
座標欄119、項目下端部y座標欄、ページ欄からなる
。上端部y座標YSk及び下端部y座標YEkは位置情
報バッファ114におけるYSj、YEjと同じ値であ
る。またPkは数字バッファ750の先頭からPNが指
し示す1つ手前までの文字コード列が表す数字を整数値
に変換した値である。
ステップ5710では項目番号kをインクリメントし、
ステップ5709ではPNをそれが数字バッファの先頭
を指し示すようにクリアする。以上の処理の後、ステッ
プ5710へ移行する。ステップ5702で位置情報バ
ッファにデータが無いと判定された場合は、本プログラ
ムを終了し、項目テーブルのデータの最後部に位置情報
バッファの場合と同様にENDを格納し、ステップ53
12を終了する。
〔文書検索出力プログラム〕
第8図はスイッチ5IN150がoff時に起動する表
示部プログラムの制御フローである。
まず5801では文書画像記憶装置108においてファ
イルをアクセスするファイルポインタ等の初期設定する
。5802ではスイッチSINがoffになっているか
を判定し、offならば本プログラムを終了し、入力部
プログラムを起動する。SINがOn状態ならば580
3〜5805でスイッチSl、SB、SFのon、of
fを判定し、どれもonになっていなければ5802へ
戻り繰り返す。スイッチSlがonの場合は、まず38
06で目次を表示装置110に表示する。目次は文書画
像記憶装置108における文書ファイルの最初の頁から
順に第4図に示したようなヘッダ一部の識別番号番読み
出し番号が1、即ち目次画像が保存されているページを
捜し出し、その画像データを検索用画像メモリ107に
転送した上で検索用画像メモリ107の内容を表示装置
110へ表示するものである。次に3807で項目指定
を行・う。
第9図は8806での処理により写しだされる表示画面
の一例を示している。902はカーソルで表示画面内を
マウス111を動かすことにより移動することができる
ものである。制御装置102はカーソルの座標値を監視
し、座標値が、項目テーブル117における上端部y座
標YSk、下端部y座標YEkの間にはさまれるような
項目番号kを捜し、そのような項目があったならば項目
番号をCPU内の空レジスタへ格納し、YSk、YEk
ではさまれる表示画面上の領域を白黒反転等により、他
と区別かっ(ように表示する。901は白黒反転部の一
例である。利用者は目次を見て、参照したい項目にカー
ソルを移動し、スイッチ5S157をonすることによ
り項目を選択する。スイッチSSがonになった時点で
CPU内のレジスタに格納されている項目番号kにおけ
るページ欄121の値Pkをレジスタ115に設定する
。5808ではレジスタ115の値PAGEと一致する
頁を文書画像記憶装ff1108における文書ファイル
の各ヘッダ一部の本文ページ部を読み取り比較すること
により捜し出し、その頁の画像データを画像メモリ10
6に転送する。5809では画像メモリ106に格納さ
れている本文の画像を表示装置110で表示し、580
2へ戻る。
ステップ5804でスイッチ5B155がonの場合に
は、5810にてレジスタ115の値PAGEをデクリ
メントし、PAGEと一致するページを文書ファイルか
ら捜し出し画像メモリ106に転送し、その内容を表示
装置110で表示する。尚、PAGEが1の場合は、デ
クリメントせず直ちに5810を終了し5802へ戻る
。同様にステップ5805でスイッチ5F156がon
の場合はPAGEをインクリメントし、その値に一致す
る頁の本文画像を表示する。
尚第8図で示す処理フローでは、表紙頁などを表示でき
な(なっているが、各員の画像ファイルには識別番号2
として保存されているので、識別番号2の頁を表示する
スイッチを設ければファイルから捜し出し表示すること
が可能である。
また本実施例では目次頁は1頁しかないとしているが、
文書入力におけるプログラムにおいてPAGE・と同様
の機能を有す目次用ページレジスタを設け、目次頁を入
力するたびにインクリメントし、項目テーブルには新た
に目次用ページ欄を設は項目データ格納時には目次のペ
ージをも格納するようにし、文書表示時には、スイッチ
SB、SFと同様のスイッチを設けて、目次の他のペー
ジを表示できるようにし、かつ項目指定時には現在表示
している目次ページと選ばれた項目の座標値により本文
のページを得るようにすれば、複数頁の目次があっても
対処できる。
また項目テーブルも文書画像同様、外部記憶装置に保存
してもよい。
以上説明したように、百次頁を有し、かつ本文が多くの
頁を有するような文書を画像としてファイリングしてお
く場合、目次頁画像の各項目領域とそこに書かれている
本文掲載ページを認識し、保持する手段を設けることに
より、利用者は目次画像を見て興味のある項目を画面上
で指示するだけで、その項目に対応する本文の頁を直ち
にディスプレイ上で見ることができ、かつその周辺の頁
も参照することができるため、多数頁の文書の利用者の
意図する。特定部分だけを参照したい場合に非常に効率
的になる。
〔実施例2〕 第10図は本実施例に用いられる文書の一例であり、目
次頁の他に本文中に書かれている主要な事項を例えば、
50音順に並べて、それが記載されている本文のページ
を記した索引頁1001を含む場合である。
本実施例では、実施例1において目次頁画像をディスプ
レイに表示し、その項目を画面上で指示し、本文の頁を
取り出したのと同様に、索引頁もディスプレイに表示し
、画面上で特定の事項を指示することによりその事項が
掲載されている末文を取り出し表示するものである。
〔文書入力部制御プログラム〕
第11図は本実施例における文書入力部の処理フローで
ある。実施例1における第3図に加え新たに51101
〜51104を付加する。本実施例では操作部109に
新たに83なるスイッチを設け、索引頁を・入力する時
にはS3をonにする。5IIOIでスイッチS3がo
nと判定された場合には、レジスタ116の値TYPE
を3に設定する。51103ではTYPEが3である。
即ち索引頁であると判定された場合には51104で索
引に書かれている各事項の領域とページの認識をし、こ
れらの情報をRAMに保存する。
51104の処理は、実施例1における第7図の処理と
同様である。ただし、8708で項目情報を項目テーブ
ル117に格納しているが、本実施例では項目テーブル
の他に事項テーブルをRAM103に設け、そこで抽出
した各事項のページと本文掲載ページを格納する。本実
施例においても、事項とページの境界となる座標値PX
は予め適当な値を設定してもよいし、索引頁入力時に索
引画像をディスプレイに表示し、境界を利用者がマウス
などで指示することにより設定してもよい。
さらに数字認識装置113が数字以外の文字をリジェク
トするような機構が備わっているならば、索引頁の各行
で切り出されたすべての文字パターンを数字認識装置の
対象とし、数字と認識された文字のうち連続した最右端
の文字列を本文掲載ページとする方法にしてもよい。
〔文書検索出力プログラム〕
第12図は本実施例における文書表示部の処理フローで
あり、実施例1における第8図に加え、新たにS 12
01−81203の処理を設ける。本実施例において、
索引を見て本文を開きたい場合には利用者はスイッチS
3をonにする。S 1201ではスイッチS3がon
かどうかを判定し、onならば51201で索引頁をデ
ィスプレイに表示する。これは5806の目次表示と同
様に、画像ファイルのヘッダ一部 −における識別番号
を読み出し、それが“3”、即ち索引頁である頁を捜し
出し、その頁の画像データを検索用画像メモリ107に
転送し、その内容をディスプレイに表示するものである
。次にS l 203では利用者が、マウスを使って事
項を選択する。この処理は5807で使用する項目テー
ブルの代わりに事項テーブルを使用する以外5807と
同様である。
以上説明したように文書における目次頁の他に索引頁も
本文表示のための指示手段とすることにより、本文の特
定頁を選択する方法が多様化でき、より利用者の意図に
あった頁を参照することができる。
〔実施例3〕 第13図は本実施例で用いる複数ページから成る地図の
例である。このような地図では地図に掲載されている全
地域の地形や道路を描いた目次に相当する頁taoiが
ある。目次頁1301の地図は分割され、分割された各
領域には詳細な地図が掲載されているページが印刷され
ている。1302は分割された各地域の詳細な地図が載
っている頁である。
地図の入力は実施例1における第3図に従って処理を行
う。5312では目次頁1301に、おける各分割領域
の抽出と領域内に記載されたページの認識をし、RAM
上に保持する。本実施例においては目次画像は文字列で
はないので、文字切り出し装置は起動せず、目次画像入
力時に目次画像をディスプレイ画面に表示し、分割され
ている各領域の境界をマウス等で指定することにより、
分割領域の座標値を設定する。
尚、座標値の設定は地図に描かれている境界と厳密に一
致していなくともよ(、地図の区分領域と指定する領域
が、だいたい合っていればよい。例えば、地図に描かれ
ている境界が曲線になっていても、近似的な矩形領域と
して指定しても何ら問題はない。
第14図はRAM上に保持する地図テーブル1401で
あり、実施例1における項目テーブル117に相当する
ものである。1402は分割領域番号欄、1403は分
割領域左端X座標欄、同様に1404は左端X座標欄、
1405.1406は上端、下端のy座標欄であり、上
記マウス等で指定した座標値を格納する。また1407
は分割領域の詳細な地図が掲載されているページを格納
するページ格納欄である。ページは1つの分割領域の座
糠値を設定しXR31,XREi。
YR5i、YREiを格納した後、さらにページが印字
されている文字領域をマウス等で指定し、その画像パタ
ーンを数字認識装置に印加することにより得る。
地図テーブルを生成し、地図面像を保存した後の処理は
実施例1と同様であるので説明を省略する。
尚本実施例では、目次画像の分割領域とページが記載さ
れている領域を利用者が指示することにより得ているが
、カラーの地図の場合目次における境界線やページは他
とは異る色で印刷されていることがあるので、画像読取
装置に光学的なフィルターをつけ、境界線やページに対
応する色だけのパターンを入力し、線認識や文字認識を
して自動的に境界やページを抽出することができる。
以上説明したように、文字の書かれた文書だけでな(多
数頁の地図において、全体の地図を示す目次頁をディス
プレイに表示し、参照したい地区を画面上で指示するこ
とにより目的とする地区の詳細な地図を画像ファイルか
ら読み出し表示することができる。
〔実施例4〕 第15図は本実施例に用いる新聞の一例であり、やはり
複数の頁から成るが、新聞の場合、実施例1.2の一般
文書に比べ、頁数が少ないため、ある特定の記事を見つ
けるために1頁1頁順次画像ファイルから内容を読み出
し、ディスプレイに表示しながら捜し出すのは、さほど
手間のかかる作業ではない。しかしながら新聞の場合、
紙面が太き(現状のディスプレイでは一頁全体を内容が
読める程度に表示することができず、画面をスクロール
しながら紙面を読み取らなければならないため実質上頁
数が多い時とかわらない。従って目的とする記事を見つ
けるまで関係のない記事の部分を参照しなければならず
、作業効率がわるい。
本実施例では新聞に備わる見出し領域1501〜150
5を抽出し、座標値をRAM上のテーブルに保持してお
き、見出し部のみを読み取れる程度に縮小表示し、参照
したい記事の見出しがあったら画面上でその見出しをマ
ウス等で指定することにより、選択した見出しに対応す
る本文記事を読み取れる大きさで表示するものである。
本実施例では実施例1における文字切り出し装置112
の代わりに見出し抽出装置を設ける見出し抽自装置は、
文字切り出し装置と同様に画像のy軸べの射影、X軸の
射影を基本とする。y軸の射影とX軸の射影をもうそれ
以上小さな矩形領域に分割できなくなるまで繰り返す。
こうして得られた矩形領域の大きさは見出しの文字と本
文の文字では明らかに異なり、見出しの文字を大きさの
比較から抽出できる。こうして得た見出し文字のうち近
接する文字をすべて含むような矩形領域を見出し領域と
する。
以下に処理の手順を説明する。
まず、レジスタ115の値をIにセットし、新聞紙面の
第1ページを画像読取装置101にセットし、スイッチ
5R151をonにする。新聞の紙面が読み取られ画像
メモリ106に格納される。
次に見出し切り出し装置を起動し、見出し領域を切り出
し、RAM上のテーブルに各見出し領域の座標値を格納
する。テーブルは実施例4におけるテーブル1401と
同じ形式のものを設ける。ページ欄には、レジスタ11
5の値PAGE (現段階で1である。)を格納する。
次に画像メモリの画像データをヘッダ一部と共に文書画
像記憶装置lO8に格納する。保存形式は第4図と同じ
であり、識別番号部402は本実施例では用いないので
、何も格納せず、ページ部403にはレジスタ115の
値PAGEを書き込む。ファイルに格納後、PAGEを
インクリメントし、次の頁の入力を行う。以上を繰り返
すことにより全頁紙面の画像ファイリングをする。
次に表示部を説明する。
まずRAM上のテーブルに格納されている見出し情報を
参照し、ファイルから見出し領域の画像データを適当に
縮少し、各見出しを適当な位置に配置して検索用画像メ
モリ107に格納する。そうした後検索用画像メモリ1
07の内容を表示装置110で表示する。
第16図は見出しの表示例である。画像を縮少している
ので、表示画面には複数の頁の見出しを一度に表示する
ことがで舎る。(点線は各画の区切りを表す。)利用者
は表示画面の見出しを見て参照したい見出しを画面上で
マウス等で指定する。見出しが選択されたら、その見出
し番号におけるRAM上のテーブルを参照し、ページ欄
に格納されてい゛るベージの紙面画像をファイルから捜
し出し、画像メモリ106に転送する。そして表示装置
には選択された見出し領域の近傍の画像データのみを表
示する。第17図はその表示例であり、1701は選択
された見出し領域1502が横長の場合の表示例であり
、見出しの下側を表示し、1702は見出し1503が
縦長の場合であり、見出しの左側を表示したものである
。横長、縦長の区別は見出し領域の座標値の比較により
容易に自動的に行うことができる。
また、新聞の構造を解析する手段を設け、見出しに対応
する本文の記事領域を自動的に抽出しておいて表示して
もよい。
以上説明したように頁数が多(ないが、紙面が大きい新
聞のような文書を画像ファイリングする場合、見出し部
を抽出し、その領域の座標を保持しておき見出し部をま
とめて表示し、画面上で本文を参照したい見出しをマウ
ス等で指定することにより、目的と子る本文のみを表示
することができる。
実施例1〜4は、1つの文書内の目次から特定の本文を
捜し出す手段であるが、多数の文書を画像ファイルする
場合にも本装置の機能を適用する事が可能である。多数
の文書から特定の文書を捜し出す場合には、例えば文書
に備わる表紙頁などその文書の題名が記述されている頁
を他の頁と区別して入力し、入力する際に文字切り出し
装置を使って文字を切り出し文書名領域を抽出しておき
、文書検索時には、各文書名画像をまとめて表示画面に
表示し、座標指示装置により画面上で選択することによ
り、特定の文書を選択し得るものである。
上記のようにして文書を選択した後、さらに実施例1〜
4に示したように文書内の特定頁を目次画像を用いて捜
し出すという手順が可能である。このように本発明を階
層的に用いることにより、文書を画像として入力する際
に特に検索のためのキーワード等をキーボードを使って
入力しなくても大量の文書画像から利用者の参照したい
内容を煩わしい操作をすることなく検索し利用者に提供
できる。
また、文書名や目次の項目等は文字の切り出し後、文字
認識装置を使用し、文字認識して文字コードとして保持
しておいてもよい。このようにすると予め、検索対象と
なる文書名等を利用者が知っている場合には、検索用の
画面を表示しなくてもキーボードから検索対象名をタイ
プすることにより、目的のものを得ることができる。
また上記のように文字認識により、文書名や目次の項目
の各文字をASCIIやJIS等の標準文字コードに変
換するのではな(、単純な画像処理により文字パターン
を分類し、各文字を数ビットの縮退化されたコード(縮
退コード@)として保存しておき、縮退コード列のマツ
チングにより検索してもよい。
〔効 果〕
以上説明したように、文書(地図)内容を分類、要約し
ているような項目を文書画像から抽出し保持しておくこ
とにより、文書の特定部分のみを参照したい場合に、デ
ィスプレイ上に表示された項目を見て、捜し、項目を画
面上で指し示すだけで、目的とする本文のみを選び出し
表示することができるという効果がある。
【図面の簡単な説明】
第1図は構成ブロック図、 第2図は文書例(実施例1)を示す図、第3図は文書入
力部制御フロー(1)チャート、第4図は文書ファイル
形式を示す図、 第5図は文字切り出し説明図、 第6図は位置情報バッファを示す図、 第7図は項目テーブル生成フローチャート、第8図は文
書検索出力フロー(1)チャート、第9図は表示画面例
を示す図、 第10図は文書例(実施例2)を示す図、第11図は文
書入力部制御フロー(2)チャート、第12図は文書検
索出力フロー(2)チャート、第13図は文書例(実施
例3)を示す図、第14図は地図テーブル(3)を示す
図、第15図は文書例(実施例4)を示す図、第16図
は検索用表示画面例(4)を示す図、第17図は表示画
面例(4)を示す図。 101・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・画像読取装置102・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・制御
装置108・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・文書
画像記憶装置110・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・表示装置10
6・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・画像メモリ107・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・検索用画像メモリ111・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・座標指示装置
112・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・文字切り
出し装置113・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・数字認識装置109・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・操作部117・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・・・テーブ
ル下L4−(2) 富(!7囚 第12区 〒13区 昭15図 第1’l閃

Claims (3)

    【特許請求の範囲】
  1. (1)画像情報を入力する入力手段、 上記入力手段によって入力された保存すべき画像情報を
    分類、要約している領域を抽出する抽出手段、 上記抽出手段によって抽出された領域内の各画像情報を
    指示する情報を認識する認識手段、上記認識手段によっ
    て認識された情報の少なくとも1つを特定することによ
    り、対応する画像情報を検索し、出力する出力手段、 とを有したことを特徴とする検索装置。
  2. (2)上記各画像情報を指示する情報は、上記画像情報
    が掲載されるページ数であることを特徴とする特許請求
    の範囲第1項記載の検索装置。
  3. (3)上記各画像情報を指示する情報は、新聞画像中の
    見出し部であることを特徴とする特許請求の範囲第1項
    記載の検索装置。
JP62058313A 1987-03-13 1987-03-13 検索装置 Pending JPS63223964A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62058313A JPS63223964A (ja) 1987-03-13 1987-03-13 検索装置
US07/165,498 US4907283A (en) 1987-03-13 1988-03-08 Image processing apparatus
US08/296,937 US5754712A (en) 1987-03-13 1994-08-29 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62058313A JPS63223964A (ja) 1987-03-13 1987-03-13 検索装置

Publications (1)

Publication Number Publication Date
JPS63223964A true JPS63223964A (ja) 1988-09-19

Family

ID=13080763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62058313A Pending JPS63223964A (ja) 1987-03-13 1987-03-13 検索装置

Country Status (1)

Country Link
JP (1) JPS63223964A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242142A (ja) * 1991-11-19 1993-09-21 Xerox Corp 文書画像の復号なしに文書を要約するための方法
JP2013157019A (ja) * 1999-09-22 2013-08-15 Masanobu Kujirada 捜索システム及び方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5622225A (en) * 1979-07-31 1981-03-02 Toshiba Corp Information storing method for optical disk
JPS5975475A (ja) * 1982-10-21 1984-04-28 Toshiba Corp 画像情報記憶検索装置
JPS6017566A (ja) * 1983-07-08 1985-01-29 Ricoh Co Ltd 画像記憶検索装置
JPS6126150A (ja) * 1984-07-17 1986-02-05 Nec Corp 文書画像フアイル登録検索装置
JPS6243777A (ja) * 1985-08-21 1987-02-25 Hitachi Ltd 情報記憶装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5622225A (en) * 1979-07-31 1981-03-02 Toshiba Corp Information storing method for optical disk
JPS5975475A (ja) * 1982-10-21 1984-04-28 Toshiba Corp 画像情報記憶検索装置
JPS6017566A (ja) * 1983-07-08 1985-01-29 Ricoh Co Ltd 画像記憶検索装置
JPS6126150A (ja) * 1984-07-17 1986-02-05 Nec Corp 文書画像フアイル登録検索装置
JPS6243777A (ja) * 1985-08-21 1987-02-25 Hitachi Ltd 情報記憶装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242142A (ja) * 1991-11-19 1993-09-21 Xerox Corp 文書画像の復号なしに文書を要約するための方法
JP2013157019A (ja) * 1999-09-22 2013-08-15 Masanobu Kujirada 捜索システム及び方法

Similar Documents

Publication Publication Date Title
JP4098880B2 (ja) 情報検索装置
US5860075A (en) Document data filing apparatus for generating visual attribute values of document data to be filed
Arai et al. PaperLink: a technique for hyperlinking from real paper to electronic content
EP0791883B1 (en) Document search and retrieval system with partial match searching of user-drawn annotations
US5754712A (en) Image processing apparatus
JP3425408B2 (ja) 文書読取装置
US6766494B1 (en) Method and system for creating ad-hoc links from free-form ink
JP5376795B2 (ja) 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
US6389435B1 (en) Method and system for copying a freeform digital ink mark on an object to a related object
JPH07200786A (ja) ファイリング装置
JP2010072842A (ja) 画像処理装置および画像処理方法
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
US5644339A (en) Electronic information apparatus
JP2006065477A (ja) 文字認識装置
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
EP0519713B1 (en) Character input method and apparatus
JPH08180068A (ja) 電子ファイリング装置
US5991440A (en) Method and apparatus for recognizing input handwritten characters associated with title information
JPS63223964A (ja) 検索装置
JPH0451361A (ja) 文書ファイル装置
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
US20080056620A1 (en) Document file management apparatus, document file management method and document file management program
JP2011054148A (ja) 検索装置及び方法及びプログラム