JPS60160475A - 文書フアイル検索方式 - Google Patents

文書フアイル検索方式

Info

Publication number
JPS60160475A
JPS60160475A JP59015184A JP1518484A JPS60160475A JP S60160475 A JPS60160475 A JP S60160475A JP 59015184 A JP59015184 A JP 59015184A JP 1518484 A JP1518484 A JP 1518484A JP S60160475 A JPS60160475 A JP S60160475A
Authority
JP
Japan
Prior art keywords
document
data
area
search
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59015184A
Other languages
English (en)
Inventor
Masatoshi Hino
樋野 匡利
Kuniaki Tabata
邦晃 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59015184A priority Critical patent/JPS60160475A/ja
Publication of JPS60160475A publication Critical patent/JPS60160475A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は文書ファイル検索方式に関し、特に登録時に文
書を同質のデータの存在する領域に分割し、それを文書
の構造情報として、検索時に利用するファイル検索方式
に関するものである。
〔発明の背景〕
従来より用いられている文書ファイル検索方式としては
、基本的なものに、(i)検索すべき文書名を直接指定
する方式や、(11)分類コード(大分類、中分類等)
の指定に応じて表示される候補データの中から選択する
方式がある6また、より高度な検索方式としては、(i
ti )画像の例示で画像ファイルを検索するQ P 
E (Query−by−Pictorial −Ex
ample :日経コンピュータ1982゜5.31 
pp40〜49参照)、(1v)データ内容から連想し
た色彩と対応づける方式(特開昭57−121767号
公報参照)、(V)漢字パターン列の特徴パラメータに
よる検索(電子通信学会研究会資料IE80−120p
p91〜98大田、その他「漢字パターン列の特徴パラ
メータによる検索」参照)、および(vi)部分画像や
縮小画像を案内画像として用いる方式等が知られている
以上は1機械によりファイルを検索する方法であるが、
一方、通常の人間が機械の力を惜りずに行う検索方法を
考えると、先ずその文書の内容等に応じて、それがどの
ファイル、どの書籍に存在するかを考慮し、該当するフ
ァイルや書籍を選び出す(文書ファイルではキーワード
によるおおまかな検索がこれに相当する)。次に、その
文書のどこに図があるか、あるいは絵や写真があるか等
の構造に関する情報を想像しながら、目標とする文書を
捜し出す。このような文書の構造に関する情報は、元の
文書そのものよりデータ量がきわめて少なく、かつ文書
の概略構造をディスプレイに高速に表示することが可能
であって、検索情報自体としても使用することができる
光ディスクによる文書画像ファイルの開発や、テキスト
だけでなく画像や図表を扱うことができる文書処理シス
テムの開発が進んでおり、特に文書から画像領域、テキ
スト領域、図表領域等を抽出し、各領域に適した情報圧
縮を行う方式(情報処理学会筒21口金国大会、7H−
1、村尾、坂井[文書画像における構造情報の抽出」参
照)も提案されているが、まで文書の構造に関する情報
を、検索に利用した例は見当らない。
〔発明の目的〕
本発明の目的は、文書の構造に関する情報を利用し、操
作性に優れ検索効率がよい文書ファイルの検索方式を提
供することである。
〔発明の概要〕
上記目的を達成するため、本発明の文書ファイル検索方
式は、文書データを蓄積する文書ファイルを備えたファ
イル検索システムにおいて、上記文書ファイルに文書デ
ータを蓄積するときは、テキスト、画像1図表等の同質
データを含む領域に分割して蓄積し、指定情報を入力し
て文書を検索するときは、上記指定情報に合致する文書
が複数件存在するならば1文書を構成する領域を内容に
応じた構造パターンで表示し、表示された複数の文書の
中から目的の文書を認識することに特徴がある。
〔発明の実施例〕
以下、本発明の実施例を、図面により説明する。
第2図は1本発明の原理を示す概念図であり、第2図は
文書と領域の位置関係を示す図である。
第1図において、1は文書、2は文書ファイル、3は文
書表示画面、4は構造表示画面、5は検索データ・ベー
ス、6はキーボードである。
右方に示すように、第1図の上半分は登録処理。
下半分は検索処理を表わしている。
先ず、(i)文書をファイルに登録するときには、同質
のデータ、例えばテキスト、画像等だけを含む領域に分
割して、文書ファイルに蓄積する。
このとき、文書名、検索キーワードとともに、各領域の
データ・タイプ、位置、大きさ等を、文書の構造情報と
して検索データ・ベース5に登録する。また、各領域に
対応するデータの文書ファイル中のデータ番号も登録す
る。
例えば、第1図においては、右方の文書1に示すように
、同質のデータ、すなわちX印で示すテキスト、地図等
の画像、図表等のみを含む領域に分割して、文書ファイ
ル2にそれぞれ蓄積する。
同時に、キーボード6から文書名、検索キーワードとと
もに、上記領域ごとに領域Nα、データ・タイプ、位置
、大きさ、データ番号を文書の構造情報として、検索デ
ータ・ベース5に登録する。登録するとき、文書名とキ
ーワードのみのテーブルと、その他の構造情報を記憶し
たテーブルの2種類に分けておく。
文書1と領域8の位置関係は、第2図に示すように、文
書1の左端からの距離又と上端からの距離Yで位置を、
また高さHと幅Wの寸法で大きさを表わす。また、テー
ブル中に登録されるデータ番号は、各領域8に対応する
データの文書ファイル2中の番号である。領域分割は、
計算機により自動的に行うことも、また人手により行う
ことも可能である。検索データ・ベース5は、リレーシ
ョナル・データ・ベース等のよく知られた技術で構成さ
れる。
次に(11)ファイルから目的の文書を検索するときに
は、指定された検索情報に合致する文書が複数存在すれ
ば、各文書の構造として、各領域をそのデータに応じた
パターンでディスプレイに表示する(これを構造表示画
面と呼ぶ)、ただし、検索情報から一意に決まる場合は
、該当の文書データを文書ファイルから読み出し、ディ
スプレイに表示する(これを文書表示画面と呼ぶ)。
また、構造表示画面上の指定した文書の指定領域のデー
タを、文書ファイルから読み出し文書表示画面に表示す
ることができる。また、構造表示画面上で、目的の文書
を探索し、当該文書を指定する。これにより、指定の文
書データを文書ファイルから読み出して、文書表示画面
に表示する。
なお、構造表示画面、文書表示画面は、別個のディスプ
レイを用いてもよいが、同一のディスプレイを用いて時
分割的に、あるいは画面を2分割して表示することもで
きる。なお、構造表示画面から目的の文書をパターン認
識して探索することもできる。
検索方法を、第1図により具体的に説明する。
(a)キーワードによる検索 (イ)目的文書のキーワードをキーボード6から指定す
る。(ロ)検索データ・ベース5より指定のキーワード
を持つ文書名をめる。(ハ)指定のキーワードを持つ文
書が複数個存在する場合、それらの文書の構造情報、す
なわちその文書に属する領域のデータ・タイプ、位置、
大きさをめ、そのデータ・タイプ、位置、大きさをめ、
そのデータ・タイプに応じたパターンで構造表示画面4
に表示する。第1図では、rMAPJをキーワードとし
た、3つの地図が構造表示画面4に表示されている。た
だし、文書が一意に決定される場合は、該当の文書を文
書ファイル2から読み出して、領域合成し、文書表示画
面3に表示する。
(ニ)構造表示画面4上の文書の領域を指定し、その内
容を文書表示画面3に表示することもてきるので、この
表示結果を目的文書の探索に利用できる。(ホ)構造表
示画面4上で、目的の文書をパターン認識により指定す
る。データ・ベース5より指定された文書の各領域の情
報とデータ番号をめて、文書ファイル2から読み出し、
領域合成して文書表示画面3に表示する。
(b)構造情報による検索 (イ)目的の文書情報、例えば、図が2個存在すること
、あるいは右上に画像が存在すること等を、キーボード
6から入力する。(ロ)検索データ・ベース5により、
パターン認識の結果、入力された検索情報に合致する文
書名をめる。(ハ)以下は(、)キーワードによる検索
の(ハ)以降の処理と同じである。
(c)文書名の直接指定による検索 文書名を直接指定して、目的の文書を文書表示画面3に
表示することもできる。
なお、領域分割された結果の各領域のデータは。
領域ごとに文鉄ファイル2に蓄積されるが、このとき、
データ・タイプによって圧縮や蓄線方法を変えて蓄積す
ることにより、蓄積効率を向上させることもできる。実
施例では、文書上の位置、大きさ1文書ファイルのデー
タ番号が与えられたとき、領域合成により文書表示画面
3に表示することができれば、どのような構成であって
もよい。
第3図は、本発明の一実施例を示す文書ファイル検索シ
ステムの機能ブロック図である。
第3図において、10はマイクロプロセッサ、20は主
メモリ、30はキーボード、40はファイル装置、50
は画像プロセッサ、60は画像メモリ、70は画像入力
装置、80は画像ディスプレイ、90はデータ・ベース
・システムである。
第1図に示す文書ファイル2は、ファイル装置40に存
在し、検索データ・ベース5はデータベース・システム
90上に存在する。第3図のシステムは、ファイル族w
40に文書データを蓄積し。
必要に応じて目的の画像データをファイル装置40から
読み出し、画像ディスプレイ80に表示する機能を有し
ている。そして、このシステムは、各種のコマンドの指
示によって動作し、コマンドは主メモリ20上のプログ
ラムとデータにもとづいて、マイクロプロセッサ10に
より実行される。
画像入力装置70は、例えばCOD等により画像を読み
取ってシステムに入力するためのものであり、画像プロ
せツサ50と画像メモリ60は、検索処理等のため領域
合成や、画像ディスプレイ80に構造表示画面ど文書表
示画面を出力するためのプログラムを実行する機能を有
するものである。
第4図は、本発明に用いられるコマンドとその機能の説
明図であり、第5図は、第4図のコマンドの処理フロー
チャー1−である。
5TOREのコマンドは、文書の読み込み、領域分割お
よび登録を行う指示を与えるものであり、FINDのコ
マンドは検索情報に合致する文書を検索し、文書ファイ
ルから読み出して表示する指示を与えるものであり、D
ELETIEのコマンドは文書データを削除する指定を
与えるものであり、ENDのコマンドは検索終了を指示
するものである。
第5図において、先ず処理100でキーボード30から
コマンドを入力すると、処理200ではそのコマンドを
解析し、その内容が5TORE、 FIND。
DELETEのコマンドのときは、それぞれ処理300
゜400.500を実行する。コマンドがENDコマン
ドのときは、全処理を終了する。
第6図は、第5図の処理300、つまり5TOREコマ
ンドの実行手順を示すフローチャートである。
先ず、処理310では、蓄積すべき文書の文書名、キー
ワードをキーボード30から読み込む。
処理320では、画像入力装置70から上記文書を読み
込み、画像ブイスプレィ80に表示する。
処′fm330では1文書の内容1例えばテキスト、画
像、図表等によって領域分割を行う。領域分割は画像で
あれば、読み込まれたデータ上に黒の部分が多く、高周
波成分が強いのに対して、図表であれば白い部分が多く
、黒ランレングスが短い等の特徴を用いて実行すること
ができる。なお、人間が、表示された文書を見ながら指
示することにより、分割を行うことも可能である。領域
分割を行うときのデータ・タイプは、この例では、テキ
スト、画像、図表としたが、これらは目的等に応じて自
由に設定できる。領域分割の結果は1画像ディスプレイ
80に表示する。処理340では、分割後の各領域のデ
ータを、領域ごとに文書ファイルに蓄積する。処理35
0では、当該文書の文書名、キーワード、文書中の各領
域のデータ・タイプ、位置、大きさ、文書ファイル上の
データ番号を、検索データ・ベースに登録する。
第7図は、第5図の処理400、つまりFINDコマン
ドの実行フローチャートである。
先ず、処理410では、検索すべき文書の検索情報をキ
ーボード30より入力する。検索情報としては、文書名
、キーワード、領域に関する情報等を単独、または複合
して指定できる。処理420では、検索データ・ベース
より指定された検索情報に合致する文書名をめる。処理
430では、指定された検索情報に合致する文書数に応
じて、下記の各処理に進む、すなわち、合致した文書数
が0の場合には処理490に進み、指定の検索情報に合
致する文書が文書ファイル内に存在しないことを示すメ
ツセージを1画像ディスプレイに表示する。また、合致
した文書数が1の場合、処理480に進み、文書ファイ
ルから当該文書のデータを読み出して1画像ディスプレ
イ80に表示する。また、合致した文書数が1より多い
場合、処理440に進み、各文書の領域に関する情報、
データ・タイプ、位置、大きさを検索データ・ベースか
ら読み出し、データ・タイプに応じたパターンで領域を
画像ディスプレイ80に表示する。処理450では、キ
ーボード30より、次の処理を決定するための指定を読
み込む。処理460では、キーボード30から読み込ん
だ指示に応じて、次の処理に進む。すなわち、(1)領
域の内容表示要求の場合、キーボード30からどの領域
の内容を表示するかを指定することにより、処理470
に進み、指定された領域のデータを文書ファイルから読
み出して1画像ディスプレイ80に表示する。また(1
1)次ページ表示要求の場合、処理440に戻り、次ペ
ージの文書の領域情報を読み出して表示する。(iii
)目的文書を指定した場合。
処理480に進み、文書ファイルから当該文書のデータ
を読み出し、画像ディスプレイ80に表示する。
第8図は、第5図の処理500、つまりDELETEコ
マンドの実行フローチャートである。
先ず、処理510では、削除したい文書の文書名をキー
ボード30から読み込み、処理520で。
検索データ・ベース上の該当データを削除する。
処理530では、文書ファイル上の該当データを削除す
る。
本発明の要点を列記すると、次の4つになる。
(i)指定の検索情報を有する文書データがファイル内
に複数個存在する場合、当該の候補データの各領域を、
そのデータ・タイプに応じたパターンで表示することに
より、文書の構造を概略で表示することができ、またパ
ターンで表示されている領域を指定して、その内容を見
ることができるので、候補データの中から目的のデータ
を筒単に探索することができる。
(11)領域をパターンで表示する場合、検索データ・
ベース内の領域に関するデータ・タイプ、位置、大きさ
のみの情報で表示させることができ、かつ文書ファイル
から画像データを読み出す必要がないため、きわめて高
速に表示することができる。また、見たい領域のみを選
択して表示することもできるため、効率のよい検索が可
能となる。
(+ii )検索を行う場合、文書の構造に関する情報
例えば「図が二つ存在する。」、「右下に写真がある。
」等を指定して、検索を行うことができ。
従来では見られない一種の内容検索が可能である。
(1v)検索の過程に応じて、領域のパターン表示のみ
による文書表示から、特定の領域1例えば右下の画像領
域等を指定した文書まで、概略表示から詳細表示までの
柔軟な表示が可能であるため、効率的な検索を行うこと
ができる。
〔発明の効果〕
以上説明したように、本発明によれば、文書の構造情報
を利用して検索を行うので、操作性に優れ、かつ高速表
示が可能な、効率のよい検索を行うことができる。
【図面の簡単な説明】
第1図は本発明の原理を示す概念図、第2図は第1図の
文書と領域の位置関係を示す図、第3図は本発明の一実
施例を示す文書ファイル検索システムのブロック図、第
4図は本発明に用いるコマンドと機能の説明図、第5図
は第4図のコマンドの処理フローチャート、第・6図、
第7図、第8図はそれぞれ第5図の5TORE、 FI
ND、 DELETEのコマンドの処理フローチャート
である。 1・・・文書、2・・・文書ファイル、3・・・文書表
示画面。 4・・・構造表示画面、5・・・検索データ・ベース、
6゜30・・・キーボード、10・・・マイクロプロセ
ッサ。 20・・・主メモリ、40・・・ファイル装置、50・
・・画像プロセッサ、60・・・画像メモリ、70・・
・画像入力装置、80・・・画像ディスプレイ、90・
・・データ箭 1 国 zZ図 VJ 3 図 第 4 図 て 5 圓

Claims (1)

  1. 【特許請求の範囲】 1、文書データを蓄積する文書ファイルを備えたファイ
    ル検索システムにおいて、上記文書ファイルに文書デー
    タを蓄積するときは、テキスト1画像、図表等の同質デ
    ータを含む領域に分割して蓄積し、指定情報を入力して
    文書を検索するときは、上記指定情報に合致する文書が
    複数性存在するならば、文書を構成する領域を内容に応
    じた構造パターンで表示し、表示された複数の文書の中
    から目的の文書を認識することを特徴とする文書ファイ
    ル検索方式。 2、前記内容に応じた構造パターンは、構造表示画面に
    表示され、該画面中の任意の文書または領域は、文書表
    示画面により表示されることを特徴とする特許請求の範
    囲第1項記載の文書ファイル検索方式。 3、前記内容に応じた構造パターンは、領域に関するデ
    ータ・タイプ、位置、大きさ等の情報を指定することに
    より表示されることを特徴とする特許請求の範囲第1項
    または第2項記載の文書ファイル検索方式。
JP59015184A 1984-02-01 1984-02-01 文書フアイル検索方式 Pending JPS60160475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59015184A JPS60160475A (ja) 1984-02-01 1984-02-01 文書フアイル検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59015184A JPS60160475A (ja) 1984-02-01 1984-02-01 文書フアイル検索方式

Publications (1)

Publication Number Publication Date
JPS60160475A true JPS60160475A (ja) 1985-08-22

Family

ID=11881741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59015184A Pending JPS60160475A (ja) 1984-02-01 1984-02-01 文書フアイル検索方式

Country Status (1)

Country Link
JP (1) JPS60160475A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6310268A (ja) * 1986-07-02 1988-01-16 Matsushita Electric Ind Co Ltd 光デイスクの検索画像文書表示方法
JPH0241566A (ja) * 1988-08-01 1990-02-09 Fuji Xerox Co Ltd 電子画像ファイル装置
JPH02186477A (ja) * 1989-01-12 1990-07-20 Fujitsu Ltd ドキュメント検索装置
JPH04217073A (ja) * 1990-12-19 1992-08-07 Fuji Xerox Co Ltd 文書蓄積システムにおける文書検索装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6310268A (ja) * 1986-07-02 1988-01-16 Matsushita Electric Ind Co Ltd 光デイスクの検索画像文書表示方法
JPH0241566A (ja) * 1988-08-01 1990-02-09 Fuji Xerox Co Ltd 電子画像ファイル装置
JPH02186477A (ja) * 1989-01-12 1990-07-20 Fujitsu Ltd ドキュメント検索装置
JPH04217073A (ja) * 1990-12-19 1992-08-07 Fuji Xerox Co Ltd 文書蓄積システムにおける文書検索装置

Similar Documents

Publication Publication Date Title
JPS59183458A (ja) 画像検索方式
JPS59214959A (ja) 画像フアイルの検索方式
JP2004240750A (ja) 画像検索装置
JPH0451363A (ja) 画像情報検索装置
JPH04350768A (ja) 名刺電子ファイリング装置
JP2001084254A (ja) 電子ファイリングシステムおよびファイリング方法
JPS60160475A (ja) 文書フアイル検索方式
JP2001357045A (ja) 画像管理装置,画像管理方法および画像管理プログラムの記録媒体
JPS62106574A (ja) 文書画像フアイル登録検索方式
JP2004240751A (ja) 画像検索装置
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
JPS63191271A (ja) 画像情報記憶検索方法
JPS60156172A (ja) 画像フアイルの検索方式
JPS62247462A (ja) 情報フアイル装置
JPS62272365A (ja) 文書イメ−ジ電子フアイル装置
JPS61217831A (ja) 文書画像フアイル検索方式
JP2940567B2 (ja) 画像データベースシステム
JPH05242161A (ja) 画像検索装置
JPH09293081A (ja) 画像データベース作成方法及び画像検索方法
JPH10312387A (ja) 情報処理装置及び方法並びに情報処理プログラムを記録した記録媒体
JPS6379178A (ja) 文書イメ−ジ電子フアイル装置
JPH11175548A (ja) 画像ファイル検索方法、画像ファイル検索装置及び記憶媒体
JPH0736916A (ja) 画像検索装置
JPH04267480A (ja) 画像データベース検索方式
JPS6371743A (ja) デ−タ・フアイリング・システム