JPS62106574A - 文書画像フアイル登録検索方式 - Google Patents

文書画像フアイル登録検索方式

Info

Publication number
JPS62106574A
JPS62106574A JP60246164A JP24616485A JPS62106574A JP S62106574 A JPS62106574 A JP S62106574A JP 60246164 A JP60246164 A JP 60246164A JP 24616485 A JP24616485 A JP 24616485A JP S62106574 A JPS62106574 A JP S62106574A
Authority
JP
Japan
Prior art keywords
document
keyword
keywords
input
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60246164A
Other languages
English (en)
Inventor
Masatoshi Hino
樋野 匡利
Kuniaki Tabata
邦晃 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60246164A priority Critical patent/JPS62106574A/ja
Publication of JPS62106574A publication Critical patent/JPS62106574A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、文書画像ファイルの登録検索方式に関する。
〔発明の背景〕
従来の文書画像ファイルの登録検索方式としては、基本
的なものに、登録時にその文書名と検索の手掛りとして
の、分類コード(大分類、中分類など)やキーワードの
指定に応じて表示される候補データの中から選択する方
式がある。より高度な登録検索の例としては、画像の例
示で画像ファイルを検索するQPE (キュエリ・パイ
・ビクトリアル・イグザンプル: (Query−by−Pictiral−Exan+p
le) 、(N t Sチャン(Chang) 、 K
、 Sフ(F u)“ピクチュア・キュエリ、ランゲー
ジス・フォー・ピクトルアル・データベース・システム
ズ: Picrure QueryLanguages
 for Pictorial Data−Base 
Systems”アイ・イー・イー・イー、コンピュー
タI E ’ Comprter)1981年11月y
pp23〜33〕や、データの内容から連想した色彩と
対応づけて検索する方式(特開昭57−121767)
 、文書の構造情報を抽出、N積し、これを検索にも利
用する方式(生餅1318301558 )などがある
検索方式としては、上述の様に、多くのものがあるが、
ある文書から他の文書への孫引きや、あるテーマについ
ての文書を網羅的に捜す、といった場合には、キーワー
ドによる検索が最適と思われる。しかし1g、録時のキ
ーワード入力が問題となる。
また、ある文書に含まれるキーワードを一覧表的に表示
するだけでなく、実際の文書中におけるキーワードを明
示的に表示できれば、検索効率は向上する。
〔発明の目的〕
本発明の目的は、操作性に優れ、効率の良い文書画像フ
ァイルの登録検索手段を提供することにある。
〔発明の概要〕
本発明は、下記概念を導入することによって。
文書画像ファイルの登録検索処理の操作性と効率の向上
を計るものである。
(1)文書の登録時に、予め記憶しであるキーワードを
自動的に抽出し、その情報を文書とともに′#II積す
ることを可能にする。これにより、文書の登録時に、キ
ーワードを入力する必要がなく、しかし、検索時にはキ
ーワードを用いて効率良く検索することができる。
(2)検索的に、文書の持つ抽出された全キーワードと
ともに、実際の文書中でのキーワードをハイライト表示
などの方法で明示的に表示する。
これにより、あるテーマ、目的を持って文書を検索する
際に、関連するキーワードとその文書中の位置に、素早
く見つけることができ、検索の効率が向上する。
(3)複数ページからなる文書において、あるキーワー
ドを含むページだけを選択的に、次々と表示することを
可能とする。これによっても、(2)と同様に検索効率
が向上する。
〔発明の実施例〕
以下、本発明の一実施例を説明する。第1図は登録処理
の概念図である。登録対象である文書1は、画像として
入力される6次に、入力した文書の名称と、登録したい
キーワードがあれば、それをキーボード等により入力す
る。キーワードの入力がある場合、キーワード・テーブ
ル2を捜し、すでに9.録されている時には、入力文書
名をキーワード・テーブル2の対応するキーワードの文
書名種に追加し、登録されていない時には、入力キーワ
ードを登録し、その文書名種に入力文書名を書き込む。
キーワード・テーブル2は、インバーチイツトファイル
になっており、キーワードにより文書を検索する際に使
用する。
次に画像として入力された文書1に対して、文字、文字
列を抽出し、この文字、文字列をもとにして、キーワー
ド・テーブル2に登録されているキーワードを自動的に
抽出する。キーワードの自動抽出は、文字、文字列抽出
された結果を文字認識することによって、又は、キーワ
ードの正規化された画像パターンを持っておくか、コー
ドより、発生させて、文字、文字列抽出された結果とパ
ターン・マツチングすることによって実現できる。
これらは、いずれも公知である。(大田他、「芙字パタ
ーン列の特徴パラメータによる検索」信学研究会資料I
E80−120.pp91〜98)抽出後、文書名をキ
ーワード・テーブル2の入力ワード以外の抽出したキー
ワードに対応する位置に追加(入力キーワードについて
は既に登録されている。)文書名と入力キーワードも含
め、全ての抽出したキーワード、そのキーワードの位置
、大きさを文書テーブル3に登録する。
キーワード抽出では1文字、文字列切り出しの精度、文
字認識やパターン・マツチングの精度によって、キーワ
ード・テーブル2に登録されている全てのキーワードが
必ず抽出できるとは限らない。従って、抽出ができたキ
ーワードについてだけ上記の登録処理を行うものとする
。しかし、文書名とともにキーボード等から入力された
キーワードは、キーワード抽出で抽出できなかった場合
でも、文書テーブル3に登録するものとする。ただし、
キーワードの位置、大きさは登録しない。
これにより、入力されたキーワードは必ず登録され、キ
ーワードテーブル2に既に登録されているもののうち、
キーワード抽出処理で抽出できたキーワードが登録され
る。
最後に、入力された文書の画像データは、文書ファイル
4に蓄積され、そのアドレスが、文書テーブル3に書き
込まれる。
以上で登録処理が完了する7 第2図は検索処理の概念図である。
検索処理は、まず1文書名により検索する場合。
文書名を直接入力するか、又は、文書テーブル3により
文書名の一覧表を検索画面に表示、選択することにより
検索する0文書名の一覧表を表示する際、同時に各文書
のキーワードを表示し、検索の手助けとすることができ
る。
キーワードにより検索する場合、キーワード・テーブル
2より、指定されたキーワードを含む文書名の一覧表を
検索画面に表示、選択して検索する。
上記、2つの方法で検索した後、文書は文書ファイル4
より読み出され表示される。このとき、文書テーブル3
を用いて、その文書のキーワードの一覧を表示、文書中
のキーワードを色を変えたり、ハイライト処理をして表
示することができる。
また、文書が複数のページから構成される際には。
キーワードを指定して、そのキーワードを含むページを
表示することができる。
本発明の原理を実現するためのハードウェア構成例を第
3図に示す。図中、10はマイクロプロセッサ、20は
主メモリ、30はキーホード、40はファイル装置、5
0は画像プロセッサ、60は画像メモリ、70は画像入
力装置、80はディスプレイである。第1図のキーワー
ド・テーブル2、文書テーブル3、文書ファイル4は、
ファイル装[40に存在する。第3図のシステムは、文
書を、画像入力装置70より画像データとしてファイル
装[40に蓄積し、必要に応じて目的の画像データをフ
ァイル装置40から読み出し、ディスプレイ80に表示
する機能を持つ。本システムの動作は、いくつかのコマ
ンドによって指示される。マイクロプロセッサ10は、
主メモリ20上のプログラムとデータに基づいてコマン
ドの実行を制御する。画像プロセッサ50は、マイクロ
プロセッサ1oの制御により、画像メモリ60上の文書
画像データを処理する。文字、文字列の抽出やキーワー
ド抽出処理は、マイクロプロセッサ10と画像プロセッ
サ50により実行される。
第4図a、bに本システムの基本的な動作を指示するシ
ステム・コマンド、検索サブ・コマンドを示す。
第5図は本システムの処理フローを示す。
(1)処理100: キーボード30からコマンドを読み込む。
(2)処理200: コマンドを解析し、ストア(STORE) 、ファイン
ド(FIND) 、デリート(DELETE)コマンド
の時は、それぞれ、処理300、処理400、処理50
0を実行する。エンド(END)コマンドにより全処理
を終了する。
(3)処理300 : 第6図の手順でSTOREコマンドを実行する。
(a)処理310: 画像入力装置70から当該文書を読み込み。
ディスプレイ80に表示する。
(b)処理320: ’s′f!tする文書の文書名と、もし当該文書のキー
ワードとして登録したいものがあれば、そのキーワード
を、キーボード30から読み込む。
(c)処理330: キーワードの入力があれば、処理340に、なければ処
理350に進む。
(d)処理340: 入力されたキーワードが、キーワード・テーブル2に既
に登録されているかどうかを調べる。既に登録されてい
れば、そのキーワードを持つ文書として、入力された文
書名をキーワード・テーブル2に書き込む。キーワード
が未登録であれば、登録し、文書名を書き込む。
(e)処理350: 入力された文書の文字、文字列を抽出する。
この抽出方法は、周辺分布を用いたり(軟白、増田「書
式情報によらない紙面構成要素抽出法」信学論(D)J
66−Di、ppH1〜118)、文字ピッチ情報を用
いる方法、軟白他、(縦横書き文書からの個別文字切出
し法J PRL83−7)+ フーリエ変換を用いる方
法、(長谷用、「2次元フーリエ変換を用いた文字列抽
出法の検討」、情報全大筒22図)等、公知のものであ
る。
(f)処理360: 抽出された、文字、文字列に基づいて、キーワード・テ
ーブルに登録されているキーワードを捜し、キーワード
とその文書中の位置、大きさの情報を抽出する。キーワ
ードの抽出方法は、処11350で抽出された文字を認
識して行う方法、各キーワードに対応した文字パターン
(画像)を持っておくが、又は生成して、パターン・マ
ツチングにより行う方法などがある。
(g)処理37o: キーボード3oがら入力されたキーワード以外の抽出さ
れたキーワードがあれ1(、キーワード・テーブル2の
対応するキーワードの位置に文書名を書き込む。次に文
書名を文書テーブルに登録し、抽出された全てのキーワ
ードについて、そのキーワードと文書中の位置大きさの
情報を書き込む。このとき、キーボード30から入力さ
れたキーワードが抽出されなかった場合、そのキーワー
ドを、位置、大きさの情報なしで書き込む、これにより
、キーボード30から入力されたキーワードは、必ず文
書テーブル3に書き込まれる。
(h)処理380: 入力された文書を画像として文書ファイル4にW積する
(i)処理390: 文書画像の蓄積された文書ファイル4のアドレス情報を
、文書テーブル3に書き込む。
(4)処理400: 第7図の手順でFiNDコマンドを実行する。
(a)処理405: 文書名検索を行うか、キーワード検索を行うかの選択を
、キーボードより読み込む0文書名検索の場合、処理4
10へ、キーボード検索の場合、処理420へ進む。
(b)処理410: 文書テーブル3より、文書ファイル4に蓄積されている
文書の文書名とその文書のキーワードを一覧表としてデ
ィスプレイ80に表示する。
(c)処理415ニ 一覧表より文書を選択し、一覧表の番号。
又は、文書名をキーボード30から入力する。
(d)処理420: 検索のキーとなるキーワードをキーボード30より読み
込む。
(e)処理425: キーワード・テーブル2より、入力されたキーワードを
持つ文書を求め、その文書名を一覧表としてディスプレ
イ80に表示する。
(f)処理430ニ 一覧表より文書を選択し、一覧表の番号、又は、文書名
を、キーボード3oから入力する。
(g)処理435: 文書テーブル3より、選択された文書の全キーワードと
、文書ファイル・アドレスを求め、文書ファイルより文
書の第1ページ、全キーワードをディスプレイ80に表
示する。
(h)処理440: キーボード30より検索サブコマンドを読み込む。
(i)処理445: 検索サブコマンドを解析し、プレピアス(PREVIO
US) 、ネクスト(NEXT) 、キーワード(KE
YWORD) 、アゲイン(AGAIN)コマンドの時
は、それぞれ処理450.処理455゜処理460.処
理470を実行する。エンド(END)コマンドにより
処理400を終了する。
(j)処理450: 現在表示されている文書の前ページを表示する。前ペー
ジがなければ、その旨、メツセージをディスプレイ80
に表示し、ページは変化しない。
(k)処理455: 現在表示されている文書の次ページを表示する。次ペー
ジがなければ、その旨、メツセージをディスプレイ80
に表示し、ページは変化しない。
(1)処理46o: ディスプレイ80に表示されているキーワードを選択し
、その付けられている番号、又はキーワード名をキーボ
ード30より入力する。
(m)処理465: 現在表示されているページ以降で、選択されたキーワー
ドを含む最初のページを表示する。選択されたキーワー
ドを含むページがなければ、その旨、メツセージを表示
し、ページは変化しない。
(n)処理470: 直前に選択されたキーワードを用いて、処理465と同
じ処理を実行する。
(5)処理500: 第8図の手順でデリート(DELETE)コマンドを実
行する。
(a)処理510: 削除したい文書の文書名をキーボード30より読み込む
(b)処理520: キーワード・テーブル2上の該当データを削除する。
(c)処理530: 文書テーブル3上の該当データを削除する。
(d)処理540: 文書ファイル4上の該当データを削除する。
〔発明の効果〕
本発明によれば、次の効果がある。
(1)キーワード・テーブルに既に登録しであるキーワ
ードを自動的に抽出することができるので。
文書の入力時に指定したキーワード以外のキーワードも
その文書のキーワードとして、以後の検索に用いること
ができる。
(2)上記キーワードの自動抽出により、興味のある、
いくつかのキーワードを予め登録しておき、その後、次
々と文書を入力することにより、文書をキーワードを用
いて体系化し蓄積することができる。これは、一種のデ
ータベースの自動構築と言える。
(3)文書を検索する際に、その文書の持つ全キーワー
ドを文書と同時に表示することができる。
また、文書中のキーワードを位置と大きさを文書テーブ
ル中から読み出しハイライト表示等で明示的に表示する
ことができる。これを、文書を読む際の大きな手掛りと
することができ、希望の文書やページ検索する効率を改
善することができる。
(4)文書を検索後、各ページを次々と表示し希望のペ
ージを検索する際、キーワードを指定して、そのページ
を表示することができる。
【図面の簡単な説明】
第1図は本発明の登録処理の説明図、第2図は検索処理
の説明図、第3図は一実施例におけるハードウェア構成
図、第4図はコマンドの機能説明図、第5〜第8図は処
理フロー図である。 1・・・文書、2・・・キーワード・テーブル、3・・
・文書テーブル、4・・・文書ファイル、10・・・マ
イクロプロセッサ、20・・・主メモリ、30・・・キ
ーボード。

Claims (1)

    【特許請求の範囲】
  1. 文書画像データを蓄積するファイル装置において、キー
    ワードを記憶しておく第1の手段と、第1の手段に記憶
    されているキーワードを入力された文書から自動的に抽
    出する第2の手段、抽出されたキーワードに関する情報
    を記憶する第3の手段、文書とともに、その文書が持つ
    とキーワードと文書中のキーワードを明示的に表示する
    第4の手段、前記ファイル装置から目的の文書を検索す
    るための情報を入力する第5の手段を持つことを特徴と
    する文書画像ファイル登録検索方式。
JP60246164A 1985-11-05 1985-11-05 文書画像フアイル登録検索方式 Pending JPS62106574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60246164A JPS62106574A (ja) 1985-11-05 1985-11-05 文書画像フアイル登録検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60246164A JPS62106574A (ja) 1985-11-05 1985-11-05 文書画像フアイル登録検索方式

Publications (1)

Publication Number Publication Date
JPS62106574A true JPS62106574A (ja) 1987-05-18

Family

ID=17144454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60246164A Pending JPS62106574A (ja) 1985-11-05 1985-11-05 文書画像フアイル登録検索方式

Country Status (1)

Country Link
JP (1) JPS62106574A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01237723A (ja) * 1988-03-17 1989-09-22 Sharp Corp 情報登録検索方法
US6055530A (en) * 1997-03-03 2000-04-25 Kabushiki Kaisha Toshiba Document information management system, method and memory
JP2005173977A (ja) * 2003-12-11 2005-06-30 Sony Corp アドレス記憶装置
JP2011513849A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法
JP2011513850A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法
JPWO2016151838A1 (ja) * 2015-03-26 2017-07-20 株式会社日立製作所 先行研究調査システムおよび先行研究調査方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01237723A (ja) * 1988-03-17 1989-09-22 Sharp Corp 情報登録検索方法
US6055530A (en) * 1997-03-03 2000-04-25 Kabushiki Kaisha Toshiba Document information management system, method and memory
JP2005173977A (ja) * 2003-12-11 2005-06-30 Sony Corp アドレス記憶装置
JP2011513849A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法
JP2011513850A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法
JPWO2016151838A1 (ja) * 2015-03-26 2017-07-20 株式会社日立製作所 先行研究調査システムおよび先行研究調査方法

Similar Documents

Publication Publication Date Title
JP3694149B2 (ja) 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0432427B2 (ja)
JP4054428B2 (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
JPS62106574A (ja) 文書画像フアイル登録検索方式
JP2005107931A (ja) 画像検索装置
JPH1091766A (ja) 電子ファイリング方法及び装置並びに記憶媒体
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JP2002312401A (ja) 電子ファイリング装置及びその制御方法、記憶媒体並びにプログラム
JP2550068B2 (ja) 情報の検索・表示方法
JPH06162107A (ja) 電子ファイリングシステム
JPS60160475A (ja) 文書フアイル検索方式
JPH0514304B2 (ja)
JPH09146968A (ja) 文書検索方法
JPS61217831A (ja) 文書画像フアイル検索方式
JP2601139B2 (ja) 文字列検索装置
JP2888458B2 (ja) ファイル格納装置
JPH02113368A (ja) 情報検索方法
JPH10124523A (ja) マルチメディアデータの案内検索方法及び装置
JPH0438561A (ja) 文書ファイリング装置
JPH10247237A (ja) 文書画像処理装置および文書画像処理方法および情報記録媒体
JPS60256853A (ja) データ検索装置および方法
JPH11272706A (ja) 検索装置