JPH0721191A - 文字列検索装置 - Google Patents

文字列検索装置

Info

Publication number
JPH0721191A
JPH0721191A JP5148737A JP14873793A JPH0721191A JP H0721191 A JPH0721191 A JP H0721191A JP 5148737 A JP5148737 A JP 5148737A JP 14873793 A JP14873793 A JP 14873793A JP H0721191 A JPH0721191 A JP H0721191A
Authority
JP
Japan
Prior art keywords
document
keyword
search
character string
data file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5148737A
Other languages
English (en)
Other versions
JP2601139B2 (ja
Inventor
Yoko Tsunemoto
陽子 恒元
Mutsuharu Kakihara
睦治 垣原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5148737A priority Critical patent/JP2601139B2/ja
Publication of JPH0721191A publication Critical patent/JPH0721191A/ja
Application granted granted Critical
Publication of JP2601139B2 publication Critical patent/JP2601139B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】フリーワード検索で一度に複数の検索文字列
(キーワード)を指定することを可能とし、操作性の向
上を図るとともに、検索結果を文書単位にキーワード別
に編集加工することにより、出力結果の見やすさなど、
ヒューマンインタフェースの向上をも図った。 【構成】キーワードが入力されると、キーワード入力処
理部11が、各キーワードに識別番号を付与して、キー
ワード対応テーブル15を作成し、文字列検索処理部1
2は、キーワード対応テーブル15と文書データファイ
ル18を参照して検索処理を行い、検索結果を検索結果
テーブル16に書き出す。さらに検索結果編集処理部1
3が検索結果テーブル16と文書IDファイル19を参
照して、回答編集テーブル17を作成し、検索結果出力
処理部14によって検索結果の編集内容を出力装置3に
出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、新聞、雑誌、各種文献
等を登録した文書データファイルから指定された文字列
を検索し、その結果を出力する文字列検索装置に関す
る。
【0002】
【従来の技術】従来、文字列検索においては、検索処理
の高速性に焦点が置かれており、一件ずつしかキーワー
ドの検索指定ができなかったり、検索結果の表示につい
ても、装置出力部の見やすさや表示内容についても、編
集・加工するなどして文書ファイルから該当文書を効率
的に抽出するための工夫はなされていなかった。
【0003】
【発明が解決しようとする課題】従来の文字列検索装置
では、処理速度の高速化等、性能の向上を目的とする開
発に重点が置かれていたため、検索の操作性や装置出力
部における表示内容、見やすさ等については、あまり考
慮されていなかった。そこでキーワードの検索時間は短
縮されたものの、該当キーワードをもつ文書の中から検
索者が、ほんとうに必要としている文書を効率的に検出
するのは困難であった。たとえば、従来の文字列検索装
置では、キーワードが文書中に1個しか含まれておら
ず、検索者が本来必要としない文書であっても検索結果
として出力するため、出力数が膨大となり、検索結果か
ら検索者が必要とする文書を見出すために多大の時間を
要する。
【0004】
【課題を解決するための手段】上述した問題点を解決す
るため、本発明による文字列検索装置は、指定された文
字列(キーワード)を文書データファイルから検索し、
その結果を出力する文字列検索装置であり、キーワード
とそのキーワード識別番号との対応を表わしたキーワー
ド対応テーブルと、キーワード識別番号とそれに対応す
る文書データファイル中の該当文字列位置情報を格納し
てある検索結果テーブルと、文書毎に検索結果をキーワ
ード別に集計する回答編集テーブルと、検索対象となる
複数の文書データを格納してある文書データファイル
と、文書データファイル内の各文書の位置情報を格納し
てある文書IDファイルと、入力されたキーワードから
キーワード対応テーブルを作成するキーワード入力処理
部と、キーワード対応テーブルをもとに文書データファ
イルを検索し、検索結果を該当文字列の存在する位置情
報(アドレス)として示した検索結果テーブルを作成す
る文字列検索処理部と、検索結果テーブル上の該当位置
情報と文書IDファイルの各文書の文書データファイル
中の位置情報とから、キーワードがどの文書にどの程度
含まれているかを調べ、その結果をもとに回答編集テー
ブルを作成する検索結果編集処理部と、回答編集テーブ
ルの内容を出力装置に出力する検索結果出力処理部を備
えている。
【0005】
【作用】本発明では、検索対象文字例として一度に複数
のキーワードを指定することを可能とし、この検索結果
を文書単位にキーワード別に編集・加工して、出力装置
へ出力することによって、検索の操作性を向上させると
ともに、検索結果からどの文書にどういうキーワードが
どの程度の頻度で現われているかわかるようにして、該
当のキーワードをもつ文書が多数存在する場合でも、そ
の中からさらに本当に必要としている文書を絞り込むこ
とができ、文書データファイルから、不要な文書を読み
出す無駄を省くことができる。この検索指定するキーワ
ードの数を増やすことによって目的とする文書の抽出を
より的確で効率的に行うことができる。
【0006】
【実施例】本発明について図面を参照して説明する。
【0007】図1において、本発明の文字列検索装置1
は、キーワード入力処理部11、文字列検索処理部1
2、検索結果編集処理部13、検索結果出力処理部14
と、キーワード入力処理部11で作成されるキーワード
対応テーブル15、文字列検索処理部12で作成される
検索結果テーブル16、検索結果編集処理部13で作成
される回答編集テーブル17、検索対象となる文書デー
タを格納する文書データファイル18、文書データファ
イル内における各文書の位置情報(アドレス)を格納し
てある文書IDファイル19から構成されている。また
文字列検索位置1には、キーワード入力処理部11に検
索文字列を入力する入力装置2が、検索結果出力処理部
14に検索結果を編集した回答編集テーブル17の内容
を出力する出力装置3が接続されている。
【0008】次に各処理部の機能と文字列検索動作につ
いて説明する。キーワード入力処理部11は、入力装置
2から検索文字列(複数の指定が可能。以下キーワード
と記述する)が入力されるのを待つ。キーワードが入力
されると、キーワード入力処理部11は、各キーワード
に対してキーワード識別番号を付与して、キーワードと
キーワード識別番号との対応をとり、図2に例示したよ
うなキーワード対応テーブル15を作成し、キーワード
を管理する。
【0009】キーワード対応テーブル15が作成される
と、文字列検索処理部12は、キーワード対応テーブル
15の内容をもとに文書データファイル18を参照して
実際に検索処理を行い、検索結果を検索結果テーブル1
6に書き出す。この検索は各キーワード別に文書データ
ファイル18を先頭から検索するのではなく、指定され
た全てのキーワードを対象としてそれらをキーワードバ
ッファにセットしておき、順次文書データファイルの先
頭から検索を実行していく。そして、文書データファイ
ル中に、該当箇所が見つかると、その位置情報(文書デ
ータファイル中のアドレス)と、該当キーワードのキー
ワード識別番号を検索結果として、検索結果テーブル1
6に順次、書き出していく。この結果、検索終了時には
検索結果テーブル16には、図3に示すように、キーワ
ードの位置情報とキーワード識別番号との対応表が作成
される。
【0010】検索処理終了後、検索結果編集処理部13
は、検索結果テーブル16の検索結果に基づいて文書I
Dファイル19を参照して検索したキーワードの位置情
報から、そのキーワードがどの文書に属するものである
かチェックすることによって、検索結果を文書単位に各
キーワードの出現頻度を集計し、回答編集テーブル17
を作成する。図5に示すように文書IDファイル19に
は、文書データファイル中における各文書の位置情報と
して、開始位置と終了位置が格納されているので、検索
結果テーブル16に格納されている各キーワードの位置
情報から、各キーワードがどの文書のアドレス範囲にあ
るかがわかるので、文書単位に各キーワードの編集をす
ることができる。この検索は、複数のキーワードについ
て一度に行っていることと、文書データファイル18中
には、各キーワードに対して複数の該当箇所が存在する
ことにより、検索結果は、文書単位に、しかも各文書内
ではキーワード別にその出現頻度を集計し、回答編集テ
ーブル17に書き出している。こうして編集された結果
は、検索結果出力処理部14により出力装置3に出力さ
れる。検索結果出力処理部14には、通常は回答編集テ
ーブル17の内容を出力処理用フォーマットに編集して
出力する。検索者は、検索結果の各文書のキーワードの
頻度分布を見て、自分が必要と思われる文書を容易に抽
出することが可能となる。またオプションとして、検索
者(オペレータ)の指定があれば、文書データを出力
し、その中で該当箇所を反転させる機能があり、この場
合は、該当箇所をブリンキング表示することも可能であ
る。
【0011】
【発明の効果】以上説明したように、本発明の文字列検
索装置は、キーワード対応テーブルを作成して指定され
た検索文字列を管理することによって、複数のキーワー
ドを一度に検索することができる。さらに回答編集テー
ブルを作成することによって、検索結果の各文書のキー
ワードの頻度分布を見て、検索された文書の中から、ほ
んとうに必要としているものだけを、文書を読むことな
くさらに絞り込むことが可能となり、不要な文書を文書
データファイルから読み出す無駄をなくし、効率的に、
かつ精度の高い文書の検索が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック構成図である。
【図2】キーワード対応テーブルの説明図である。
【図3】検索結果テーブルの説明図である。
【図4】回答編集テーブルの説明図である。
【図5】文書IDファイルの説明図である。
【符号の説明】
1 文字列検索装置 2 入力装置 3 出力装置 11 キーワード入力処理部 12 文字列検索処理部 13 検索結果編集処理部 14 検索結果出力処理部 15 キーワード対応テーブル 16 検索結果テーブル 17 回答編集テーブル 18 文書データファイル 19 文書IDファイル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 指定された文字列(キーワード)を文書
    データファイルから検索し、その結果を出力する文字列
    検索装置であり、 キーワードとそのキーワード識別番号との対応を表わし
    たキーワード対応テーブルと、 キーワード識別番号とそれに対応する文書データファイ
    ル中の該当文字列位置情報を格納してある検索結果テー
    ブルと、 文書毎に検索結果をキーワード別に集計する回答編集テ
    ーブルと、 検索対象となる複数の文書データを格納してある文書デ
    ータファイルと、 文書データファイル内の各文書の位置情報を格納してあ
    る文書IDファイルと、 入力されたキーワードからキーワード対応テーブルを作
    成するキーワード入力処理部と、 キーワード対応テーブルをもとに文書データファイルを
    検索し、検索結果を該当文字列の存在する位置情報(ア
    ドレス)として示した検索結果テーブルを作成する文字
    列検索処理部と、 検索結果テーブル上の該当位置情報と文書IDファイル
    の各文書の文書データファイル中の位置情報とから、キ
    ーワードがどの文書にどの程度含まれているかを調べ、
    その結果をもとに回答編集テーブルを作成する検索結果
    編集処理部と、 回答編集テーブルの内容を出力装置に出力する検索結果
    出力処理部とから構成されることを特徴とする文字列検
    索装置。
JP5148737A 1993-06-21 1993-06-21 文字列検索装置 Expired - Fee Related JP2601139B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5148737A JP2601139B2 (ja) 1993-06-21 1993-06-21 文字列検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5148737A JP2601139B2 (ja) 1993-06-21 1993-06-21 文字列検索装置

Publications (2)

Publication Number Publication Date
JPH0721191A true JPH0721191A (ja) 1995-01-24
JP2601139B2 JP2601139B2 (ja) 1997-04-16

Family

ID=15459493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5148737A Expired - Fee Related JP2601139B2 (ja) 1993-06-21 1993-06-21 文字列検索装置

Country Status (1)

Country Link
JP (1) JP2601139B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462667A (ja) * 1990-06-30 1992-02-27 Nippon Telegr & Teleph Corp <Ntt> データベース検索方法
JPH0581327A (ja) * 1991-09-19 1993-04-02 Fujitsu Ltd 情報検索支援処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462667A (ja) * 1990-06-30 1992-02-27 Nippon Telegr & Teleph Corp <Ntt> データベース検索方法
JPH0581327A (ja) * 1991-09-19 1993-04-02 Fujitsu Ltd 情報検索支援処理装置

Also Published As

Publication number Publication date
JP2601139B2 (ja) 1997-04-16

Similar Documents

Publication Publication Date Title
JPH08241332A (ja) 全文登録語検索装置および方法
KR970705795A (ko) 데이타베이스 검색을 위한 병렬 처리 시스템(parallel processing system for traversing a data base)
JPH11224258A (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JPH0721191A (ja) 文字列検索装置
JPS634334A (ja) 文書イメ−ジ電子フアイル装置
JPH0561758A (ja) 情報リンク装置
JP2676731B2 (ja) 電子化文書検索装置
JPH09146968A (ja) 文書検索方法
JPH05181912A (ja) 文書検索装置
JPS62243067A (ja) 画像フアイル装置
JPH1115826A (ja) 文書解析装置及び方法
JP2806653B2 (ja) ファイル検索装置
JPH07230469A (ja) 検索装置
JPH0540788A (ja) 文書フアイルの文字列検索結果出力方式
JPH04139579A (ja) 単語検索装置
JP2001052022A (ja) データ集計・参照型検索システム
JPH11161666A (ja) ドキュメントデータ検索方法および装置、並びにドキュメント編集装置
JPH06318233A (ja) 画像情報処理装置
JPH03229368A (ja) 画像表示検索方式
JPH0398167A (ja) 索引順編成ファイルの逆引き検索方式
JPH0525139B2 (ja)
JPH04113466A (ja) 画像ファイル検索システム
JPH07249034A (ja) 文字列抽出処理装置
JPH06119331A (ja) 構造化文書の文書部品管理装置
JPH04359372A (ja) 電子ファイリング装置の検索方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19961126

LAPS Cancellation because of no payment of annual fees