JPH02190946A - キーワード管理方式 - Google Patents

キーワード管理方式

Info

Publication number
JPH02190946A
JPH02190946A JP1010920A JP1092089A JPH02190946A JP H02190946 A JPH02190946 A JP H02190946A JP 1010920 A JP1010920 A JP 1010920A JP 1092089 A JP1092089 A JP 1092089A JP H02190946 A JPH02190946 A JP H02190946A
Authority
JP
Japan
Prior art keywords
keyword
information
index information
management
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1010920A
Other languages
English (en)
Inventor
Koichi Nakamura
幸一 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1010920A priority Critical patent/JPH02190946A/ja
Publication of JPH02190946A publication Critical patent/JPH02190946A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はキーワード管理方式に関し、特に図書検索シス
テム、技術文献検索システムおよび人事スキル検索シス
テム等の不定長のキーワード文字列が用いられる情報検
索システムにおけるキーワード管理方式に関する。
〔従来の技術〕
従来、この種のキーワード管理方式では、検索のための
キーワード文字列は索引ファイル内のレコード(索引情
報)中の一項目としてそのまま保持されていた。
キーワード文字列により検索が行われる索引情報は、−
1にその索引情報を識別するためのユニークキーと、最
終的に検索の目的となる固定属性情報と、キーワード文
字列を有するキーワード情報とから構成されている(こ
のような索引情報の例を第2図および第3図に示す)。
従来のキーワード管理方式としては、索引情報に不定長
のキーワード文字列を格納する形式に基づいて以下に示
すような2つの方式が存在した。
+11  予測されるキーワード文字列の最大長に基づ
く固定長の項目をキーワード情報の項目として索引情報
中に持ち、その項目に不定長のキーワード文字列を格納
する固定長格納方式(第2図参照)(2)  キーワー
ド文字列の有効長の項目を索引情報中に用意しておき、
キーワード文字列自体は可変長の項目に格納する可変長
格納方式(第3図参照)第2図に示す固定長格納方式に
係る索引情報は、ユニークキー(一連番号)、固定属性
情I!!(表題および作成日)およびキーワード情報か
らなる形式を有しており、固定長のキーワード情報はキ
ーワード文字列(空白文字「△」を含む)からなる。
第3図に示す可変長格納方式に係る索引情報は、ユニー
クキー(一連番号)、固定属性情報(表題および作成日
)およびキーワード情報からなる形式を有しており、可
変長のキーワード情報は有効長とキーワード文字列とか
らなる。
なお、第2図および第3図にはキーワード情報の項目が
不定繰返し項目の場合(索引情報中のキーワード情報の
項目数が不定である場合)の索引情報を示しているが、
キーワード情報の項目が固定繰返し項目の場合(索引情
報中のキーワード情報の項目数が任意の数に固定されて
いる場合)の索引情報に関しても同様の方式を適用する
ことができる。
〔発明が解決しようとする課題〕
上述した従来のキーワード管理方式における固定長格納
方式では、キーワード情報の項目が固定長であるために
キーワード文字列の有効長の計算が不要であり検索速度
は速いが、キーワード情報の項目長として予測されるキ
ーワード文字列の最大長が全てのキーワード情報の項目
に割り当てられるので、短い語長である多くのキーワー
ド文字列については無効領域が多くなってスペース効率
が悪くなり、索引情報のだめの容量が増大するという欠
点がある(この欠点は索引情報中のキーワード文字列の
数が増加するほど顕著になる)。
また、上述した従来のキーワード管理方式における可変
長格納方式では、有効製分しかキーワード文字列のため
の領域が存在しないためにスペース効率は良くなる(キ
ーワード文字列以外の有効長の情報をキーワード情報中
に保持する必要があるのでスペース効率の向上の効果は
少ない)が、キーワード情報中の有効長をいちいち計算
して索引情報をアクセス(取得)する必要があるので、
検索速度が遅くなるという欠点がある。
本発明の目的は、上述の点に鑑み、索引↑n報中にキー
ワード文字列を直接保持せずにキーワード管理番号(後
述参照)を保持することにより、索引情報の容量を軽減
することができ、かつ高速の検索処理を行うことができ
るキーワード管理方式を提供することにある。
〔課題を解決するための手段〕
本発明のキーワード管理方式は、不定長のキーワード文
字列を用いた情報検索を行う情報検索システムにおける
キーワード管理方式において、索引情報を登録するため
の登録索引情報およびキーワード文字列を取得する情報
登録手段と、索引情報を検索し取得するための検索用キ
ーワード文字列を取得する情報検索手段と、キーワード
文字列とそのキーワード文字列に対応するユニークなキ
ーワード管理番号とをキーワード管理テーブルで管理し
前記情報検索手段により取得された検索用キーワード文
字列に対応するキーワード管理番号を取得するキーワー
ド情報管理手段と、前記情報登録手段により取得された
キーワード文字列に対応するキーワード管理番号と前記
情報登録手段により取得された登録索引情報とを索引情
報テーブルで管理し前記情報検索手段により取得された
検索用キーワード文字列に対応するキーワード管理番号
に基づき索引情報を検索し取得する索引情報管理手段と
を有する。
〔作用〕
本発明のキーワード管理方式では、情報登録手段が索引
情報を登録するための登録索引情報およびキーワード文
字列を取得し、情報検索手段が索引情報を検索し取得す
るための検索用キーワード文字列を取得し、キーワード
情報管理手段がキーワード文字列とそのキーワード文字
列に対応するユニークなキーワード管理番号とをキーワ
ード管理テーブルで管理し情報検索手段により取得され
た検索用キーワード文字列に対応するキーワード管理番
号を取得し、索引情報管理手段が情報登録手段により取
得されたキーワード文字列に対応するキーワード管理番
号と情報登録手段により取得された登録索引情報とを索
引情報テーブルで管理し情報検索手段により取得された
検索用キーワード文字列に対応するキーワード管理番号
に基づき索引情報を検索し取得する。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図(alは、本発明のキーワード管理方式の一実施
例の構成を示すブロック図である0本実施例のキーワー
ド管理方式は、登録情報入力袋!10と、情報登録手段
20と、索引情報管理手段30と、索引情報テーブル4
1を有する索引情報格納装置40と、検索情報入出力装
置50と、情報検索手段60と、キーワード情報管理手
段70と、キーワード管理テーブル81を有するキーワ
ード情報格納装置80とを含んで構成されている。
第1図山)は、索引情報格納装置40に蓄えられている
索引情報テーブル41の一例を示す図である。
この図を参照すると、索引情報テーブル41は、資料番
号と、資料表題と(資料番号および資料表題が登録索引
情報に相当する)、キーワード管理番号(キーワード管
理番号(1)、キーワード管理番号(2)、・・・)と
を含んで構成されている(索引情報テーブル41の形式
はこの形式に限定されるものではない)。
第1図(C1は、キーワード情報格納装置80に蓄えら
れているキーワード管理テーブル81の一例を示す図で
ある。この図を参照すると、キーワード管理テーブル8
1は、キーワード管理番号と、キーワード文字列と、有
効長とを含んで構成されている(キーワード管理テーブ
ル81の形式はこの形式に限定されるものではない)。
次に、このように構成された本実施例のキーワード管理
方式の動作について説明する。
まず、登録情報入力装置10は、登録索引情報(キーワ
ード文字列以外の索引に関する情報)およびキーワード
文字列を入力して情報登録手段20に引き渡す。
情報登録手段20は、登録情報入力装置lOからキーワ
ード文字列を取得する毎にキーワード情報管理手段70
に対してそのキーワード文字列を引き渡す。
キーワード情報管理手段70は、以下に示す処理を行う
まず、登録情報入力装置10により入力されたキーワー
ド文字列(情報登録手段20から引き渡されたキーワー
ド文字列)に対応するキーワード管理番号を取得するた
めに、キーワード情報格納装置80内のキーワード管理
テーブル81を検索する。
この検索でキーワード管理テーブル81内に当該キーワ
ード文字列に対応するキーワード管理番号が見つかれば
、そのキーワード管理番号を情報登録手段20に返却す
る。
上述の検索でキーワード管理テーブル81内に当該キー
ワード文字列に対応するキーワード管理番号が見つから
なければ、新たなキーワード管理番号(固定長で短いユ
ニークなキーワード管理番号)を採番しく一連番号を採
番するものとする)、キーワード管理テーブル81内に
当該キーワード文字列と採番したキーワード管理番号と
の対を格納し、そのキーワード管理番号を情報登録手段
20に返却する。
情報登録手段20は、登録情報入力袋′l110により
入力された登録索引情報とキーワード情報管理手段70
から引き渡されたキーワード管理番号(1つの登録索引
情報に対して複数のキーワード管理番号が存在する場合
もある)とを索引情報管理手段30に引き渡す。
索引情報管理手段30は、情報登録手段20から引き渡
された情報に基づく索引情報(第1図(blに示すよう
な資料番号、資料表題およびキーワード管理番号からな
る情報)を索引情報格納装置40内の索引情報テーブル
41に格納する。
上述のようにして格納された索引情報が検索される場合
には、検索情報入出力装置50は、検索用キーワード文
字列を入力して情報検索手段60に引き渡す。
情報検索手段60は、検索情報入出力装置50により入
力された検索用キーワード文字列をキーワード情報管理
手段70に引き渡す。
キーワード情報管理手段70は、情報検索手段60から
引き渡された検索用キーワード文字列に基づいてキーワ
ード情報格納装置80内のキーワード管理テーブル81
を検索し、検索用キーワード文字列に対応するキーワー
ド管理番号(キーワード文字列の有効長の情報を含む)
を取得して情報検索手段60に引き渡す。
情報検索手段60は、キーワード情報管理手段70から
引き渡されたキーワード管理番号を索引情報管理手段3
0に引き渡す。
索引情報管理手段30は、情報検索手段60から引き渡
されたキーワード管理番号に対応する索引情報を索引情
報格納装置40内の索引情報テーブル41より検索し取
得して情報検索手段60に引き渡す。
情報検索手段60は、索引情報管理手段30から引き渡
された索引情報(検索結果)を検索情報入出力装置50
に引き渡す。
検索情報入出力装置50は、情報検索手段60から引き
渡された索引情報(検索用キーワード文字列に対応する
索引情報)を出力する。
以上のような処理により、キーワード情報(キーワード
文字列やキーワード管理番号)と索引情報(資料番号や
資料表題)とを別個に管理することが可能になる。
なお、第1図fa+における登録情報入出力装置10と
検索情報入出力装置50とが同一装置であり、索引情報
格納装置40とキーワード情報格納装置80とが同一装
置であっても本発明のキーワード管理方式を実現するこ
とが可能である。
また、索引情報格納装置40およびキーワード情報格納
装置80において、索引情報テーブル41およびキーワ
ード管理テーブル81の形式(項目数、属性および情報
の内容等)、ファイル編成の種類(RDB (Rela
tional  1)ataBase)および索引順編
成等)および格納方式の種類(登録順、ソートおよびハ
ツシュ等)等を任意に設定できることはいうまでもない
さらに、複数の索引情報が検索対象となる場合の処理の
種類(再絞込み、−覧表示からの選択および全件順次出
力等)も本発明のキーワード管理方式を拘束するもので
はない(どのような処理であっても本発明を適用するこ
とができる)。
〔発明の効果〕
以上説明したように本発明は、索引情報中にキーワード
文字列を直接保持せずにキーワード文字列に対応する固
定長で短いユニークなキーワード管理番号を保持するこ
とにより、索引情報の容量を軽減することができ、検索
処理の処理時間を短縮することができるという効果があ
る。
【図面の簡単な説明】
第1図(alは本発明の一実施例の構成を示すブロック
図、 第1図(blは第1図中の索引情報テーブルの一例′を
示す図、 第1図(C1は第1図中のキーワード管理テーブルの一
例を示す図、 第2図は従来のキーワード管理方式(固定長格納方式)
で取り扱われる索引情報の形式の一例を示す図、 第3図は従来のキーワード管理方式(可変長格納方式)
で取り扱われる索引情報の形式の一例を示す図である。 図において、 10・・・登録情報入力装置、 20・・・情報登録手段、 30・・・索引情報管理手段、 40・・・索引情報格納装置、 41・・・索引情報テーブル、 50・・・検索情報入出力装置、 60・・・情報検索手段、 70・・・キーワード情報管理手段、 80・・・キーワード情報格納装置、 81・・・キーワード管理テーブルである。

Claims (1)

  1. 【特許請求の範囲】 不定長のキーワード文字列を用いた情報検索を行う情報
    検索システムにおけるキーワード管理方式において、 索引情報を登録するための登録索引情報およびキーワー
    ド文字列を取得する情報登録手段と、索引情報を検索し
    取得するための検索用キーワード文字列を取得する情報
    検索手段と、 キーワード文字列とそのキーワード文字列に対応するユ
    ニークなキーワード管理番号とをキーワード管理テーブ
    ルで管理し前記情報検索手段により取得された検索用キ
    ーワード文字列に対応するキーワード管理番号を取得す
    るキーワード情報管理手段と、 前記情報登録手段により取得されたキーワード文字列に
    対応するキーワード管理番号と前記情報登録手段により
    取得された登録索引情報とを索引情報テーブルで管理し
    前記情報検索手段により取得された検索用キーワード文
    字列に対応するキーワード管理番号に基づき索引情報を
    検索し取得する索引情報管理手段と を有することを特徴とするキーワード管理方式。
JP1010920A 1989-01-19 1989-01-19 キーワード管理方式 Pending JPH02190946A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1010920A JPH02190946A (ja) 1989-01-19 1989-01-19 キーワード管理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1010920A JPH02190946A (ja) 1989-01-19 1989-01-19 キーワード管理方式

Publications (1)

Publication Number Publication Date
JPH02190946A true JPH02190946A (ja) 1990-07-26

Family

ID=11763684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1010920A Pending JPH02190946A (ja) 1989-01-19 1989-01-19 キーワード管理方式

Country Status (1)

Country Link
JP (1) JPH02190946A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282829A (ja) * 2000-03-29 2001-10-12 Mitsubishi Electric Corp データベース検索装置及びデータベース検索方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60247732A (ja) * 1984-05-23 1985-12-07 Nec Corp デ−タ記憶装置
JPS63298626A (ja) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd デ−タベ−ス管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60247732A (ja) * 1984-05-23 1985-12-07 Nec Corp デ−タ記憶装置
JPS63298626A (ja) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd デ−タベ−ス管理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282829A (ja) * 2000-03-29 2001-10-12 Mitsubishi Electric Corp データベース検索装置及びデータベース検索方法

Similar Documents

Publication Publication Date Title
Faloutsos et al. Fast text access methods for optical and large magnetic disks: Designs and performance comparison
JP2001331509A (ja) リレーショナルデータベース処理装置、リレーショナルデータベースの処理方法及びリレーショナルデータベースの処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH02190946A (ja) キーワード管理方式
JP2015176407A (ja) 検索装置、検索方法、検索用プログラムおよび検索用データ構造
JP2007048318A (ja) リレーショナルデータベースの処理方法およびリレーショナルデータベース処理装置
JPH0773187A (ja) 検索システム
JPS62186361A (ja) 情報検索装置
US11809728B2 (en) Data storage method for massive datasets
JPH01241640A (ja) データベース装置及びデータベース管理方法
JPS63254523A (ja) キ−ワ−ド検索方法
JP3980326B2 (ja) データ管理方法およびコンピュータ読み取り可能な記録媒体
JPH04348468A (ja) データベース装置
White et al. A brief introduction to data storage and retrieval in MERLIN (MachinE Readable Library INformation)
JPH0728834A (ja) 情報検索装置
JPH06103134A (ja) インデックスの構築方法
JPS62247462A (ja) 情報フアイル装置
JPH04257062A (ja) ハッシュキューを用いるデータ処理装置
JPH01241674A (ja) 拡張文書管理装置
JPH04233664A (ja) データベース管理システム
JPH0447367A (ja) データベース検索方式
JPH05165891A (ja) データベースのデータ登録・検索方式
Walczuch et al. Using individual prefixes in B+-trees
JP2004318342A (ja) データベースシステム、データ処理方法及びデータベースプログラム
JPH02188873A (ja) 文書検索システム
JPH04337867A (ja) データベース検索システム