JPH07200622A - 情報管理システム - Google Patents

情報管理システム

Info

Publication number
JPH07200622A
JPH07200622A JP5336004A JP33600493A JPH07200622A JP H07200622 A JPH07200622 A JP H07200622A JP 5336004 A JP5336004 A JP 5336004A JP 33600493 A JP33600493 A JP 33600493A JP H07200622 A JPH07200622 A JP H07200622A
Authority
JP
Japan
Prior art keywords
character string
file
information source
keyword
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5336004A
Other languages
English (en)
Inventor
Fujio Ikegami
冨士雄 池上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5336004A priority Critical patent/JPH07200622A/ja
Publication of JPH07200622A publication Critical patent/JPH07200622A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、情報管理システムに関し、前方一
致する文字列を共通にして木構造で表現する際に、文字
列の各文字を分割して複数段構成にすると共に登録する
エントリのみを作成し、未登録部分の無駄な記憶容量を
削減して記憶容量を削減すると共に登録数に依存しない
高速検索を可能にすることを目的とする。 【構成】 登録対象の文字列の各文字を表すコードを複
数の部分コードに分割し、これらの各部分コードについ
て、先頭から一致する部分コードのポインタを順次辿
り、一致する部分コードが無くなったときに新たにエン
トリを作成して登録すると共にポインタでリンクするこ
とを繰り返し、文字列の最後の文字の最後の部分コード
に一意のキーワード番号を登録した木構造を持つキーワ
ード表現24を作成する登録手段21を備え、このキー
ワード番号に対応づけて文字列に関する情報を登録する
ように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報源自身の文字列や
情報源に含まれる文字列および情報源を管理する情報管
理システムに関するものである。
【0002】
【従来の技術】従来、文字列を検索する方法として「ト
ライ法」が知られている。この「トライ法」は、前方一
致する文字列を共通にして管理する木構成を持つもので
ある。例えば 文字列集合={happy、happiness、ha
ppen、harm、harmoney、harp、s
ad}は、下記のような木構造で表現する。
【0003】 検索時は、文字列の先頭から1文字づつ一致するものを
探し、一致したときに当該文字列が検索できたこととな
る。
【0004】
【発明が解決しようとする課題】上述したように従来の
「トライ法」は、前方一致する文字列を木構造に登録し
ておき、検索対象の文字列の先頭から1文字づつ一致す
るものを辿ることによって高速に文字列を検索できる。
しかし、各文字から順次分岐する全ての文字列に対応す
るエントリを準備(あるいは登録時に準備)する必要が
あり、記憶容量が極めて膨大となってしまうという問題
があった。
【0005】本発明は、これらの問題を解決するため、
前方一致する文字列を共通にして木構造で表現する際
に、文字列の各文字を分割して複数段構成にすると共に
登録するエントリのみを作成し、未登録部分の無駄な記
憶容量を削減して記憶容量を削減すると共に登録数に依
存しない高速検索を可能にすることを目的としている。
【0006】
【課題を解決するための手段】図1は、本発明の原理ブ
ロック図を示す。図1において、情報管理システム1
は、文字列を入力としてそのキーワード番号を生成した
り、文字列を含む情報源を出力したりするものであっ
て、文字列管理機能2および情報管理機能3から構成さ
れるものである。
【0007】文字列管理機能2は、キーワードとなる文
字列を入力として、当該文字列のキーワード番号を出力
するものであって、登録手段21、検索手段22、およ
び削除手段23から構成されるものである。
【0008】登録手段21は、入力された登録対象の文
字列をキーワード表現24に登録して付与した一意のキ
ーワード番号を出力するものである。検索手段22は、
入力された検索対象の文字列について、キーワード表現
24を検索して一致した文字列のキーワード番号を出力
するものである。
【0009】削除手段23は、入力された削除対象の文
字列について、キーワード表現24を検索して一致した
文字列のキーワード番号を削除するものである。キーワ
ード表現24は、文字列を複数の部分コードに分割し、
これらの各部分コードの先頭から共通するものを統合し
て異なったときに分岐した木構造で表現し、文字列に一
意のキーワード番号を登録するものである。
【0010】情報源管理機能3は、情報源を管理するも
のであり、ここでは、キーワード番号で表される文字列
を含む情報源を管理するものであって、登録手段31、
検索手段32、および削除手段33から構成されるもの
である。
【0011】登録手段31は、情報源自身の文字列およ
び情報源に含まれる文字列を登録するものである。検索
手段32は、キーワード番号をもとにキーマップファイ
ル34および情報源ファイル35を検索して当該キーワ
ード番号の文字列を含む情報源の情報(ファイル名、タ
イトルなど)を検索するものである。
【0012】削除手段33は、キーマップファイル34
および情報源ファイル35から情報源を削除するもので
ある。キーマップファイル34は、キーワード番号のエ
ントリに当該キーワード番号が情報源自身であるときに
ファイル番号342を設定および当該キーワード番号が
情報源に含まれる文字列であるときにその情報源のファ
イル番号に対応するビットを立てるビットマップ343
を設けたものである。
【0013】情報源ファイル35は、情報源の情報(フ
ァイル名、タイトルなど)を登録するものである。
【0014】
【作用】本発明は、図1に示すように、登録対象のキー
ワードの文字列の入力に対応して、登録手段21が当該
文字列の各文字を表すコードを複数の部分コードに分割
し、これらの各部分コードについて、先頭から一致する
部分コードのポインタを順次辿り、一致する部分コード
が無くなったときに新たにエントリを作成して登録する
と共にポインタでリンクすることを繰り返し、文字列の
最後の文字の最後の部分コードに一意のキーワード番号
を登録した木構造を持つキーワード表現24を作成し、
この登録した一意のキーワード番号に対応づけて文字列
に関する情報を登録するようにしている。
【0015】また、検索対象のキーワードの文字列の入
力に対応して、検索手段22が当該検索対象の文字列の
各文字を表すコードを複数の部分コードに分割し、これ
らの各部分コードについて、キーワード表現24の先頭
から一致する部分コードのポインタを順次辿り、一致す
る最後の部分コードに登録されているキーワード番号を
取り出し、当該キーワード番号に対応づけて登録されて
いる文字列に関する情報を出力するようにしている。
【0016】また、削除対象のキーワードの文字列の入
力に対応して、削除手段23が当該削除対象の文字列の
各文字を表すコードを複数の部分コードに分割し、これ
らの各部分コードについて、キーワード表現24の先頭
から一致する部分コードのポインタを順次辿り、一致す
る最後の部分コードに登録されているキーワード番号を
削除するようにしている。
【0017】また、情報源に含まれる文字列の登録指示
に対応して、登録手段31が当該情報源自身の文字列を
キーワード表現24に登録して一意のキーワード番号を
得た後、キーマップファイル34のこのキーワード番号
のエントリに、情報源ファイル35に新たに追加したエ
ントリの新しいファイル番号をファイル番号342とし
て登録およびこのファイル番号342の情報源ファイル
35に情報源に関する情報を書き込んだ後、情報源に含
まれる登録対象の1つあるいは複数の文字列を取り出
し、これら文字列をキーワード表現24に登録して一意
のキーワード番号をそれぞれ得た後、キーマップファイ
ル34のこれらのキーワード番号の各エントリのビット
マップ343に新しいファイル番号に対応するビットを
それぞれ立てるようにしている。
【0018】また、文字列を含む情報源の検索指示に対
応して、検索手段32が文字列をもとにキーワード表現
24からキーワード番号を得た後、キーマップファイル
34のこのキーワード番号のエントリのビットマップ3
43を取り出し、当該ビットマップ343のビットの立
っている全てのファイル番号の情報源ファイル35のエ
ントリに書き込まれている情報源に関する情報を取り出
して出力するようにしている。
【0019】また、文字列を含む情報源の削除指示に対
応して、削除手段33が情報源自身の文字列をもとにキ
ーワード表現24からキーワード番号を得た後、キーマ
ップファイル34のこのキーワード番号のエントリにフ
ァイル番号342が設定されていた場合にのみ、特定の
エントリに設定されていたファイル番号に対応する無効
ビットマップ341のビットを立て、当該ファイル番号
342の情報源を一括して無効にし、削除するようにし
ている。
【0020】従って、前方一致する文字列を共通にして
木構造のキーワード表現24する際に、検索文字列の各
文字を分割して複数段構成にすると共に登録するエント
リのみを作成し、未登録部分の無駄な記憶容量を削減し
て記憶容量を削減すると共に登録数に依存しない高速検
索を可能にすることが可能となる。また、キーマップフ
ァイル34にビットマップ343を設けて文字列の含ま
れる全ての情報源(ファイル番号)を設定したり、無効
ビットマップ341を設けて情報源の登録を一括して無
効にしたりすることが可能となる。
【0021】
【実施例】まず、図2から図6を用いて文字列をキーワ
ード表現24に登録、検索、および削除について詳細に
説明する。
【0022】図2は、キーワード表現の概念説明図を示
す。図2の(a)は、キーワード集合例を示す。このキ
ーワード集合例は、7個のキーワードの文字列である。
【0023】図2の(b)は、図2の(a)のキーワー
ド集合をキーワード表現とした様子を示す。このキーワ
ード表現は、前方一致する文字列を共通に登録したもの
である。ここで、#は文字列の最後である旨を表す記号
である。
【0024】本発明では、この図2の(b)の1バイト
で表現される文字を、ここでは、上位4ビットと下位4
ビットに分割し、2段階構成で図3に示すように登録し
て管理する。尚、2段階構成の他に任意に分割して任意
段数の構成にしてもよい。
【0025】図3は、本発明のキーワード表現例を示
す。これは、図2の1文字の文字コード(1バイト)の
上位4ビットを上位テーブルに登録し、下位4ビットを
下位テーブルに登録して2段階構成で管理する。この
際、開始点から登録しようとする文字列の先頭の文字を
上位4ビットと下位4ビットに分割し、上位4ビットを
上位テーブルに登録し、下位4ビットを下位テーブルに
登録してリンクすることを繰り返し、本発明の係るキー
ワード表現24を作成する。
【0026】以上のように、文字列をキーワード表現2
4に登録する際に、開始点から初めて先頭の1文字を上
位4ビットと下位4ビットに分割し、前方一致するコー
ドを共通にし、共通するものがなくなったときに新たに
上位テーブルあるいは下位テーブルにエントリを追加し
て登録すると共にポインタでリンクすることを文字列が
なくなるまで繰り返す。これにより、必要なエントリの
みを上位テーブルおよび下位テーブルに作成するのみで
よく、共通する部分を多くして新規に作成するエントリ
数を少なくして記憶容量を削減することが可能となる。
【0027】次に、図4のフローチャートを用いて図1
および図3の構成のもとで、文字列をキーワード表現2
4に登録するときの動作を詳細に説明する。図4におい
て、S1は、登録文字列を入力する。
【0028】S2は、登録文字列より1文字を取り出
す。S3は、1文字を上位ビットと下位ビットに分け
る。S4は、上位ビットで上位テーブルのエントリを指
す。これは、図3の開始点から初めて上位ビットで上位
テーブルの該当するエントリを指す。
【0029】S5は、S4で指した上位テーブルのエン
トリに下位テーブルのポインタがあるか判別する。YE
Sの場合には、S7に進む。一方、NOの場合には、S
6で下位テーブルを新規に作成しそのポインタを上位テ
ーブルのエントリに設定し、S7に進む。
【0030】S7は、下位ビットでその下位テーブルの
エントリを指す。以上のS2からS7によって、登録文
字列の先頭の1文字について上位ビットと下位ビットに
分け、上位ビットが指す上位テーブルを見つけ、この見
つけたエントリで下位テーブルの下位ビットを指すポイ
ンタがあるか判別し、ないときに下位テーブルにエント
リを追加して上位テーブルにそのポインタを設定する。
これにらにより、文字列の先頭の1文字がキーワード表
現24に登録されたこととなる。
【0031】S8は、登録文字列の終わりか判別する。
YESの場合には、S11に進む。NOの場合には、第
2番目以降の文字があると判明したので、S9に進む。
S9は、下位テーブルのエントリに次に続く上位テーブ
ルのポインタがあるか判別する。YESの場合には、S
2に戻り、繰り返す。NOの場合には、S10で上位テ
ーブルを新規に作成しそのポインタを下位テーブルのエ
ントリに設定し、S2に戻り、繰り返す。
【0032】以上のS1からS10によって、登録文字
列の1番目から最終文字まで1文字を上位ビットと下位
4ビットに分けて全てキーワード表現24に登録したこ
ととなる。
【0033】S11は、下位テーブルのエントリにキー
ワード番号があるか判別する。YESの場合には、キー
ワード番号が設定されていたので、S13で当該登録文
字列のキーワード番号を出力し、終了する。一方、NO
の場合には、キーワード番号が設定されていなかったの
で、S12で一意のキーワード番号を作成し、下位テー
ブルのエントリに設定し、S13で当該登録文字列のキ
ーワード番号を出力する。
【0034】以上のS1からS13によって、登録文字
列の各文字について上位4ビットと下位4ビットに分
け、これら上位ビットを上位テーブル、下位ビットを下
位テーブルになかったときに新規にエントリを作成して
登録およびリンクすることを繰り返し、全てがあったと
きにあるいは全てを登録したときに、設定されていたキ
ーワード番号あるいは設定した一意のキーワード番号を
出力する。これにより、文字列をキーワード表現24に
登録して一意のキーワード番号を出力することが可能と
なる。
【0035】次に、図5のフローチャートを用いて図1
および図3の構成のもとで、文字列のキーワード番号を
キーワード表現24から検索するときの動作を詳細に説
明する。
【0036】図5において、S21は、検索文字列を入
力する。S22は、検索文字列より1文字を取り出す。
S23は、1文字を上位ビットと下位ビットに分ける。
【0037】S24は、上位ビットで上位テーブルのエ
ントリを指す。これは、図3の開始点から初めて上位ビ
ットで上位テーブルの該当するエントリを指す。S25
は、S24で指した上位テーブルのエントリに下位テー
ブルのポインタがあるか判別する。YESの場合には、
S26に進む。一方、NOの場合には、S29でキーワ
ード番号を零として出力し、見つからずとして終了す
る。
【0038】S26は、下位ビットでその下位テーブル
のエントリを指す。S27は、検索文字列の終わりか判
別する。YESの場合には、S30で下位テーブルのエ
ントリにキーワード番号があるか判別し、YESのとき
にS31でそのキーワード番号を出力し、NOのときに
S29でキーワード番号を零として出力する。一方、N
Oの場合には、S28で下位テーブルのエントリに次に
続く上位テーブルのポインタがあるか判別し、YESの
ときにS22に戻って繰り返し、NOのときにS29で
キーワード番号を零として出力する。
【0039】以上のS21からS31によって、検索文
字列の各文字について上位4ビットと下位4ビットに分
け、これら上位ビットを上位テーブル、下位ビットを下
位テーブルを辿り、全てがあったときに設定されていた
キーワード番号を出力する。これにより、文字列につい
てキーワード表現24を検索してキーワード番号を出力
することが可能となる。
【0040】次に、図6のフローチャートを用いて図1
および図3の構成のもとで、文字列をキーワード表現2
4から削除するときの動作を詳細に説明する。図6にお
いて、S41は、削除文字列を入力する。
【0041】S42は、削除文字列より1文字を取り出
す。S43は、1文字を上位ビットと下位ビットに分け
る。S44は、上位ビットで上位テーブルのエントリを
指す。これは、図3の開始点から初めて上位ビットで上
位テーブルの該当するエントリを指す。
【0042】S45は、S44で指した上位テーブルの
エントリに下位テーブルのポインタがあるか判別する。
YESの場合には、S46に進む。一方、NOの場合に
は、削除対象の文字列がないと判明したので、終了す
る。
【0043】S46は、下位ビットでその下位テーブル
のエントリを指す。S47は、削除文字列の終わりか判
別する。YESの場合には、S49で下位テーブルのエ
ントリにキーワード番号があるか判別し、YESのとき
にS50でそのキーワード番号を消し、NOのときは消
すキーワード番号がないと判明したので終了する。一
方、NOの場合には、S48で下位テーブルのエントリ
に次に続く上位テーブルのポインタがあるか判別し、Y
ESのときにS42に戻って繰り返し、NOのときは終
了する。
【0044】以上のS41からS50によって、削除文
字列の各文字について上位4ビットと下位4ビットに分
け、これら上位ビットを上位テーブル、下位ビットを下
位テーブルを辿り、全てがあったときに設定されていた
キーワード番号を消す。これにより、文字列についてキ
ーワード表現24を検索して文字列を削除することが可
能となる。
【0045】次に、図7から図10を用いて、図1およ
び図3の構成のもとで、情報源を登録、更新、検索、削
除するときの動作を詳細に説明する。図7は、本発明の
キーファイルと情報源ファイル例を示す。
【0046】図7の(a)は、全体の要部構成図を示
す。ここで、文字列管理機能2およびキーワード表現2
4は、図1、図3から図6によって説明したので省略す
る。図7の(a)において、キーマップファイル34
は、文字列のキーワード番号に対応づけて無効ビットマ
ップ341、あるいはファイル番号342とビットマッ
プ343を設定するものである。
【0047】情報源ファイル35は、情報源の情報(情
報源のファイル名、タイトルなど)を書き込むものであ
る。図7の(b)は、キーファイルの構成例を示す。
【0048】・ここでは、キーワード番号“0”のエン
トリに、無効ビットマップ341を設定する。この無効
ビットマップ341は、情報源ファイル35の数に対応
するビットを持ったものであって、ビットが立ったファ
イル番号に対応する情報源ファイル35が無効である旨
を設定するためのものである。
【0049】・キーワード番号“0”以外のエントリ
に、ファイル番号342およびビットマップ343を設
定する。このファイル番号342は、ファイル名自身を
キーワードとして登録した場合、そのファイル番号を設
定するものであって、情報源のファイル名自身と、それ
以外の当該情報源に含まれる文字列とを区別するための
ものである。ビットマップ343は、情報源に含まれる
文字列の場合に、いずれのファイル番号の情報源に含ま
れているかを設定するためのものであって、情報源のフ
ァイル数分のビットを設けたものである。
【0050】図7の(c)は、情報源ファイルの構造例
を示す。・ここでは、情報源の名前および情報源のタイ
トルなどの簡素な説明を書き込む。
【0051】次に、図8のフローチャートに示す順序に
従い、図7の構成のもとで、情報の登録・更新するとき
の動作を詳細に説明する。図8において、S61は、登
録・更新ファイル名(情報源)自身を文字列として登録
し、キーワード番号を得る。これは、登録・更新ファイ
ル名(情報源)自身を文字列として、既述した図4のフ
ローチャートに従い、キーワード表現24に登録し、キ
ーワード番号を得る。
【0052】S62は、キーワード番号でキーマップフ
ァイル34のエントリを得る。S63は、キーマップフ
ァイル34のエントリを得る。S64は、無効ビットマ
ップ341に対し、ファイル番号に対応する位置のビッ
トを立てる。これは、S63で得たエントリに設定され
ていたファイル番号342について、キーワード番号0
のキーマップファイル34のエントリ内の無効ビットマ
ップ341の当該ファイル番号342のビットを立てて
無効にする。
【0053】S65は、情報源ファイル35に1つのエ
ントリを最後に追加することにより、新しいファイル番
号を得る。S66は、ビットマップファイル34のエン
トリ(S62で得たエントリ)に新しいファイル番号を
設定する。
【0054】S67は、登録・更新ファイルより登録す
る文字列を取り出す。これは、登録・更新ファイル(情
報源)に含まれる登録する文字列を取り出す。S68
は、S67で取り出した文字列をキーワード表現24に
登録しキーワード番号を得る。
【0055】S69は、キーワード番号がキーマップフ
ァイル34の最大エントリを越えたか判別する。YES
の場合には、S70でそのキーワード番号に対応するエ
ントリをキーマップファイル34の最後に追加し初期化
(0クリア)し、S71に進む。一方、NOの場合に
は、S71に進む。
【0056】S71は、キーマップファイル34のエン
トリのビットマップ343にファイル番号に対応したビ
ットを立てる。これにより、キーワード番号の文字列が
ビットを立てたファイル番号の情報源(登録・更新ファ
イル)内に含まれることを登録したこととなる。
【0057】S72は、登録する文字列が未だ有るか判
別する。YESの場合には、S67に戻り、次の文字列
について繰り返す。NOの場合には、全て登録したの
で、S73に進む。
【0058】S73は、情報源ファイル35の追加した
エントリに、ファイル名、タイトルなどの情報を書き込
む。以上によって、登録・更新ファイル名(情報源)自
身を文字列として得たキーワード番号のキーマップファ
イル34のエントリにファイル番号342を設定および
このファイル番号342の情報源ファイル35に情報源
の名前やタイトルなどを登録すると共に、当該登録・更
新ファイル名(情報源)に含まれる文字列のキーワード
番号のキーマップファイル34のエントリのビットマッ
プ343のファイル番号のビットを立てて含まれる文字
列であることを登録する。これらにより、情報源自身お
よび当該情報源に含まれるキーワードとなる文字列を登
録したこととなる。
【0059】次に、図9のフローチャートに示す順序に
従い、図8で登録したキーマップファイル34および情
報源ファイル35をもとに、文字列を含む情報源に関す
る情報(ファイル名、タイトルなど)を検索するときの
動作を詳細に説明する。
【0060】図9において、S81は、検索文字列を入
力する。S82は、文字列検索を行い、キーワード番号
を得る。これは、既述した図5のフローチャートに従
い、文字列についてキーワード表現24を検索して一致
する文字列のキーワード番号を得る。
【0061】S83は、S82でキーワード番号が見つ
かったか判別する。YESの場合には、S84に進む。
NOの場合には、キーワード表現24を検索して一致す
る文字列のキーワード番号が見つからないと判明したの
で、終了する。
【0062】S84は、キーワード番号でキーマップフ
ァイル34のエントリを得る。S85は、ビットマップ
343を作業用マップへ移し、無効ビットマップで作業
用マップの対応するビットを消す。
【0063】S86は、作業用マップで立っているビッ
トを1つ取り出しファイル番号へ変換する。S87は、
ファイル番号で情報源ファイル35の該当エントリを得
て、そのエントリの内容(情報源の名前やタイトルな
ど)を出力する。
【0064】S88は、作業用マップで今処理したビッ
トを消す。S89は、作業用マップに未だビットが立っ
ているか判別する。YESの場合には、S86以降を繰
り返す。NOの場合には、キーマップファイル34のエ
ントリ内のビットマップ343のビットの立っている全
てのファイル番号の情報源ファイル35のエントリの内
容(情報源の名前やタイトルなど)を出力したので終了
する。
【0065】以上によって、検索文字列を入力すること
により、検索文字列を含む全ての情報源に関する情報
(情報源の名前やタイトルなど)を検索して出力するこ
とが可能となる。
【0066】次に、図10のフローチャートに示す順序
に従い、情報を削除する場合の動作を詳細に説明する。
図10において、S91は、情報源(ファイル名)自身
を文字列として検索する。これは、情報源(ファイル
名)自身を文字列として、キーワード表現24を検索し
て一致する文字列のキーワード番号を取り出そうとす
る。
【0067】S92は、見つかったか判別する。YES
の場合には、キーワード表現24から一致する文字列が
見つかったので、そのキーワード番号を取り出す。一
方、NOの場合には、キーワード表現24から一致する
文字列が見つからなかったので、当該文字列の情報源は
登録されていないので、終了する。
【0068】S93は、見つけたキーワード番号でキー
マップファイル34のエントリを得る。S94は、S9
3で得たエントリにファイル番号があるか判別する。Y
ESの場合には、情報源のファイル番号が設定されてい
たので、S95で無効ビットマップでファイル番号に対
応するビットを立て、無効化する。一方、NOの場合に
は、エントリにファイル番号が設定されていなく、情報
の削除指示のあった文字列が情報源の文字列以外である
と判明したので、終了する。
【0069】以上によって、情報源(ファイル名)自身
を文字列としてキーワード番号を得て、情報源を一括し
て無効化することが可能となる。
【0070】
【発明の効果】以上説明したように、本発明によれば、
前方一致する文字列を共通にして木構造のキーワード表
現24する際に、検索文字列の各文字を分割して複数段
構成にすると共に登録するエントリのみを作成する構成
を採用しているため、未登録部分の無駄な記憶容量を削
減して記憶容量を削減すると共に登録数に依存しない高
速検索することができる。また、キーマップファイル3
4にビットマップ343を設けて文字列を含む全ての情
報源(ファイル番号)を設定したり、無効ビットマップ
341を設けて情報源を一括して無効にしたり、ファイ
ル番号342を設けて文字列が情報源(ファイル名)を
表すことを設定し、文字列から情報源のファイル番号を
検索したり、文字列を含む情報源のファイル番号を検索
したりの両者を同一システムで行なうことができる。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】キーワード表現の概念説明図である。
【図3】本発明のキーワード表現例である。
【図4】本発明の文字列の登録フローチャートである。
【図5】本発明の文字列の検索フローチャートである。
【図6】本発明の文字列の削除フローチャートである。
【図7】本発明のキーマップファイルと情報源ファイル
例である。
【図8】本発明の情報の登録・更新フローチャートであ
る。
【図9】本発明の情報の検索フローチャートである。
【図10】本発明の情報の削除フローチャートである。
【符号の説明】
1:情報管理システム 2:文字列管理機能 21:登録手段 22:検索手段 23:削除手段 24:キーワード表現 3:情報源管理機能 31:登録手段 32:検索手段 33:削除手段 34:キーマップファイル 341:無効ビットマップ 342:ファイル番号 343:ビットマップ 35:情報源ファイル

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】文字列を登録する情報管理システムにおい
    て、 登録対象の文字列の各文字を表すコードを複数の部分コ
    ードに分割し、これらの各部分コードについて、先頭か
    ら一致する部分コードのポインタを順次辿り、一致する
    部分コードが無くなったときに新たにエントリを作成し
    て登録すると共にポインタでリンクすることを繰り返
    し、文字列の最後の文字の最後の部分コードに一意のキ
    ーワード番号を登録した木構造を持つキーワード表現
    (24)を作成する登録手段(21)を備え、 このキーワード番号に対応づけて文字列に関する情報を
    登録するように構成したことを特徴とする情報管理シス
    テム。
  2. 【請求項2】文字列を検索する情報管理システムにおい
    て、 検索対象の文字列の各文字を表すコードを複数の部分コ
    ードに分割し、これらの各部分コードについて、上記キ
    ーワード表現(24)の先頭から一致する部分コードの
    ポインタを順次辿り、一致する最後の部分コードに登録
    されているキーワード番号を取り出す検索手段(22)
    を備え、 このキーワード番号に対応づけて登録されている文字列
    に関する情報を出力するように構成したことを特徴とす
    る情報管理システム。
  3. 【請求項3】文字列を削除する情報管理システムにおい
    て、 削除対象の文字列の各文字を表すコードを複数の部分コ
    ードに分割し、これらの各部分コードについて、上記キ
    ーワード表現(24)の先頭から一致する部分コードの
    ポインタを順次辿り、一致する最後の部分コードに登録
    されているキーワード番号を削除する削除手段(23)
    を備えたことを特徴とする情報管理システム。
  4. 【請求項4】情報源に含まれる文字列を登録する情報管
    理システムにおいて、 情報源ファイル名自身の文字列あるいは情報源に含まれ
    る文字列のキーワード番号のエントリに、当該キーワー
    ド番号が情報源自身であるときにファイル番号(34
    2)を設定および当該キーワード番号が情報源に含まれ
    る文字列であるときにその情報源のファイル番号に対応
    するビットを立てるビットマップ(343)を設けたキ
    ーマップファイル(34)と、 ファイル番号のエントリに、当該ファイル番号の情報源
    に関する情報を書き込む情報源ファイル(35)と、 情報源に含まれる文字列の登録指示に対応して、情報源
    自身の文字列を請求項1によってキーワード表現(2
    4)に登録して一意のキーワード番号を得た後、上記キ
    ーマップファイル(34)のこのキーワード番号のエン
    トリに、情報源ファイル(35)に新たに追加したエン
    トリの新しいファイル番号をファイル番号(342)と
    して設定およびファイル番号の情報源ファイル(35)
    に情報源に関する情報を書き込んだ後、上記情報源に含
    まれる登録しようとする1つあるいは複数の文字列を取
    り出し、これら文字列を請求項1によってキーワード表
    現(24)に登録して一意のキーワード番号をそれぞれ
    得た後、上記キーマップファイル(34)のこれらのキ
    ーワード番号の各エントリのビットマップ(343)に
    上記新しいファイル番号に対応するビットをそれぞれ立
    てる登録手段(31)とを備えたことを特徴とする情報
    管理システム。
  5. 【請求項5】文字列を含む情報源を検索する情報管理シ
    ステムにおいて、 情報源自身の文字列あるいは情報源に含まれる文字列の
    キーワード番号のエントリに、当該キーワード番号が情
    報源自身であるときにファイル番号(342)を設定お
    よび当該キーワード番号が情報源に含まれる文字列であ
    るときにその情報源のファイル番号に対応するビットを
    立てるビットマップ(343)を設けたキーマップファ
    イル(34)と、 ファイル番号のエントリに、当該ファイル番号の情報源
    に関する情報を書き込む情報源ファイル(35)と、 文字列を含む情報源の検索指示に対応して、文字列を請
    求項2によってキーワード表現(24)からキーワード
    番号を得た後、上記キーマップファイル(34)のこの
    キーワード番号のエントリのビットマップ(343)を
    取り出し、当該ビットマップ(343)から無効ビット
    マップ(341)を取除いたビットの立っている全ての
    ファイル番号の情報源ファイル(35)のエントリに書
    き込まれている情報源に関する情報を取り出して出力す
    る検索手段(32)とを備えたことを特徴とする情報管
    理システム。
  6. 【請求項6】文字列を含む情報源を削除する情報管理シ
    ステムにおいて、 情報源自身の文字列あるいは情報源に含まれる文字列の
    キーワード番号のエントリに、当該キーワード番号が情
    報源自身であるときにファイル番号(342)を設定お
    よび当該キーワード番号が情報源に含まれる文字列であ
    るときにその情報源のファイル番号に対応するビットを
    立てるビットマップ(343)を設けたキーマップファ
    イル(34)と、 ファイル番号のエントリに、当該ファイル番号の情報源
    に関する情報を書き込む情報源ファイル(35)と、 文字列を含む情報源の削除指示に対応して、情報源自身
    の文字列を請求項2によってキーワード表現(24)か
    らキーワード番号を得た後、上記キーマップファイル
    (34)のこのキーワード番号のエントリにファイル番
    号が設定されていた場合にのみ、当該設定されていたフ
    ァイル番号に対応する無効ビットマップ(341)のビ
    ットを立て、ファイル番号(342)の情報源を無効に
    して削除する削除手段(33)とを備えたことを特徴と
    する情報管理システム。
JP5336004A 1993-12-28 1993-12-28 情報管理システム Withdrawn JPH07200622A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5336004A JPH07200622A (ja) 1993-12-28 1993-12-28 情報管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5336004A JPH07200622A (ja) 1993-12-28 1993-12-28 情報管理システム

Publications (1)

Publication Number Publication Date
JPH07200622A true JPH07200622A (ja) 1995-08-04

Family

ID=18294705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5336004A Withdrawn JPH07200622A (ja) 1993-12-28 1993-12-28 情報管理システム

Country Status (1)

Country Link
JP (1) JPH07200622A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150751A (ja) * 2011-01-21 2012-08-09 Bank Of Tokyo-Mitsubishi Ufj Ltd 検索装置
JP2013149269A (ja) * 2013-03-28 2013-08-01 Bank Of Tokyo-Mitsubishi Ufj Ltd 検索装置
JP5521064B1 (ja) * 2013-01-22 2014-06-11 日本電信電話株式会社 Id付与装置、方法、及びプログラム
JP2015062146A (ja) * 2015-01-05 2015-04-02 富士通株式会社 情報生成プログラム、情報生成装置、および情報生成方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150751A (ja) * 2011-01-21 2012-08-09 Bank Of Tokyo-Mitsubishi Ufj Ltd 検索装置
JP5521064B1 (ja) * 2013-01-22 2014-06-11 日本電信電話株式会社 Id付与装置、方法、及びプログラム
JP2013149269A (ja) * 2013-03-28 2013-08-01 Bank Of Tokyo-Mitsubishi Ufj Ltd 検索装置
JP2015062146A (ja) * 2015-01-05 2015-04-02 富士通株式会社 情報生成プログラム、情報生成装置、および情報生成方法

Similar Documents

Publication Publication Date Title
US5745745A (en) Text search method and apparatus for structured documents
JP3672242B2 (ja) パターン検索方法、パターン検索装置、コンピュータプログラム及び記憶媒体
US5799299A (en) Data processing system, data retrieval system, data processing method and data retrieval method
US6496820B1 (en) Method and search method for structured documents
US7526497B2 (en) Database retrieval apparatus, retrieval method, storage medium, and program
JPH11212980A (ja) インデクス作成方法および検索方法
JPH0675989A (ja) 概念辞書管理装置
CN102867049A (zh) 一种基于单词查找树实现的汉语拼音快速分词方法
JP2669601B2 (ja) 情報検索方法及びシステム
JP3258063B2 (ja) データベース検索システム及び方法
JPH08329116A (ja) 構造化文書検索方法
JPH07200622A (ja) 情報管理システム
JP2002202973A (ja) 構造化文書管理装置
CN112182030A (zh) 专利文献检索方法、电子设备及计算机可读存储介质
JP2962287B2 (ja) 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体
JP3288063B2 (ja) 可変長データの格納および参照システム
JP2007011438A (ja) 絞り込み検索用インデクス構造及び情報検索装置
US7840583B2 (en) Search device and recording medium
JPH05181913A (ja) 昇順整数列データの圧縮および復号システム
JP2009301511A (ja) 索引情報作成装置、索引情報作成方法及びプログラム
JPH09305619A (ja) 階層インデックス検索装置、及び文書検索方法
JPH09212523A (ja) 全文検索方法
JPS59100939A (ja) 日本語入力装置
JPH05225248A (ja) データベース検索システム
JPH11161666A (ja) ドキュメントデータ検索方法および装置、並びにドキュメント編集装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010306