JPH07200622A

JPH07200622A - 情報管理システム

Info

Publication number: JPH07200622A
Application number: JP5336004A
Authority: JP
Inventors: Fujio Ikegami; 冨士雄池上
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1993-12-28
Filing date: 1993-12-28
Publication date: 1995-08-04

Abstract

(57)【要約】【目的】本発明は、情報管理システムに関し、前方一
致する文字列を共通にして木構造で表現する際に、文字
列の各文字を分割して複数段構成にすると共に登録する
エントリのみを作成し、未登録部分の無駄な記憶容量を
削減して記憶容量を削減すると共に登録数に依存しない
高速検索を可能にすることを目的とする。【構成】登録対象の文字列の各文字を表すコードを複
数の部分コードに分割し、これらの各部分コードについ
て、先頭から一致する部分コードのポインタを順次辿
り、一致する部分コードが無くなったときに新たにエン
トリを作成して登録すると共にポインタでリンクするこ
とを繰り返し、文字列の最後の文字の最後の部分コード
に一意のキーワード番号を登録した木構造を持つキーワ
ード表現２４を作成する登録手段２１を備え、このキー
ワード番号に対応づけて文字列に関する情報を登録する
ように構成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、情報源自身の文字列や
情報源に含まれる文字列および情報源を管理する情報管
理システムに関するものである。

【０００２】

【従来の技術】従来、文字列を検索する方法として「ト
ライ法」が知られている。この「トライ法」は、前方一
致する文字列を共通にして管理する木構成を持つもので
ある。例えば文字列集合＝｛ｈａｐｐｙ、ｈａｐｐｉｎｅｓｓ、ｈａ
ｐｐｅｎ、ｈａｒｍ、ｈａｒｍｏｎｅｙ、ｈａｒｐ、ｓ
ａｄ｝は、下記のような木構造で表現する。

【０００３】検索時は、文字列の先頭から１文字づつ一致するものを
探し、一致したときに当該文字列が検索できたこととな
る。

【０００４】

【発明が解決しようとする課題】上述したように従来の
「トライ法」は、前方一致する文字列を木構造に登録し
ておき、検索対象の文字列の先頭から１文字づつ一致す
るものを辿ることによって高速に文字列を検索できる。
しかし、各文字から順次分岐する全ての文字列に対応す
るエントリを準備（あるいは登録時に準備）する必要が
あり、記憶容量が極めて膨大となってしまうという問題
があった。

【０００５】本発明は、これらの問題を解決するため、
前方一致する文字列を共通にして木構造で表現する際
に、文字列の各文字を分割して複数段構成にすると共に
登録するエントリのみを作成し、未登録部分の無駄な記
憶容量を削減して記憶容量を削減すると共に登録数に依
存しない高速検索を可能にすることを目的としている。

【０００６】

【課題を解決するための手段】図１は、本発明の原理ブ
ロック図を示す。図１において、情報管理システム１
は、文字列を入力としてそのキーワード番号を生成した
り、文字列を含む情報源を出力したりするものであっ
て、文字列管理機能２および情報管理機能３から構成さ
れるものである。

【０００７】文字列管理機能２は、キーワードとなる文
字列を入力として、当該文字列のキーワード番号を出力
するものであって、登録手段２１、検索手段２２、およ
び削除手段２３から構成されるものである。

【０００８】登録手段２１は、入力された登録対象の文
字列をキーワード表現２４に登録して付与した一意のキ
ーワード番号を出力するものである。検索手段２２は、
入力された検索対象の文字列について、キーワード表現
２４を検索して一致した文字列のキーワード番号を出力
するものである。

【０００９】削除手段２３は、入力された削除対象の文
字列について、キーワード表現２４を検索して一致した
文字列のキーワード番号を削除するものである。キーワ
ード表現２４は、文字列を複数の部分コードに分割し、
これらの各部分コードの先頭から共通するものを統合し
て異なったときに分岐した木構造で表現し、文字列に一
意のキーワード番号を登録するものである。

【００１０】情報源管理機能３は、情報源を管理するも
のであり、ここでは、キーワード番号で表される文字列
を含む情報源を管理するものであって、登録手段３１、
検索手段３２、および削除手段３３から構成されるもの
である。

【００１１】登録手段３１は、情報源自身の文字列およ
び情報源に含まれる文字列を登録するものである。検索
手段３２は、キーワード番号をもとにキーマップファイ
ル３４および情報源ファイル３５を検索して当該キーワ
ード番号の文字列を含む情報源の情報（ファイル名、タ
イトルなど）を検索するものである。

【００１２】削除手段３３は、キーマップファイル３４
および情報源ファイル３５から情報源を削除するもので
ある。キーマップファイル３４は、キーワード番号のエ
ントリに当該キーワード番号が情報源自身であるときに
ファイル番号３４２を設定および当該キーワード番号が
情報源に含まれる文字列であるときにその情報源のファ
イル番号に対応するビットを立てるビットマップ３４３
を設けたものである。

【００１３】情報源ファイル３５は、情報源の情報（フ
ァイル名、タイトルなど）を登録するものである。

【００１４】

【作用】本発明は、図１に示すように、登録対象のキー
ワードの文字列の入力に対応して、登録手段２１が当該
文字列の各文字を表すコードを複数の部分コードに分割
し、これらの各部分コードについて、先頭から一致する
部分コードのポインタを順次辿り、一致する部分コード
が無くなったときに新たにエントリを作成して登録する
と共にポインタでリンクすることを繰り返し、文字列の
最後の文字の最後の部分コードに一意のキーワード番号
を登録した木構造を持つキーワード表現２４を作成し、
この登録した一意のキーワード番号に対応づけて文字列
に関する情報を登録するようにしている。

【００１５】また、検索対象のキーワードの文字列の入
力に対応して、検索手段２２が当該検索対象の文字列の
各文字を表すコードを複数の部分コードに分割し、これ
らの各部分コードについて、キーワード表現２４の先頭
から一致する部分コードのポインタを順次辿り、一致す
る最後の部分コードに登録されているキーワード番号を
取り出し、当該キーワード番号に対応づけて登録されて
いる文字列に関する情報を出力するようにしている。

【００１６】また、削除対象のキーワードの文字列の入
力に対応して、削除手段２３が当該削除対象の文字列の
各文字を表すコードを複数の部分コードに分割し、これ
らの各部分コードについて、キーワード表現２４の先頭
から一致する部分コードのポインタを順次辿り、一致す
る最後の部分コードに登録されているキーワード番号を
削除するようにしている。

【００１７】また、情報源に含まれる文字列の登録指示
に対応して、登録手段３１が当該情報源自身の文字列を
キーワード表現２４に登録して一意のキーワード番号を
得た後、キーマップファイル３４のこのキーワード番号
のエントリに、情報源ファイル３５に新たに追加したエ
ントリの新しいファイル番号をファイル番号３４２とし
て登録およびこのファイル番号３４２の情報源ファイル
３５に情報源に関する情報を書き込んだ後、情報源に含
まれる登録対象の１つあるいは複数の文字列を取り出
し、これら文字列をキーワード表現２４に登録して一意
のキーワード番号をそれぞれ得た後、キーマップファイ
ル３４のこれらのキーワード番号の各エントリのビット
マップ３４３に新しいファイル番号に対応するビットを
それぞれ立てるようにしている。

【００１８】また、文字列を含む情報源の検索指示に対
応して、検索手段３２が文字列をもとにキーワード表現
２４からキーワード番号を得た後、キーマップファイル
３４のこのキーワード番号のエントリのビットマップ３
４３を取り出し、当該ビットマップ３４３のビットの立
っている全てのファイル番号の情報源ファイル３５のエ
ントリに書き込まれている情報源に関する情報を取り出
して出力するようにしている。

【００１９】また、文字列を含む情報源の削除指示に対
応して、削除手段３３が情報源自身の文字列をもとにキ
ーワード表現２４からキーワード番号を得た後、キーマ
ップファイル３４のこのキーワード番号のエントリにフ
ァイル番号３４２が設定されていた場合にのみ、特定の
エントリに設定されていたファイル番号に対応する無効
ビットマップ３４１のビットを立て、当該ファイル番号
３４２の情報源を一括して無効にし、削除するようにし
ている。

【００２０】従って、前方一致する文字列を共通にして
木構造のキーワード表現２４する際に、検索文字列の各
文字を分割して複数段構成にすると共に登録するエント
リのみを作成し、未登録部分の無駄な記憶容量を削減し
て記憶容量を削減すると共に登録数に依存しない高速検
索を可能にすることが可能となる。また、キーマップフ
ァイル３４にビットマップ３４３を設けて文字列の含ま
れる全ての情報源（ファイル番号）を設定したり、無効
ビットマップ３４１を設けて情報源の登録を一括して無
効にしたりすることが可能となる。

【００２１】

【実施例】まず、図２から図６を用いて文字列をキーワ
ード表現２４に登録、検索、および削除について詳細に
説明する。

【００２２】図２は、キーワード表現の概念説明図を示
す。図２の（ａ）は、キーワード集合例を示す。このキ
ーワード集合例は、７個のキーワードの文字列である。

【００２３】図２の（ｂ）は、図２の（ａ）のキーワー
ド集合をキーワード表現とした様子を示す。このキーワ
ード表現は、前方一致する文字列を共通に登録したもの
である。ここで、＃は文字列の最後である旨を表す記号
である。

【００２４】本発明では、この図２の（ｂ）の１バイト
で表現される文字を、ここでは、上位４ビットと下位４
ビットに分割し、２段階構成で図３に示すように登録し
て管理する。尚、２段階構成の他に任意に分割して任意
段数の構成にしてもよい。

【００２５】図３は、本発明のキーワード表現例を示
す。これは、図２の１文字の文字コード（１バイト）の
上位４ビットを上位テーブルに登録し、下位４ビットを
下位テーブルに登録して２段階構成で管理する。この
際、開始点から登録しようとする文字列の先頭の文字を
上位４ビットと下位４ビットに分割し、上位４ビットを
上位テーブルに登録し、下位４ビットを下位テーブルに
登録してリンクすることを繰り返し、本発明の係るキー
ワード表現２４を作成する。

【００２６】以上のように、文字列をキーワード表現２
４に登録する際に、開始点から初めて先頭の１文字を上
位４ビットと下位４ビットに分割し、前方一致するコー
ドを共通にし、共通するものがなくなったときに新たに
上位テーブルあるいは下位テーブルにエントリを追加し
て登録すると共にポインタでリンクすることを文字列が
なくなるまで繰り返す。これにより、必要なエントリの
みを上位テーブルおよび下位テーブルに作成するのみで
よく、共通する部分を多くして新規に作成するエントリ
数を少なくして記憶容量を削減することが可能となる。

【００２７】次に、図４のフローチャートを用いて図１
および図３の構成のもとで、文字列をキーワード表現２
４に登録するときの動作を詳細に説明する。図４におい
て、Ｓ１は、登録文字列を入力する。

【００２８】Ｓ２は、登録文字列より１文字を取り出
す。Ｓ３は、１文字を上位ビットと下位ビットに分け
る。Ｓ４は、上位ビットで上位テーブルのエントリを指
す。これは、図３の開始点から初めて上位ビットで上位
テーブルの該当するエントリを指す。

【００２９】Ｓ５は、Ｓ４で指した上位テーブルのエン
トリに下位テーブルのポインタがあるか判別する。ＹＥ
Ｓの場合には、Ｓ７に進む。一方、ＮＯの場合には、Ｓ
６で下位テーブルを新規に作成しそのポインタを上位テ
ーブルのエントリに設定し、Ｓ７に進む。

【００３０】Ｓ７は、下位ビットでその下位テーブルの
エントリを指す。以上のＳ２からＳ７によって、登録文
字列の先頭の１文字について上位ビットと下位ビットに
分け、上位ビットが指す上位テーブルを見つけ、この見
つけたエントリで下位テーブルの下位ビットを指すポイ
ンタがあるか判別し、ないときに下位テーブルにエント
リを追加して上位テーブルにそのポインタを設定する。
これにらにより、文字列の先頭の１文字がキーワード表
現２４に登録されたこととなる。

【００３１】Ｓ８は、登録文字列の終わりか判別する。
ＹＥＳの場合には、Ｓ１１に進む。ＮＯの場合には、第
２番目以降の文字があると判明したので、Ｓ９に進む。
Ｓ９は、下位テーブルのエントリに次に続く上位テーブ
ルのポインタがあるか判別する。ＹＥＳの場合には、Ｓ
２に戻り、繰り返す。ＮＯの場合には、Ｓ１０で上位テ
ーブルを新規に作成しそのポインタを下位テーブルのエ
ントリに設定し、Ｓ２に戻り、繰り返す。

【００３２】以上のＳ１からＳ１０によって、登録文字
列の１番目から最終文字まで１文字を上位ビットと下位
４ビットに分けて全てキーワード表現２４に登録したこ
ととなる。

【００３３】Ｓ１１は、下位テーブルのエントリにキー
ワード番号があるか判別する。ＹＥＳの場合には、キー
ワード番号が設定されていたので、Ｓ１３で当該登録文
字列のキーワード番号を出力し、終了する。一方、ＮＯ
の場合には、キーワード番号が設定されていなかったの
で、Ｓ１２で一意のキーワード番号を作成し、下位テー
ブルのエントリに設定し、Ｓ１３で当該登録文字列のキ
ーワード番号を出力する。

【００３４】以上のＳ１からＳ１３によって、登録文字
列の各文字について上位４ビットと下位４ビットに分
け、これら上位ビットを上位テーブル、下位ビットを下
位テーブルになかったときに新規にエントリを作成して
登録およびリンクすることを繰り返し、全てがあったと
きにあるいは全てを登録したときに、設定されていたキ
ーワード番号あるいは設定した一意のキーワード番号を
出力する。これにより、文字列をキーワード表現２４に
登録して一意のキーワード番号を出力することが可能と
なる。

【００３５】次に、図５のフローチャートを用いて図１
および図３の構成のもとで、文字列のキーワード番号を
キーワード表現２４から検索するときの動作を詳細に説
明する。

【００３６】図５において、Ｓ２１は、検索文字列を入
力する。Ｓ２２は、検索文字列より１文字を取り出す。
Ｓ２３は、１文字を上位ビットと下位ビットに分ける。

【００３７】Ｓ２４は、上位ビットで上位テーブルのエ
ントリを指す。これは、図３の開始点から初めて上位ビ
ットで上位テーブルの該当するエントリを指す。Ｓ２５
は、Ｓ２４で指した上位テーブルのエントリに下位テー
ブルのポインタがあるか判別する。ＹＥＳの場合には、
Ｓ２６に進む。一方、ＮＯの場合には、Ｓ２９でキーワ
ード番号を零として出力し、見つからずとして終了す
る。

【００３８】Ｓ２６は、下位ビットでその下位テーブル
のエントリを指す。Ｓ２７は、検索文字列の終わりか判
別する。ＹＥＳの場合には、Ｓ３０で下位テーブルのエ
ントリにキーワード番号があるか判別し、ＹＥＳのとき
にＳ３１でそのキーワード番号を出力し、ＮＯのときに
Ｓ２９でキーワード番号を零として出力する。一方、Ｎ
Ｏの場合には、Ｓ２８で下位テーブルのエントリに次に
続く上位テーブルのポインタがあるか判別し、ＹＥＳの
ときにＳ２２に戻って繰り返し、ＮＯのときにＳ２９で
キーワード番号を零として出力する。

【００３９】以上のＳ２１からＳ３１によって、検索文
字列の各文字について上位４ビットと下位４ビットに分
け、これら上位ビットを上位テーブル、下位ビットを下
位テーブルを辿り、全てがあったときに設定されていた
キーワード番号を出力する。これにより、文字列につい
てキーワード表現２４を検索してキーワード番号を出力
することが可能となる。

【００４０】次に、図６のフローチャートを用いて図１
および図３の構成のもとで、文字列をキーワード表現２
４から削除するときの動作を詳細に説明する。図６にお
いて、Ｓ４１は、削除文字列を入力する。

【００４１】Ｓ４２は、削除文字列より１文字を取り出
す。Ｓ４３は、１文字を上位ビットと下位ビットに分け
る。Ｓ４４は、上位ビットで上位テーブルのエントリを
指す。これは、図３の開始点から初めて上位ビットで上
位テーブルの該当するエントリを指す。

【００４２】Ｓ４５は、Ｓ４４で指した上位テーブルの
エントリに下位テーブルのポインタがあるか判別する。
ＹＥＳの場合には、Ｓ４６に進む。一方、ＮＯの場合に
は、削除対象の文字列がないと判明したので、終了す
る。

【００４３】Ｓ４６は、下位ビットでその下位テーブル
のエントリを指す。Ｓ４７は、削除文字列の終わりか判
別する。ＹＥＳの場合には、Ｓ４９で下位テーブルのエ
ントリにキーワード番号があるか判別し、ＹＥＳのとき
にＳ５０でそのキーワード番号を消し、ＮＯのときは消
すキーワード番号がないと判明したので終了する。一
方、ＮＯの場合には、Ｓ４８で下位テーブルのエントリ
に次に続く上位テーブルのポインタがあるか判別し、Ｙ
ＥＳのときにＳ４２に戻って繰り返し、ＮＯのときは終
了する。

【００４４】以上のＳ４１からＳ５０によって、削除文
字列の各文字について上位４ビットと下位４ビットに分
け、これら上位ビットを上位テーブル、下位ビットを下
位テーブルを辿り、全てがあったときに設定されていた
キーワード番号を消す。これにより、文字列についてキ
ーワード表現２４を検索して文字列を削除することが可
能となる。

【００４５】次に、図７から図１０を用いて、図１およ
び図３の構成のもとで、情報源を登録、更新、検索、削
除するときの動作を詳細に説明する。図７は、本発明の
キーファイルと情報源ファイル例を示す。

【００４６】図７の（ａ）は、全体の要部構成図を示
す。ここで、文字列管理機能２およびキーワード表現２
４は、図１、図３から図６によって説明したので省略す
る。図７の（ａ）において、キーマップファイル３４
は、文字列のキーワード番号に対応づけて無効ビットマ
ップ３４１、あるいはファイル番号３４２とビットマッ
プ３４３を設定するものである。

【００４７】情報源ファイル３５は、情報源の情報（情
報源のファイル名、タイトルなど）を書き込むものであ
る。図７の（ｂ）は、キーファイルの構成例を示す。

【００４８】・ここでは、キーワード番号“０”のエン
トリに、無効ビットマップ３４１を設定する。この無効
ビットマップ３４１は、情報源ファイル３５の数に対応
するビットを持ったものであって、ビットが立ったファ
イル番号に対応する情報源ファイル３５が無効である旨
を設定するためのものである。

【００４９】・キーワード番号“０”以外のエントリ
に、ファイル番号３４２およびビットマップ３４３を設
定する。このファイル番号３４２は、ファイル名自身を
キーワードとして登録した場合、そのファイル番号を設
定するものであって、情報源のファイル名自身と、それ
以外の当該情報源に含まれる文字列とを区別するための
ものである。ビットマップ３４３は、情報源に含まれる
文字列の場合に、いずれのファイル番号の情報源に含ま
れているかを設定するためのものであって、情報源のフ
ァイル数分のビットを設けたものである。

【００５０】図７の（ｃ）は、情報源ファイルの構造例
を示す。・ここでは、情報源の名前および情報源のタイ
トルなどの簡素な説明を書き込む。

【００５１】次に、図８のフローチャートに示す順序に
従い、図７の構成のもとで、情報の登録・更新するとき
の動作を詳細に説明する。図８において、Ｓ６１は、登
録・更新ファイル名（情報源）自身を文字列として登録
し、キーワード番号を得る。これは、登録・更新ファイ
ル名（情報源）自身を文字列として、既述した図４のフ
ローチャートに従い、キーワード表現２４に登録し、キ
ーワード番号を得る。

【００５２】Ｓ６２は、キーワード番号でキーマップフ
ァイル３４のエントリを得る。Ｓ６３は、キーマップフ
ァイル３４のエントリを得る。Ｓ６４は、無効ビットマ
ップ３４１に対し、ファイル番号に対応する位置のビッ
トを立てる。これは、Ｓ６３で得たエントリに設定され
ていたファイル番号３４２について、キーワード番号０
のキーマップファイル３４のエントリ内の無効ビットマ
ップ３４１の当該ファイル番号３４２のビットを立てて
無効にする。

【００５３】Ｓ６５は、情報源ファイル３５に１つのエ
ントリを最後に追加することにより、新しいファイル番
号を得る。Ｓ６６は、ビットマップファイル３４のエン
トリ（Ｓ６２で得たエントリ）に新しいファイル番号を
設定する。

【００５４】Ｓ６７は、登録・更新ファイルより登録す
る文字列を取り出す。これは、登録・更新ファイル（情
報源）に含まれる登録する文字列を取り出す。Ｓ６８
は、Ｓ６７で取り出した文字列をキーワード表現２４に
登録しキーワード番号を得る。

【００５５】Ｓ６９は、キーワード番号がキーマップフ
ァイル３４の最大エントリを越えたか判別する。ＹＥＳ
の場合には、Ｓ７０でそのキーワード番号に対応するエ
ントリをキーマップファイル３４の最後に追加し初期化
（０クリア）し、Ｓ７１に進む。一方、ＮＯの場合に
は、Ｓ７１に進む。

【００５６】Ｓ７１は、キーマップファイル３４のエン
トリのビットマップ３４３にファイル番号に対応したビ
ットを立てる。これにより、キーワード番号の文字列が
ビットを立てたファイル番号の情報源（登録・更新ファ
イル）内に含まれることを登録したこととなる。

【００５７】Ｓ７２は、登録する文字列が未だ有るか判
別する。ＹＥＳの場合には、Ｓ６７に戻り、次の文字列
について繰り返す。ＮＯの場合には、全て登録したの
で、Ｓ７３に進む。

【００５８】Ｓ７３は、情報源ファイル３５の追加した
エントリに、ファイル名、タイトルなどの情報を書き込
む。以上によって、登録・更新ファイル名（情報源）自
身を文字列として得たキーワード番号のキーマップファ
イル３４のエントリにファイル番号３４２を設定および
このファイル番号３４２の情報源ファイル３５に情報源
の名前やタイトルなどを登録すると共に、当該登録・更
新ファイル名（情報源）に含まれる文字列のキーワード
番号のキーマップファイル３４のエントリのビットマッ
プ３４３のファイル番号のビットを立てて含まれる文字
列であることを登録する。これらにより、情報源自身お
よび当該情報源に含まれるキーワードとなる文字列を登
録したこととなる。

【００５９】次に、図９のフローチャートに示す順序に
従い、図８で登録したキーマップファイル３４および情
報源ファイル３５をもとに、文字列を含む情報源に関す
る情報（ファイル名、タイトルなど）を検索するときの
動作を詳細に説明する。

【００６０】図９において、Ｓ８１は、検索文字列を入
力する。Ｓ８２は、文字列検索を行い、キーワード番号
を得る。これは、既述した図５のフローチャートに従
い、文字列についてキーワード表現２４を検索して一致
する文字列のキーワード番号を得る。

【００６１】Ｓ８３は、Ｓ８２でキーワード番号が見つ
かったか判別する。ＹＥＳの場合には、Ｓ８４に進む。
ＮＯの場合には、キーワード表現２４を検索して一致す
る文字列のキーワード番号が見つからないと判明したの
で、終了する。

【００６２】Ｓ８４は、キーワード番号でキーマップフ
ァイル３４のエントリを得る。Ｓ８５は、ビットマップ
３４３を作業用マップへ移し、無効ビットマップで作業
用マップの対応するビットを消す。

【００６３】Ｓ８６は、作業用マップで立っているビッ
トを１つ取り出しファイル番号へ変換する。Ｓ８７は、
ファイル番号で情報源ファイル３５の該当エントリを得
て、そのエントリの内容（情報源の名前やタイトルな
ど）を出力する。

【００６４】Ｓ８８は、作業用マップで今処理したビッ
トを消す。Ｓ８９は、作業用マップに未だビットが立っ
ているか判別する。ＹＥＳの場合には、Ｓ８６以降を繰
り返す。ＮＯの場合には、キーマップファイル３４のエ
ントリ内のビットマップ３４３のビットの立っている全
てのファイル番号の情報源ファイル３５のエントリの内
容（情報源の名前やタイトルなど）を出力したので終了
する。

【００６５】以上によって、検索文字列を入力すること
により、検索文字列を含む全ての情報源に関する情報
（情報源の名前やタイトルなど）を検索して出力するこ
とが可能となる。

【００６６】次に、図１０のフローチャートに示す順序
に従い、情報を削除する場合の動作を詳細に説明する。
図１０において、Ｓ９１は、情報源（ファイル名）自身
を文字列として検索する。これは、情報源（ファイル
名）自身を文字列として、キーワード表現２４を検索し
て一致する文字列のキーワード番号を取り出そうとす
る。

【００６７】Ｓ９２は、見つかったか判別する。ＹＥＳ
の場合には、キーワード表現２４から一致する文字列が
見つかったので、そのキーワード番号を取り出す。一
方、ＮＯの場合には、キーワード表現２４から一致する
文字列が見つからなかったので、当該文字列の情報源は
登録されていないので、終了する。

【００６８】Ｓ９３は、見つけたキーワード番号でキー
マップファイル３４のエントリを得る。Ｓ９４は、Ｓ９
３で得たエントリにファイル番号があるか判別する。Ｙ
ＥＳの場合には、情報源のファイル番号が設定されてい
たので、Ｓ９５で無効ビットマップでファイル番号に対
応するビットを立て、無効化する。一方、ＮＯの場合に
は、エントリにファイル番号が設定されていなく、情報
の削除指示のあった文字列が情報源の文字列以外である
と判明したので、終了する。

【００６９】以上によって、情報源（ファイル名）自身
を文字列としてキーワード番号を得て、情報源を一括し
て無効化することが可能となる。

【００７０】

【発明の効果】以上説明したように、本発明によれば、
前方一致する文字列を共通にして木構造のキーワード表
現２４する際に、検索文字列の各文字を分割して複数段
構成にすると共に登録するエントリのみを作成する構成
を採用しているため、未登録部分の無駄な記憶容量を削
減して記憶容量を削減すると共に登録数に依存しない高
速検索することができる。また、キーマップファイル３
４にビットマップ３４３を設けて文字列を含む全ての情
報源（ファイル番号）を設定したり、無効ビットマップ
３４１を設けて情報源を一括して無効にしたり、ファイ
ル番号３４２を設けて文字列が情報源（ファイル名）を
表すことを設定し、文字列から情報源のファイル番号を
検索したり、文字列を含む情報源のファイル番号を検索
したりの両者を同一システムで行なうことができる。

【図面の簡単な説明】

【図１】本発明の原理ブロック図である。

【図２】キーワード表現の概念説明図である。

【図３】本発明のキーワード表現例である。

【図４】本発明の文字列の登録フローチャートである。

【図５】本発明の文字列の検索フローチャートである。

【図６】本発明の文字列の削除フローチャートである。

【図７】本発明のキーマップファイルと情報源ファイル
例である。

【図８】本発明の情報の登録・更新フローチャートであ
る。

【図９】本発明の情報の検索フローチャートである。

【図１０】本発明の情報の削除フローチャートである。

【符号の説明】

１：情報管理システム２：文字列管理機能２１：登録手段２２：検索手段２３：削除手段２４：キーワード表現３：情報源管理機能３１：登録手段３２：検索手段３３：削除手段３４：キーマップファイル３４１：無効ビットマップ３４２：ファイル番号３４３：ビットマップ３５：情報源ファイル

Claims

【特許請求の範囲】

【請求項１】文字列を登録する情報管理システムにおい
て、登録対象の文字列の各文字を表すコードを複数の部分コ
ードに分割し、これらの各部分コードについて、先頭か
ら一致する部分コードのポインタを順次辿り、一致する
部分コードが無くなったときに新たにエントリを作成し
て登録すると共にポインタでリンクすることを繰り返
し、文字列の最後の文字の最後の部分コードに一意のキ
ーワード番号を登録した木構造を持つキーワード表現
（２４）を作成する登録手段（２１）を備え、このキーワード番号に対応づけて文字列に関する情報を
登録するように構成したことを特徴とする情報管理シス
テム。
【請求項２】文字列を検索する情報管理システムにおい
て、検索対象の文字列の各文字を表すコードを複数の部分コ
ードに分割し、これらの各部分コードについて、上記キ
ーワード表現（２４）の先頭から一致する部分コードの
ポインタを順次辿り、一致する最後の部分コードに登録
されているキーワード番号を取り出す検索手段（２２）
を備え、このキーワード番号に対応づけて登録されている文字列
に関する情報を出力するように構成したことを特徴とす
る情報管理システム。
【請求項３】文字列を削除する情報管理システムにおい
て、削除対象の文字列の各文字を表すコードを複数の部分コ
ードに分割し、これらの各部分コードについて、上記キ
ーワード表現（２４）の先頭から一致する部分コードの
ポインタを順次辿り、一致する最後の部分コードに登録
されているキーワード番号を削除する削除手段（２３）
を備えたことを特徴とする情報管理システム。
【請求項４】情報源に含まれる文字列を登録する情報管
理システムにおいて、情報源ファイル名自身の文字列あるいは情報源に含まれ
る文字列のキーワード番号のエントリに、当該キーワー
ド番号が情報源自身であるときにファイル番号（３４
２）を設定および当該キーワード番号が情報源に含まれ
る文字列であるときにその情報源のファイル番号に対応
するビットを立てるビットマップ（３４３）を設けたキ
ーマップファイル（３４）と、ファイル番号のエントリに、当該ファイル番号の情報源
に関する情報を書き込む情報源ファイル（３５）と、情報源に含まれる文字列の登録指示に対応して、情報源
自身の文字列を請求項１によってキーワード表現（２
４）に登録して一意のキーワード番号を得た後、上記キ
ーマップファイル（３４）のこのキーワード番号のエン
トリに、情報源ファイル（３５）に新たに追加したエン
トリの新しいファイル番号をファイル番号（３４２）と
して設定およびファイル番号の情報源ファイル（３５）
に情報源に関する情報を書き込んだ後、上記情報源に含
まれる登録しようとする１つあるいは複数の文字列を取
り出し、これら文字列を請求項１によってキーワード表
現（２４）に登録して一意のキーワード番号をそれぞれ
得た後、上記キーマップファイル（３４）のこれらのキ
ーワード番号の各エントリのビットマップ（３４３）に
上記新しいファイル番号に対応するビットをそれぞれ立
てる登録手段（３１）とを備えたことを特徴とする情報
管理システム。
【請求項５】文字列を含む情報源を検索する情報管理シ
ステムにおいて、情報源自身の文字列あるいは情報源に含まれる文字列の
キーワード番号のエントリに、当該キーワード番号が情
報源自身であるときにファイル番号（３４２）を設定お
よび当該キーワード番号が情報源に含まれる文字列であ
るときにその情報源のファイル番号に対応するビットを
立てるビットマップ（３４３）を設けたキーマップファ
イル（３４）と、ファイル番号のエントリに、当該ファイル番号の情報源
に関する情報を書き込む情報源ファイル（３５）と、文字列を含む情報源の検索指示に対応して、文字列を請
求項２によってキーワード表現（２４）からキーワード
番号を得た後、上記キーマップファイル（３４）のこの
キーワード番号のエントリのビットマップ（３４３）を
取り出し、当該ビットマップ（３４３）から無効ビット
マップ（３４１）を取除いたビットの立っている全ての
ファイル番号の情報源ファイル（３５）のエントリに書
き込まれている情報源に関する情報を取り出して出力す
る検索手段（３２）とを備えたことを特徴とする情報管
理システム。
【請求項６】文字列を含む情報源を削除する情報管理シ
ステムにおいて、情報源自身の文字列あるいは情報源に含まれる文字列の
キーワード番号のエントリに、当該キーワード番号が情
報源自身であるときにファイル番号（３４２）を設定お
よび当該キーワード番号が情報源に含まれる文字列であ
るときにその情報源のファイル番号に対応するビットを
立てるビットマップ（３４３）を設けたキーマップファ
イル（３４）と、ファイル番号のエントリに、当該ファイル番号の情報源
に関する情報を書き込む情報源ファイル（３５）と、文字列を含む情報源の削除指示に対応して、情報源自身
の文字列を請求項２によってキーワード表現（２４）か
らキーワード番号を得た後、上記キーマップファイル
（３４）のこのキーワード番号のエントリにファイル番
号が設定されていた場合にのみ、当該設定されていたフ
ァイル番号に対応する無効ビットマップ（３４１）のビ
ットを立て、ファイル番号（３４２）の情報源を無効に
して削除する削除手段（３３）とを備えたことを特徴と
する情報管理システム。