JPH08115329A - 文字列検索装置及び方法 - Google Patents

文字列検索装置及び方法

Info

Publication number
JPH08115329A
JPH08115329A JP6247827A JP24782794A JPH08115329A JP H08115329 A JPH08115329 A JP H08115329A JP 6247827 A JP6247827 A JP 6247827A JP 24782794 A JP24782794 A JP 24782794A JP H08115329 A JPH08115329 A JP H08115329A
Authority
JP
Japan
Prior art keywords
character string
search
data
data block
data blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6247827A
Other languages
English (en)
Inventor
Takayoshi Hamano
隆芳 濱野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6247827A priority Critical patent/JPH08115329A/ja
Publication of JPH08115329A publication Critical patent/JPH08115329A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 文字列検索の高速化を図る。 【構成】 補助記憶装置の分散された記憶位置に記憶さ
れた複数のデータブロック(BLKn )により構成され
た文書データに対して検索文字列を検索する際に、複数
のデータブロックを、それらの論理的な順番ではなく、
記憶装置における記憶順に移動しながら取り出し、取り
出されたデータブロック中に検索文字列が存在するか否
かを検索し、更に、検索文字列と部分一致する文字列を
複数のデータブロックの論理的な順序にしたがって連結
し、その連結された文字列が検索文字列に一致するか否
かを検索する。よって、文字列検索におけるデータ取り
出しのための移動に無駄が無く、検索の高速化を図るこ
とができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字列検索装置に係
り、特に、ワードプロセッサ(以下、ワープロと称す)
等の文書処理システムにおいて作成された文書ファイル
を対象として、所望の文字列を検索する文字列検索装置
に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】ワープ
ロ等の文書処理システムにおいて作成される文書及びそ
の文字列検索方法の従来技術に関して、図8を用いて概
説する。
【0003】この図8は、文書Aを構成する複数の論理
的な文書ページと、その文書ページを構成し記憶装置の
物理的な記憶単位である文書ページグループデータとの
対応を示し、更に文書Aを検索する際のヘッドの動きを
文書ページグループデータの記憶状態と対応させて示し
た図である。
【0004】文書Aは、1つまたは複数の論理的な文書
ページ(例えば、ワープロ文書の構成単位としての1ペ
ージに収められた情報)から構成されており、更に、論
理的な文書ページは、例えば文書ページiや文書ページ
jのように、各々記憶装置の分散した記憶位置に記憶さ
れた文書ページグループデータPGi-1 、PGi-2 、P
j-1 、PGj-2 から構成されている。
【0005】ところで、上記のように分散した記憶位置
に記憶された文書ページグループデータから構成される
文書Aを対象として文字列を検索する場合、文書Aを構
成する論理的な文書ページを論理的な順番に検索する。
【0006】例えば、文書ページiと文書ページjとを
対象として検索する場合に関していうと、図8のよう
に、まず1)で文書ページグループデータPGi-1 の先
頭位置(L5)をシークし、2)で文書ページグループ
データPGi-1 を順に最後の位置(L6)まで検索し、
次に3)で文書ページグループデータPGi-2 の先頭位
置(L3)をシークし、4)で文書ページグループデー
タPGi-2 を順に最後の位置(L4)まで検索する。
【0007】その後、文書ページグループデータPG
j-1 、PGj-2 に対しても同様に、5)〜8)にしたが
って、シークと検索とを繰り返す。
【0008】以上のことから明らかなように、文書Aに
対して文字列を検索する場合、ヘッドは記憶装置の物理
的な記憶位置の前後に激しく移動しており、結果的に非
常に無駄な動きをしていることがわかる。即ち、従来か
らの文書に対する文字列検索は、ヘッドの動きに非常に
無駄が多く、非効率なものであった。
【0009】そこで、本発明は、文字列検索において、
ヘッドの動きを効率化し、検索の高速化を図ることを目
的とする。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1記載の文字列検索装置は、検索したい検
索文字列を入力するための入力手段を備え、前記入力手
段により入力された検索文字列を、記憶媒体に記憶され
た複数のデータブロックにより構成された文書データを
対象として検索する文字列検索装置であって、記憶媒体
における前記複数のデータブロックの各々の記憶位置を
記憶した第1の記憶手段と、前記第1の記憶手段に記憶
された前記複数のデータブロックの各々の記憶位置に基
づいて、前記複数のデータブロックを記憶媒体における
記憶順に移動しながら取り出すデータ取出手段と、前記
データ取出手段により取り出されたデータブロック中に
検索文字列が存在するか否か、前記取り出されたデータ
ブロックの先端に検索文字列の後端部が存在するか否
か、及び前記取り出されたデータブロックの尾端に検索
文字列の先端部が存在するか否かを検索する第1の検索
手段と、検索文字列の後端部または先端部が存在する場
合には、検索文字列の後端部または先端部と、検索文字
列の後端部または先端部を含むデータブロックを識別す
るための情報とを対応付けて記憶する第2の記憶手段
と、前記第2の記憶手段により記憶された情報に基づい
て、検索文字列の後端部または先端部を複数のデータブ
ロックの論理的な順序にしたがって連結し、その連結さ
れた文字列が検索文字列に一致するか否かを検索する第
2の検索手段と、を備えたことを特徴とする。
【0011】また、上記の目的を達成するために、請求
項2記載の文字列検索方法は、入力された検索文字列
を、記憶媒体に記憶された複数のデータブロックにより
構成された文書データを対象として検索する文字列検索
方法であって、記憶媒体における前記複数のデータブロ
ックの各々の記憶位置に基づいて、前記複数のデータブ
ロックを記憶媒体における記憶順に移動しながら取り出
し、取り出されたデータブロック中に検索文字列が存在
するか否か、前記取り出されたデータブロックの先端に
検索文字列の後端部が存在するか否か、及び前記取り出
されたデータブロックの尾端に検索文字列の先端部が存
在するか否かを検索し、検索文字列の後端部または先端
部が存在する場合には、検索文字列の後端部または先端
部と、検索文字列の後端部または先端部を含むデータブ
ロックを識別するための情報とを対応付けて記憶し、記
憶された情報に基づいて、検索文字列の後端部または先
端部を複数のデータブロックの論理的な順序にしたがっ
て連結し、その連結された文字列が検索文字列に一致す
るか否かを検索することを特徴とする。
【0012】
【作用】請求項1記載の文字列検索装置によれば、デー
タ取出手段は、第1の記憶手段に記憶された複数のデー
タブロックの各々の記憶位置に基づいて、複数のデータ
ブロックを記憶媒体における記憶順に移動しながら取り
出し、第1の検索手段が、取り出されたデータブロック
中に検索文字列が存在するか否か、取り出されたデータ
ブロックの先端に検索文字列の後端部が存在するか否
か、及び取り出されたデータブロックの尾端に検索文字
列の先端部が存在するか否かを検索する。
【0013】そして、検索文字列の後端部または先端部
が存在する場合には、第2の記憶手段は、検索文字列の
後端部または先端部と、検索文字列の後端部または先端
部を含むデータブロックを識別するための情報とを対応
付けて記憶し、第2の検索手段は、第2の記憶手段によ
り記憶された情報に基づいて、検索文字列の後端部また
は先端部を複数のデータブロックの論理的な順序にした
がって連結し、その連結された文字列が検索文字列に一
致するか否かを検索する。
【0014】これにより、データブロックの取り出しの
ためのデータ取出手段の移動に無駄が無く、検索の高速
化を図ることができる。
【0015】請求項2記載の文字列検索方法によれば、
記憶媒体における複数のデータブロックの各々の記憶位
置に基づいて、複数のデータブロックを記憶媒体におけ
る記憶順に移動しながら取り出し、取り出されたデータ
ブロック中に検索文字列が存在するか否か、取り出され
たデータブロックの先端に検索文字列の後端部が存在す
るか否か、及び取り出されたデータブロックの尾端に検
索文字列の先端部が存在するか否かを検索する。
【0016】そして、検索文字列の後端部または先端部
が存在する場合には、検索文字列の後端部または先端部
と、検索文字列の後端部または先端部を含むデータブロ
ックを識別するための情報とを対応付けて記憶し、記憶
された情報に基づいて、検索文字列の後端部または先端
部を複数のデータブロックの論理的な順序にしたがって
連結し、その連結された文字列が検索文字列に一致する
か否かを検索する。
【0017】これにより、データブロックの取り出しの
ための移動に無駄が無く、検索の高速化を図ることがで
きる。
【0018】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
【0019】図1には本発明が適用された情報処理装置
10が示されている。情報処理装置10は、CPU1
2、CPU12の制御処理に係るプログラム等が記憶さ
れたROM及び記憶領域が各種の処理におけるワーク領
域として用いられるRAMを備えた主記憶装置14、ポ
インティングデバイスとしてのマウス16、各種のデー
タやコマンド等を入力するための入力装置としてのキー
ボード18、CRT等で構成され各種の情報を表示する
ためのディスプレイ20及びハードディスクや光ディス
ク等の不揮発性の記憶媒体を含んで構成された補助記憶
装置22を備えており、これらがバス24を介して互い
に接続されて構成されている。
【0020】ここで、上記の情報処理装置10で稼働す
る本実施例に係る文書処理システムにて用いられる文書
データの管理に関連する各種管理データに関して図2と
図3を用いて説明する。
【0021】文書の実データ(文書の内容としての文字
や図形等の情報)は、補助記憶装置22の分散された記
憶位置に記憶されており、それらの分散して記憶された
個々のデータのかたまり(ブロック)をデータブロック
と称する。これらのデータブロックを、補助記憶装置2
2の記憶順にBLK1 、BLK2 、・・、BLKN とす
る。なお、Nは当該検索対象文書の実データを構成する
データブロックの数である。
【0022】上記の個々のデータブロックに関する管理
情報を記憶した文書ページグループデータPGn (n:
1〜N)が各データブロックに対応して存在し、これら
は図3に示すように、対応するデータブロック(BLK
n )へのポインタ、論理ページグループ番号、及び次文
書ページグループデータ(PGn+1 )へのポインタの3
種類の情報から構成されている。なお、上記の論理ペー
ジグループ番号とは、N個のデータブロックを論理的な
順序に並べた場合の、対応するデータブロック(BLK
n )の順番を示す番号のことを意味する。
【0023】また、上記の文書ページグループデータP
n 以外の管理データとして、文書管理データが存在
し、この文書管理データは、文書管理システムにて作成
された複数の文書の各々に関する最大ページグループ番
号及び先頭要素へのポインタ(文書ページグループデー
タPG1 へのポインタ)から構成されており、各文書に
関する上記データは、文書IDをキーとして取り出し可
能とされている。
【0024】以上のようなデータ管理構造であるため、
所望の文書の実データを検索する際には、まず文書管理
データより文書IDをキーとして、当該文書の最大ペー
ジグループ番号Nと先頭要素へのポインタとを取り込
み、次に先頭要素へのポインタに基づいて最初の文書ペ
ージグループデータPG1 をシークし、そこから対応す
るデータブロックBLK1 へのポインタを取り込み、そ
のポインタに基づいてデータブロックBLK1 をシーク
して、その実データを取り込む。
【0025】その後、文書ページグループデータPG1
に記憶された次文書ページグループデータ(PG2 )へ
のポインタを取り込み、そのポインタに基づいて文書ペ
ージグループデータPG2 をシークする。このようにし
て次々と連鎖的にそのつぎの文書ページグループデータ
及びそれに対応するデータブロックを取り込むことによ
って、検索対象文書の実データを検索していく。
【0026】本実施例に係る文書管理システムは、以上
のような管理データ構造を有している。
【0027】次に本実施例の作用として、オペレータに
より入力された検索文字列を文書全体に対して検索し、
各文書ページ毎の当該検索文字列の個数をディスプレイ
20に出力する場合の制御ルーチンに関して図面を用い
て説明する。
【0028】図4には、本実施例のメインルーチンを示
す。このメインルーチンが開始されるのは、オペレータ
がキーボード18より検索文字列を入力し、更にキーボ
ード18またはマウス16によって検索対象文書を選択
した後、検索開始を指示した時である。
【0029】ステップ100ではオペレータにより入力
された検索文字列を取り込み、次のステップ102では
検索文字列の検索個数を一時記憶するためのアレイA、
複数のデータブロックにまたがって記憶された文字列の
一部分(以後、部分文字列と称す)を一時記憶するため
のハッシュb及びハッシュfを初期設定する、即ち主記
憶装置14内にこれらのための記憶域を確保し、ゼロク
リアする。また、後述するステップでのデータブロック
の順次取込みをカウントするためのカウンタjに1を代
入する。
【0030】なお、図6に示すように、アレイAは各文
書ページ毎の検索文字列の検索個数を一時記憶する記憶
域から構成されており、ここに記憶された検索個数は文
書ページ番号をキーとして取り出し可能とされている。
【0031】また、図7に示すように、ハッシュbは、
データブロックの末尾に存在し検索文字列の前部と部分
的に一致する文字列(以下、前部一致文字列と称す)
を、当該データブロックに対応する文書ページグループ
毎に一時記憶する記憶域から構成されており、ここに記
憶された文字列は論理ページグループ番号をキーとして
取り出し可能とされている。
【0032】同様に、ハッシュfは、データブロックの
先頭に存在し検索文字列の後部と部分的に一致する文字
列(以下、後部一致文字列と称す)を、当該データブロ
ックに対応する文書ページグループ毎に一時記憶する記
憶域から構成されており、ここに記憶された文字列は論
理ページグループ番号をキーとして取り出し可能とされ
ている。
【0033】次のステップ103では、検索対象文書の
データブロックに関する管理データ、即ち上述した検索
対象文書に関する文書管理データ及び当該検索対象文書
に関する全ての文書ページグループデータを、主記憶装
置14内に取り込む。
【0034】ここでは、まず文書IDをキーとして検索
対象文書の文書管理データを取り込み、そして取り込ん
だ文書管理データの中の先頭要素へのポインタの情報に
基づいて、文書ページグループデータPG1 を取り込
み、次に文書ページグループデータPG1 の中の次文書
ページグループデータ(PG2 )へのポインタの情報に
基づいて、文書ページグループデータPG2 を取り込
む。このようにして、順次次の文書ページグループデー
タを取り込み、文書ページグループデータPGN (N
は、文書管理データの中の最大ページグループ番号)ま
で取り込む。
【0035】次のステップ105では、文書ページグル
ープデータPG1 の中の最初のデータブロックBLK1
へのポインタの情報に基づいてデータブロックBLK1
をシークし、次のステップ106においてそのデータブ
ロックBLK1 のデータを取り込む。
【0036】そして、次のステップ108ではデータブ
ロックBLK1 の先端に後部一致文字列が有るか否かを
判断する。
【0037】後部一致文字列が無い場合は否定判断さ
れ、ステップ112へ進む。また、後部一致文字列が有
る場合は肯定判断され、ステップ110へ進み、ハッシ
ュfに後部一致文字列を、当該データブロックBLK1
の論理ページグループ番号をキーとしてセットする。な
お、キーとなる当該データブロックBLK1の論理ペー
ジグループ番号は、文書ページグループデータPG1
中に記憶された論理ページグループ番号を参照すること
で得られる。その後、ステップ112へ進む。
【0038】ステップ112では、検索文字列が有った
か否かを判断する。検索文字列が無かった場合は否定判
断され、ステップ116へ進む。
【0039】また、検索文字列が有った場合は肯定判断
され、ステップ114へ進み、検索対象文書の文書ID
と上記の論理ページグループ番号とをキーとして、従来
より存在する文書処理システムの機能によって検索し
た、当該データブロックBLK 1 が所属する文書ページ
番号(論理的な文書ページの番号)をキーとして、アレ
イAに記憶された検索個数をインクリメントする。その
後、ステップ116へ進む。
【0040】ステップ116ではデータブロックBLK
1 の尾端に前部一致文字列が有るか否かを判断する。
【0041】前部一致文字列が無い場合は否定判断さ
れ、ステップ120へ進む。また、前部一致文字列が有
る場合は肯定判断され、ステップ118へ進み、ハッシ
ュbに前部一致文字列を、当該データブロックBLK1
の論理ページグループ番号をキーとしてセットする。そ
してその後、ステップ120へ進む。
【0042】ステップ120ではデータブロックBLK
1 の全てのデータを検索したか否かを判断しており、当
ステップで肯定判断されるまで、上記のステップ10
8、110、112、114、116、118を繰り返
す。
【0043】データブロックBLK1 の全てのデータを
検索し終えると、ステップ120で肯定判断され、ステ
ップ122へ進み、カウンタjが最大ページグループ番
号Nに一致しているか否かを判断する。
【0044】カウンタjがNに一致しない、即ち検索対
象文書の全てのデータブロックに対して未だ検索を完了
していない場合は、否定判断されステップ124へ進
み、カウンタjをインクリメントし、その次のステップ
126で次のデータブロックのシークを行う。なお、こ
こでは、文書ページグループデータPG1 の中の次文書
ページグループデータPG2 へのポインタに基づいて、
次のページグループデータPG2 を探索し、更にそのペ
ージグループデータPG2 の中のデータブロックBLK
2 へのポインタに基づいて、次のデータブロックBLK
2 をシークする。
【0045】そして、その後ステップ106へ戻り、シ
ークした次のデータブロックBLK 2 に対してステップ
106以降の処理を実行する。
【0046】一方、カウンタjがNに一致する、即ち検
索対象文書の全てのデータブロックに対して検索を完了
した場合は、肯定判断されステップ127へ進み、後述
する部分文字列に対する再検索のサブルーチンを実行す
る。
【0047】以下に、ステップ127における部分文字
列に対する再検索のサブルーチンについて図5を用いて
説明する。
【0048】ステップ130において後述するステップ
132で部分文字列を論理的な順番に再検索する際の論
理的な順番をカウントするためのカウンタiに1を代入
する。
【0049】次のステップ132では、ハッシュbに記
憶された論理ページグループ番号がiであるデータブロ
ックに存在した前部一致文字列(前部一致文字列〔i〕
と称す)と、ハッシュfに記憶された論理ページグルー
プ番号がi+1であるデータブロックに存在した後部一
致文字列(後部一致文字列〔i+1〕と称す)とが、共
に存在するか否かを判断する。即ち、この判断により、
論理的にi番目のデータブロックと、論理的にi+1番
目のデータブロックと、に跨がって部分一致文字列が存
在するか否かが判断される。
【0050】上記のように論理的に連続するデータブロ
ックに跨がって部分一致文字列が、存在しない場合は否
定判断され、ステップ142へジャンプし、逆に上記の
ような部分一致文字列が存在する場合は肯定判断され、
ステップ134へ進む。
【0051】ステップ134では前部一致文字列〔i〕
と後部一致文字列〔i+1〕とを連結し、次のステップ
136では、ステップ134で連結した文字列と検索文
字列とが一致するか否かを判定する。
【0052】連結した文字列と検索文字列とが不一致の
場合は否定判定され、ステップ142へジャンプし、連
結した文字列と検索文字列とが一致する場合は肯定判定
され、ステップ140へ進む。
【0053】ステップ140では上述したステップ11
4と同様にアレイAに記憶された検索個数をインクリメ
ントし、ステップ142へ進む。
【0054】ステップ142ではカウンタiがN−1
(Nは、最大ページグループ番号)に一致するか否かを
判断する。
【0055】カウンタiがN−1に一致しない、即ちハ
ッシュb及びハッシュfに記憶された部分一致文字列の
全てに対して未だチェックしていない場合は、否定判断
されステップ144へ進み、カウンタiをインクリメン
トした後、このインクリメントしたカウンタiに基づい
てステップ132から再実行する。
【0056】また、カウンタiがN−1に一致する、即
ちハッシュb及びハッシュfに記憶された全ての部分一
致文字列に対してチェックを完了した場合は、肯定判断
され、当サブルーチンを終了しメインルーチンへリター
ンする。
【0057】上記のサブルーチンからリターンした後
は、ステップ128においてアレイAに記憶された各文
書ページ番号毎の検索文字列の個数をディスプレイ20
に出力して、当制御ルーチンを終了する。
【0058】以上の説明から明らかなように、本実施例
によれば、補助記憶装置22の分散された記憶位置に記
憶された複数のデータブロックにより構成された文書デ
ータに対して検索文字列を検索する際に、複数のデータ
ブロックを、それらの論理的な順番ではなく、記憶装置
における記憶順に移動しながら取り出すことができるの
で、その取り出しのための移動に無駄が無く、検索の高
速化を図ることができる。
【0059】また、論理的に連続する複数のデータブロ
ックに跨がって記憶された文字列が存在する場合も、そ
の跨がって記憶された文字列に対しても、検索文字列に
一致しているか否かの判定が実行される。即ち、論理的
に連続する複数のデータブロックに跨がって記憶された
文字列をも対象とした厳密な文字列検索を実行すること
ができる。
【0060】なお、本実施例では、論理的に連続する2
個のデータブロックに跨がって記憶された文字列が存在
する場合に関し、その跨がって記憶された文字列に対し
て検索文字列に一致しているか否かを判定する例を示し
たが、例えば、個々のデータブロックが小さい等のため
に、論理的に連続する3個以上のデータブロックに跨が
って記憶された文字列が存在する場合に関しても、本発
明を適用することができる。
【0061】また、本実施例では図7に示すように、個
々の文書ページグループデータ内に次文書ページグルー
プデータへのポインタの情報を保持し、一連のチェーン
をたどるようにして、順次探索する例を示したが、全て
の文書ページグループデータへのポインタの情報を記憶
した索引を設け、その索引からポインタの情報を取り込
むようにしても良い。
【0062】また、本実施例では文書データの全体を対
象として文字列検索する例を示したが、従来からの文書
処理システムにて存在する、論理的な文書ページとデー
タブロックとの対応を示す情報に基づいて、特定の(ま
たは入力指示された)論理的な文書ページからそれに対
応するデータブロック及び文書ページグループデータを
取り込むことにより、特定の(または入力指示された)
論理的な文書ページを対象とした文字列検索において、
対応するデータブロックを、記憶装置における記憶順に
移動しながら取り出すことができ、文字列検索の高速化
を図ることができる。
【0063】
【発明の効果】請求項1記載の文字列検索装置によれ
ば、記憶媒体に記憶された複数のデータブロックにより
構成された文書データに対して検索文字列を検索する際
に、データ取出手段が複数のデータブロックを、それら
の論理的な順番ではなく、記憶媒体における記憶順に移
動しながら取り出し、第1の検索手段が、取り出された
データブロック中に検索文字列が存在するか否か、前記
取り出されたデータブロックの先端に検索文字列の後端
部が存在するか否か、及び前記取り出されたデータブロ
ックの尾端に検索文字列の先端部が存在するか否かを検
索し、更に第2の検索手段が、検索文字列の後端部また
は先端部を複数のデータブロックの論理的な順序にした
がって連結し、その連結された文字列が検索文字列に一
致するか否かを検索するので、データブロックの取り出
しのためのデータ取出手段の移動に無駄が無く、検索の
高速化を図ることができるという優れた効果を有する。
【0064】請求項2記載の文字列検索方法によれば、
記憶媒体に記憶された複数のデータブロックにより構成
された文書データに対して検索文字列を検索する際に、
複数のデータブロックを、それらの論理的な順番ではな
く、記憶媒体における記憶順に移動しながら取り出し、
取り出されたデータブロック中に検索文字列が存在する
か否か、前記取り出されたデータブロックの先端に検索
文字列の後端部が存在するか否か、及び前記取り出され
たデータブロックの尾端に検索文字列の先端部が存在す
るか否かを検索し、更に、検索文字列の後端部または先
端部を複数のデータブロックの論理的な順序にしたがっ
て連結し、その連結された文字列が検索文字列に一致す
るか否かを検索するので、データブロックの取り出しの
ための移動に無駄が無く、検索の高速化を図ることがで
きるという優れた効果を有する。
【図面の簡単な説明】
【図1】本実施例に係る情報処理装置の概略構成を示す
ブロック図である。
【図2】文書データの管理構造を示す概念図である。
【図3】文書ページグループデータの構成要素を示す概
念図である。
【図4】本実施例のメインルーチンを説明するフローチ
ャートである。
【図5】部分文字列に対する再検索の処理を説明するフ
ローチャートである。
【図6】アレイAのデータ構造を示す概念図である。
【図7】ハッシュb及びハッシュfのデータ構造を示す
概念図である。
【図8】従来の文書データの管理構造及び検索時のヘッ
ドの動きを示す概念図である。
【符号の説明】 10 情報処理装置(文字列検索装置) 12 CPU 14 主記憶装置 18 キーボード(入力手段) 22 補助記憶装置(記憶媒体)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 検索したい検索文字列を入力するための
    入力手段を備え、 前記入力手段により入力された検索文字列を、記憶媒体
    に記憶された複数のデータブロックにより構成された文
    書データを対象として検索する文字列検索装置であっ
    て、 記憶媒体における前記複数のデータブロックの各々の記
    憶位置を記憶した第1の記憶手段と、 前記第1の記憶手段に記憶された前記複数のデータブロ
    ックの各々の記憶位置に基づいて、前記複数のデータブ
    ロックを記憶媒体における記憶順に移動しながら取り出
    すデータ取出手段と、 前記データ取出手段により取り出されたデータブロック
    中に検索文字列が存在するか否か、前記取り出されたデ
    ータブロックの先端に検索文字列の後端部が存在するか
    否か、及び前記取り出されたデータブロックの尾端に検
    索文字列の先端部が存在するか否かを検索する第1の検
    索手段と、 検索文字列の後端部または先端部が存在する場合には、
    検索文字列の後端部または先端部と、検索文字列の後端
    部または先端部を含むデータブロックを識別するための
    情報とを対応付けて記憶する第2の記憶手段と、 前記第2の記憶手段により記憶された情報に基づいて、
    検索文字列の後端部または先端部を複数のデータブロッ
    クの論理的な順序にしたがって連結し、その連結された
    文字列が検索文字列に一致するか否かを検索する第2の
    検索手段と、 を備えたことを特徴とする文字列検索装置。
  2. 【請求項2】 入力された検索文字列を、記憶媒体に記
    憶された複数のデータブロックにより構成された文書デ
    ータを対象として検索する文字列検索方法であって、 記憶媒体における前記複数のデータブロックの各々の記
    憶位置に基づいて、前記複数のデータブロックを記憶媒
    体における記憶順に移動しながら取り出し、 取り出されたデータブロック中に検索文字列が存在する
    か否か、前記取り出されたデータブロックの先端に検索
    文字列の後端部が存在するか否か、及び前記取り出され
    たデータブロックの尾端に検索文字列の先端部が存在す
    るか否かを検索し、 検索文字列の後端部または先端部が存在する場合には、
    検索文字列の後端部または先端部と、検索文字列の後端
    部または先端部を含むデータブロックを識別するための
    情報とを対応付けて記憶し、 記憶された情報に基づいて、検索文字列の後端部または
    先端部を複数のデータブロックの論理的な順序にしたが
    って連結し、 その連結された文字列が検索文字列に一致するか否かを
    検索する、 文字列検索方法。
JP6247827A 1994-10-13 1994-10-13 文字列検索装置及び方法 Pending JPH08115329A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6247827A JPH08115329A (ja) 1994-10-13 1994-10-13 文字列検索装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6247827A JPH08115329A (ja) 1994-10-13 1994-10-13 文字列検索装置及び方法

Publications (1)

Publication Number Publication Date
JPH08115329A true JPH08115329A (ja) 1996-05-07

Family

ID=17169264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6247827A Pending JPH08115329A (ja) 1994-10-13 1994-10-13 文字列検索装置及び方法

Country Status (1)

Country Link
JP (1) JPH08115329A (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5051310A (ja) * 1973-09-05 1975-05-08
JPH01121920A (ja) * 1987-11-05 1989-05-15 Seiko Instr & Electron Ltd 記憶装置のシーク制御方法
JPH04168660A (ja) * 1990-10-31 1992-06-16 Nec Eng Ltd 光ディスク制御装置
JPH0519976A (ja) * 1991-07-17 1993-01-29 Hokkaido Nippon Denki Software Kk シーク方式
JPH05303594A (ja) * 1992-04-27 1993-11-16 Nippon Telegr & Teleph Corp <Ntt> 並列処理型内容検索装置
JPH0628110A (ja) * 1992-07-10 1994-02-04 Matsushita Electric Ind Co Ltd コンパクトディスク読み出し装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5051310A (ja) * 1973-09-05 1975-05-08
JPH01121920A (ja) * 1987-11-05 1989-05-15 Seiko Instr & Electron Ltd 記憶装置のシーク制御方法
JPH04168660A (ja) * 1990-10-31 1992-06-16 Nec Eng Ltd 光ディスク制御装置
JPH0519976A (ja) * 1991-07-17 1993-01-29 Hokkaido Nippon Denki Software Kk シーク方式
JPH05303594A (ja) * 1992-04-27 1993-11-16 Nippon Telegr & Teleph Corp <Ntt> 並列処理型内容検索装置
JPH0628110A (ja) * 1992-07-10 1994-02-04 Matsushita Electric Ind Co Ltd コンパクトディスク読み出し装置

Similar Documents

Publication Publication Date Title
JP3672242B2 (ja) パターン検索方法、パターン検索装置、コンピュータプログラム及び記憶媒体
JP2000357115A (ja) ファイル検索装置及びファイル検索方法
JPH0869476A (ja) 検索システム
JPH08115329A (ja) 文字列検索装置及び方法
JPH05101102A (ja) 検索装置
JPH07146880A (ja) 文書検索装置及び方法
JPS617936A (ja) 情報検索方式
JPH0773187A (ja) 検索システム
JP2004342016A (ja) 情報探索プログラム及び情報探索プログラムを記録した媒体
JPH09259132A (ja) 情報登録検索装置及びその方法
JPH07210565A (ja) 情報検索方法及び装置
JPH07200622A (ja) 情報管理システム
JP2007011438A (ja) 絞り込み検索用インデクス構造及び情報検索装置
JPH06309368A (ja) 文書検索装置
JPS59100939A (ja) 日本語入力装置
JP2967995B2 (ja) 文書処理装置および文書処理方法
JPH11161666A (ja) ドキュメントデータ検索方法および装置、並びにドキュメント編集装置
JPH06274701A (ja) 単語照合装置
JPH10307839A (ja) テキスト検索装置及び方法
JPH0830629A (ja) 文書処理装置
JPH07146872A (ja) 文書検索装置
JPH06162096A (ja) レコード検索方法
JP2835065B2 (ja) 文字列検索方法
JP2838972B2 (ja) 自動索引作成装置
JPH08153108A (ja) 情報検索方法及びその装置