JPH0421179A - 文字列検索方式 - Google Patents
文字列検索方式Info
- Publication number
- JPH0421179A JPH0421179A JP2126014A JP12601490A JPH0421179A JP H0421179 A JPH0421179 A JP H0421179A JP 2126014 A JP2126014 A JP 2126014A JP 12601490 A JP12601490 A JP 12601490A JP H0421179 A JPH0421179 A JP H0421179A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- group
- hash value
- overflow
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は文字列検索方式に関し、特に文字列のグループ
検索に関する。
検索に関する。
従来技術
従来、文字列検索方式においては、第3図に示すように
、ハッンユ関数2により文字列のハツシユ値を求め、そ
のハツシュ値rO,1,,23・・・・・」をデータ構
造テーブル3の格納領域3dのハツシュ値部3aに、文
字列rXi 、Xj 、・・・」を格納領域3dのデー
タ部3bに夫々登録している。
、ハッンユ関数2により文字列のハツシユ値を求め、そ
のハツシュ値rO,1,,23・・・・・」をデータ構
造テーブル3の格納領域3dのハツシュ値部3aに、文
字列rXi 、Xj 、・・・」を格納領域3dのデー
タ部3bに夫々登録している。
このデータ構造テーブル3に文字列を登録するとき、ハ
ツシュ値が同し値となるがち合いが発生した場合には、
その文字列rYi 、Yj 、・自・」およびハツシュ
値r屹 1.2.3.−=」をあふれ領域3eのハツシ
ュ値部3aおよびデータ部3bに夫々登録するとともに
、同しハツシュ値の文字列に、たとえば文字列rXi
Jおよび文字列「Yl」に各々対応するあふれポインタ
部3cのあふれポインタをつなく。
ツシュ値が同し値となるがち合いが発生した場合には、
その文字列rYi 、Yj 、・自・」およびハツシュ
値r屹 1.2.3.−=」をあふれ領域3eのハツシ
ュ値部3aおよびデータ部3bに夫々登録するとともに
、同しハツシュ値の文字列に、たとえば文字列rXi
Jおよび文字列「Yl」に各々対応するあふれポインタ
部3cのあふれポインタをつなく。
上述のように文字列か登録されているデータ構造テーブ
ル3の検索を行う場合、第4図に示すように、検索キー
のハツシュ値をハツシュ関数2により求め(第4図ステ
ップ20)、そのハツシュ値によりデータ構造テーブル
3の格納領域3dのデータ部3bを参照する。
ル3の検索を行う場合、第4図に示すように、検索キー
のハツシュ値をハツシュ関数2により求め(第4図ステ
ップ20)、そのハツシュ値によりデータ構造テーブル
3の格納領域3dのデータ部3bを参照する。
このデータ部3bの文字列と検索キーとを照合しく第4
図ステップ2]) それらかイコールであれば検索キー
のハツシュ値の指す文字列を出力しく第4図ステップ2
3)、それらかイコールでなければ順次あふれポインタ
部3cのあふれポインタをたどり(第4図ステップ22
)、あふれポインタの指すあふれ領域3eのデータ部3
bを参照し、そのデータ部3bの文字列と検索キーとを
照合しく第4図ステップ21)、それらがイコールであ
れば検索キーのハツシュ値の指す文字列を出力する(第
4図ステップ23)。
図ステップ2]) それらかイコールであれば検索キー
のハツシュ値の指す文字列を出力しく第4図ステップ2
3)、それらかイコールでなければ順次あふれポインタ
部3cのあふれポインタをたどり(第4図ステップ22
)、あふれポインタの指すあふれ領域3eのデータ部3
bを参照し、そのデータ部3bの文字列と検索キーとを
照合しく第4図ステップ21)、それらがイコールであ
れば検索キーのハツシュ値の指す文字列を出力する(第
4図ステップ23)。
このような従来の文字列検索方式では、検索キのハツシ
ュ値をハツシュ関数2により求め、そのハツシュ値によ
りデータ構造テーブル3の格納領域3dのデータ部3b
を参照しているので、これにより検索回数の削減を図る
ことかできるか、文字列の一部であるアルファヘット列
をキーとするようなグループ検索の場合にも文字列を検
索キーとする検索が必要になるため、何回も検索処理を
行わなければならないという欠点がある。
ュ値をハツシュ関数2により求め、そのハツシュ値によ
りデータ構造テーブル3の格納領域3dのデータ部3b
を参照しているので、これにより検索回数の削減を図る
ことかできるか、文字列の一部であるアルファヘット列
をキーとするようなグループ検索の場合にも文字列を検
索キーとする検索が必要になるため、何回も検索処理を
行わなければならないという欠点がある。
発明の目的
本発明は上記のような従来のものの欠点を除去すべくな
されたもので、アルファベット列をキとするようなグル
ープ検索の検索処理の回数を削減することができる文字
列検索方式の提供を目的とする。
されたもので、アルファベット列をキとするようなグル
ープ検索の検索処理の回数を削減することができる文字
列検索方式の提供を目的とする。
発明の構成
本発明による文字列検索方式は、アルファベット列と数
字列とからなる文字列を格納する文字列格納手段と、前
記文字列のハツシュ値を算出する算出手段と、前記算出
手段により算出された前記文字列のハツシュ値に応じて
設定されたあふれ情報を前記文字列に対応させて格納す
るあふれ情報格納手段と、前記アルファベット列を識別
子として登録されたグループ情報を前記文字列に対応さ
せて格納するグループ情報格納手段とを有し、前記文字
列による検索時に前記あふれ情報格納手段に格納された
前記あふれ情報に基づいて検索を行い、前記アルファベ
ット列によるグループ検索時に前記グループ情報格納手
段に格納された前記グループ情報に基ついて検索を行う
ようにしたことを特徴とする。
字列とからなる文字列を格納する文字列格納手段と、前
記文字列のハツシュ値を算出する算出手段と、前記算出
手段により算出された前記文字列のハツシュ値に応じて
設定されたあふれ情報を前記文字列に対応させて格納す
るあふれ情報格納手段と、前記アルファベット列を識別
子として登録されたグループ情報を前記文字列に対応さ
せて格納するグループ情報格納手段とを有し、前記文字
列による検索時に前記あふれ情報格納手段に格納された
前記あふれ情報に基づいて検索を行い、前記アルファベ
ット列によるグループ検索時に前記グループ情報格納手
段に格納された前記グループ情報に基ついて検索を行う
ようにしたことを特徴とする。
実施例
次に、本発明の一実施例について図面を参照して説明す
る。
る。
第1図は本発明の一実施例のデータ構造を示す図である
。図において、データ構造テーブル1の格納領域1eの
ハツシュ値部1aにはハツシュ関数2により求められた
文字列のハツシュ値「o。
。図において、データ構造テーブル1の格納領域1eの
ハツシュ値部1aにはハツシュ関数2により求められた
文字列のハツシュ値「o。
L 2,3.・・・・・・」が登録され、格納領域1
eのデータ部1bにはその文字列「x+、xj、・・・
・」か登録されている。
eのデータ部1bにはその文字列「x+、xj、・・・
・」か登録されている。
このデータ構造テーブル1に文字列を登録するとき、ハ
ツシュ値か同し値となるかち合いが発生した場合には、
その文字列ryi、yj、 ・・・」およびハツシュ値
rO,1,2,3,・自・・」をあふれ領域1fのハツ
シュ値部1aおよびデータ部]bに夫々登録するととも
に、同しハツシュ値の文字列に、たとえば文字列rXi
Jおよび文字列rYi Jに各々対応するあふれポイ
ンタ部1cのあふれポインタをっなく。
ツシュ値か同し値となるかち合いが発生した場合には、
その文字列ryi、yj、 ・・・」およびハツシュ値
rO,1,2,3,・自・・」をあふれ領域1fのハツ
シュ値部1aおよびデータ部]bに夫々登録するととも
に、同しハツシュ値の文字列に、たとえば文字列rXi
Jおよび文字列rYi Jに各々対応するあふれポイ
ンタ部1cのあふれポインタをっなく。
また、文字列rXj 、Xj 、・・・」がグループと
して登録される場合には、文字列の一部であるアルファ
ベット列をグループIDとして設定し、このグループI
Dをキーとしてハツシュ関数2によりハツシュ値を求め
、そのハツシュ値の指すデータ部1bにグループIDが
登録されている場合には、グループIDを先頭として同
一ポインタの文字列についてグループポインタ部1dの
グルプポインタをっなく。
して登録される場合には、文字列の一部であるアルファ
ベット列をグループIDとして設定し、このグループI
Dをキーとしてハツシュ関数2によりハツシュ値を求め
、そのハツシュ値の指すデータ部1bにグループIDが
登録されている場合には、グループIDを先頭として同
一ポインタの文字列についてグループポインタ部1dの
グルプポインタをっなく。
一方、グループIDか登録されていない場合には、その
ハツシユ値の指すデータ部1bにグルー−7” I D
rXIDj ヲ登録L、l)ルー フI D r X
IDJを先頭として同一ポインタの文字列についてグ
ループポインタ部1dのグループポインタをつなぐ。
ハツシユ値の指すデータ部1bにグルー−7” I D
rXIDj ヲ登録L、l)ルー フI D r X
IDJを先頭として同一ポインタの文字列についてグ
ループポインタ部1dのグループポインタをつなぐ。
第2図は本発明の一実施例の動作を示すフローチャート
である。これら第1図および第2図を用いて本発明の一
実施例の動作について説明する。
である。これら第1図および第2図を用いて本発明の一
実施例の動作について説明する。
文字列が検索キーである場合には(第2図ステップ10
)、その文字列のハツシュ値をハツシュ関数2により求
め(第2図ステップ11)、そのハツシュ値によりデー
タ構造テーブル1の格納領域1dのデータ部1bを参照
する。
)、その文字列のハツシュ値をハツシュ関数2により求
め(第2図ステップ11)、そのハツシュ値によりデー
タ構造テーブル1の格納領域1dのデータ部1bを参照
する。
このデータ部1bの文字列と検索キーとを照合しく第2
図ステップ12)、それらがイコールであれば検索キー
のハツシユ値の指す文字列を出力しく第2図ステップ1
4)、それらがイコールでなければ順次あふれポインタ
部ICのあふれポインタをたどり(第2図ステップ13
)、あふれポインタの指すあふれ領域1eのデータ部1
bを参照し、そのデータ部1bの文字列と検索キーとを
照合しく第2図ステップ12)、それらがイコールであ
れば検索キーのハツシュ値の指す文字列を出力する(第
2図ステップ14)。
図ステップ12)、それらがイコールであれば検索キー
のハツシユ値の指す文字列を出力しく第2図ステップ1
4)、それらがイコールでなければ順次あふれポインタ
部ICのあふれポインタをたどり(第2図ステップ13
)、あふれポインタの指すあふれ領域1eのデータ部1
bを参照し、そのデータ部1bの文字列と検索キーとを
照合しく第2図ステップ12)、それらがイコールであ
れば検索キーのハツシュ値の指す文字列を出力する(第
2図ステップ14)。
グループ検索を実行する場合には(第2図ステップ10
)、グループIDを検索キーとしてその検索キーのハツ
シュ値をハツシュ関数2により求め(第2図ステップ1
5)、そのl\・ノンユ値に対応するデータ構造テーブ
ル1の格納領域]dのグループポインタ部]dを参照し
、そのグループポインタ部]dのグループポインタをた
とる(第2図ステップ16)。
)、グループIDを検索キーとしてその検索キーのハツ
シュ値をハツシュ関数2により求め(第2図ステップ1
5)、そのl\・ノンユ値に対応するデータ構造テーブ
ル1の格納領域]dのグループポインタ部]dを参照し
、そのグループポインタ部]dのグループポインタをた
とる(第2図ステップ16)。
そのグループポインタか存在する間(第2図ステップ1
7)、順次そのグループポインタをたとり、そのグルー
プポインタの指す文字列を繰返し出力する(第2図ステ
ップ16〜18)。
7)、順次そのグループポインタをたとり、そのグルー
プポインタの指す文字列を繰返し出力する(第2図ステ
ップ16〜18)。
このように、文字列のノ\ツシュ値をノ\・ソシュ関数
2により求め、このI\ツシュ値と文字列とをデータ構
造テーブル1の格納領域1eの/%−yシュ値部1aと
データ部1bとに夫々登録し、データ構造テーブル1へ
の文字列の登録時に7X・ソシュ値か同し値となった場
合、その文字列および/%・ンシュ値をあふれ領域1f
の/%ツンユ値部1aおよびデータ部1bに夫々登録す
るとともに、同しハツシュ値の文字列に各々対応するあ
ふれポインタ部ICのあふれポインタをつなぎ、文字列
のグループ登録の場合、文字列の一部であるアルファベ
ット列をグループIDとして設定してそのグループID
のハツシュ値をハツシュ関数2により求め、そのグルー
プIDを含む文字列に各々対応するグループポインタ部
1dのグループポインタをつなくようにし、アルファベ
ット列によるグループ検索時にグループポインタ部1d
のグループポインタにより検索を行うようにすることに
よって、アルファベット列をキーとするようなグループ
検索の検索処理の回数を削減することができる。
2により求め、このI\ツシュ値と文字列とをデータ構
造テーブル1の格納領域1eの/%−yシュ値部1aと
データ部1bとに夫々登録し、データ構造テーブル1へ
の文字列の登録時に7X・ソシュ値か同し値となった場
合、その文字列および/%・ンシュ値をあふれ領域1f
の/%ツンユ値部1aおよびデータ部1bに夫々登録す
るとともに、同しハツシュ値の文字列に各々対応するあ
ふれポインタ部ICのあふれポインタをつなぎ、文字列
のグループ登録の場合、文字列の一部であるアルファベ
ット列をグループIDとして設定してそのグループID
のハツシュ値をハツシュ関数2により求め、そのグルー
プIDを含む文字列に各々対応するグループポインタ部
1dのグループポインタをつなくようにし、アルファベ
ット列によるグループ検索時にグループポインタ部1d
のグループポインタにより検索を行うようにすることに
よって、アルファベット列をキーとするようなグループ
検索の検索処理の回数を削減することができる。
尚、データ構造テーブル1へのデータ展開として、グル
ープIDの設定およびグループポインタの接続を行わな
ければならないが、それらの処理時間は僅少で済むので
、問題とはならない。
ープIDの設定およびグループポインタの接続を行わな
ければならないが、それらの処理時間は僅少で済むので
、問題とはならない。
発明の詳細
な説明したように本発明によれば、文字列のハツシュ値
に応じて設定されたあふれ情報をその文字列に対応させ
てあふれ情報格納手段に格納するとともに、文字列のア
ルファベット列を識別子として登録されたグループ情報
をその文字列に対応させてグループ情報格納手段に格納
し、文字列による検索時にあふれ情報格納手段に格納さ
れたあふれ情報に基ついて検索を行い、アルファベット
列によるグループ検索時にグループ情報格納手段に格納
されたグループ情報に基づいて検索を行うようにするこ
とによって、アルファベット列をキーとするようなりル
ープ検索の検索処理の回数を削減することかできるとい
う効果かある。
に応じて設定されたあふれ情報をその文字列に対応させ
てあふれ情報格納手段に格納するとともに、文字列のア
ルファベット列を識別子として登録されたグループ情報
をその文字列に対応させてグループ情報格納手段に格納
し、文字列による検索時にあふれ情報格納手段に格納さ
れたあふれ情報に基ついて検索を行い、アルファベット
列によるグループ検索時にグループ情報格納手段に格納
されたグループ情報に基づいて検索を行うようにするこ
とによって、アルファベット列をキーとするようなりル
ープ検索の検索処理の回数を削減することかできるとい
う効果かある。
第1図は本発明の一実施例のデータ構成を示す図、第2
図は本発明の一実施例の動作を示すフローチャート、第
3図は従来例のデータ構成を示す図、第4図は従来例の
動作を示すフローチャー]・である。 主要部分の符号の説明 1・・・データ構造テーブル 1a・・・ ハツシュ値部 1 b ・ IC 1d ・ 1 e ・ 1 f ・ 2・ データ部 あふれポインタ部 グループポインタ部 格納領域 あふれ領域 ハツシュ関数 出願人 日本電気株式会社(外1名)
図は本発明の一実施例の動作を示すフローチャート、第
3図は従来例のデータ構成を示す図、第4図は従来例の
動作を示すフローチャー]・である。 主要部分の符号の説明 1・・・データ構造テーブル 1a・・・ ハツシュ値部 1 b ・ IC 1d ・ 1 e ・ 1 f ・ 2・ データ部 あふれポインタ部 グループポインタ部 格納領域 あふれ領域 ハツシュ関数 出願人 日本電気株式会社(外1名)
Claims (1)
- (1)アルファベット列と数字列とからなる文字列を格
納する文字列格納手段と、前記文字列のハッシュ値を算
出する算出手段と、前記算出手段により算出された前記
文字列のハッシュ値に応じて設定されたあふれ情報を前
記文字列に対応させて格納するあふれ情報格納手段と、
前記アルファベット列を識別子として登録されたグルー
プ情報を前記文字列に対応させて格納するグループ情報
格納手段とを有し、前記文字列による検索時に前記あふ
れ情報格納手段に格納された前記あふれ情報に基づいて
検索を行い、前記アルファベット列によるグループ検索
時に前記グループ情報格納手段に格納された前記グルー
プ情報に基づいて検索を行うようにしたことを特徴とす
る文字列検索方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2126014A JPH0421179A (ja) | 1990-05-16 | 1990-05-16 | 文字列検索方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2126014A JPH0421179A (ja) | 1990-05-16 | 1990-05-16 | 文字列検索方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0421179A true JPH0421179A (ja) | 1992-01-24 |
Family
ID=14924593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2126014A Pending JPH0421179A (ja) | 1990-05-16 | 1990-05-16 | 文字列検索方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0421179A (ja) |
-
1990
- 1990-05-16 JP JP2126014A patent/JPH0421179A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3152868B2 (ja) | 検索装置および辞書/テキスト検索方法 | |
JP2002189747A (ja) | 文書情報の検索方法 | |
CN111984673A (zh) | 一种电网电能量计量系统树形结构模糊检索方法和装置 | |
JPH0421179A (ja) | 文字列検索方式 | |
JPH08305722A (ja) | 文字列検索装置 | |
JPH0363876A (ja) | 検索装置 | |
JPH0836582A (ja) | 文字列正規化規則作成装置、文字列正規化規則作成方法、情報検索装置及び情報検索方法 | |
JPH04215182A (ja) | デ−タ名付与登録装置 | |
JPH05233713A (ja) | 学習形あいまい検索方法 | |
JPH0272489A (ja) | 画像検索装置 | |
JP2922025B2 (ja) | 名前検索方法 | |
JPH10301942A (ja) | データマイニング装置 | |
JPH05313971A (ja) | リレーショナル・データベースにおけるキーワード管理方式 | |
JP2725454B2 (ja) | 文字コード知識処理方式 | |
JPS617937A (ja) | 知識の連想検索方式 | |
JPH0340070A (ja) | データベース検索装置 | |
JP2672899B2 (ja) | 画面プログラムの作成処理方式 | |
JPH06274701A (ja) | 単語照合装置 | |
JPH09330322A (ja) | データ検索装置 | |
JPH0696125A (ja) | 検索画像蓄積方式 | |
JPH05108719A (ja) | 情報検索装置 | |
JPS63238622A (ja) | 関連検索方式 | |
JPH01180632A (ja) | レコード検索方式 | |
JPH02249087A (ja) | 英単語検索装置 | |
JPH05128154A (ja) | データベース検索方式 |