JP2005044125A - 意味分割索引生成・索引検索方法、装置、およびプログラム - Google Patents

意味分割索引生成・索引検索方法、装置、およびプログラム Download PDF

Info

Publication number
JP2005044125A
JP2005044125A JP2003277574A JP2003277574A JP2005044125A JP 2005044125 A JP2005044125 A JP 2005044125A JP 2003277574 A JP2003277574 A JP 2003277574A JP 2003277574 A JP2003277574 A JP 2003277574A JP 2005044125 A JP2005044125 A JP 2005044125A
Authority
JP
Japan
Prior art keywords
index
serial number
band part
length information
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003277574A
Other languages
English (en)
Inventor
Yuichi Shimamura
祐一 島村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003277574A priority Critical patent/JP2005044125A/ja
Publication of JP2005044125A publication Critical patent/JP2005044125A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 データベースにおいて広大な割当て可能空間を持つIDを管理した場合、検索処理が高速な索引を構成する。
【解決手段】 ID体系の意味構造の区分に合わせて、データ列であるIDを、固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割し、帯域部および通番部それぞれに対して帯域部索引と通番部索引を生成し、通番部索引は複数ある帯域部索引の要素に対応してそれぞれ生成する。
【選択図】 図1

Description

本発明は、IDを管理するデータベースにおける索引構成方法、装置、およびプログラムに関する。
様々な情報を格納しその情報を操作するデータベースにおいて、参照処理や更新処理の高速化のために、索引と呼ばれるレコードの格納位置を示す二次情報を、キー情報等の列値から生成し、保持する方法が公知の技術として知られている。
索引は、文字列、数字列、バイナリ列等の型で格納されている列値に対して生成される。列値はキー情報であることが多い。索引の生成方法としては、Bツリー等のツリー構造にレコードの格納位置を記憶するツリー法や、あるハッシュ関数によりハッシュ値を算出しそのハッシュ値に対応してレコードの格納位置を記憶するハッシュ法がある。
ツリー法は格納するレコード数の増減には柔軟に対応できるが、レコード数の増加と共にツリー構造の高さが増し検索処理に時間を要するようになる。また、更新処理の際には木構造のバランスを保つためにリバランス動作が必要となる。リバランス動作は、排他制御のためのロック制御機構も必要となる大きなコストを要する処理である。
ハッシュ法は、基本的にはレコードの増加があっても検索処理に要する時間は変わらないという利点を持っているが、ハッシュ値同士の衝突発生が多くなると、同じハッシュ値となるレコードの格納位置を記憶しているパケット内の検索処理時間が大きくなるため、ハッシュ関数の選定とハッシュ値の空間を適切に設計することが重要になる。このため、レコードの増加が大きい場合や、増加の見込みが立てにくい場合には向いていない。
例えば、あるIDに対応する情報を管理するデータベースでは、キー情報でもあるIDを格納する列値に対して索引を生成することが多い。
Michael J. Folk、 Bill Zoellick著、楠本寛之、浜名祐一訳「bit別冊 ファイル構造」P.169−P.170,P.247−P.248,P.329−P.334 共立出版 渋谷雅昭、山本毅雄著「データ管理算法」P.29−P.32,P.73−P.83 岩波書店発行
上記の従来技術では、
例えば、電話番号(E.164番号)やAuto−IDにおけるEPC(Electronic Product Code)のような広大な割当て可能空間を持つIDをデータベースで管理した際に、
索引をツリー法により構成した場合は、膨大な数のレコードの格納位置をツリー構造の中に格納することになるのでツリーの高さが増し、索引により検索処理時間は長くなり、更新処理の際のリバランス動作も時間を要するようになる。
また、索引をハッシュ法により構成した場合は、膨大な数のレコードの列値を入力としてハッシュ値を計算することになるので、計算されるハッシュ値の衝突率が高くなり、同じハッシュ値となるパケット内の要素数が増え、索引による検索処理時間が長くなる。衝突率を小さくするためには、ハッシュ値の空間を拡大すればよいが、広大な割当て可能空間を持つIDに対応したハッシュ値の空間を用意するのも困難である。また、そのような広大な割当て可能空間を持つIDに対応したハッシュ関数を選定するのも困難である。
このように、従来の技術では、広大な割当て可能空間を持つIDとそのIDに対応する情報をデータベースで管理した際に、膨大なレコードに対する索引を構成することになるので、高速化のための仕組みである索引による検索処理でさえ時間を要するようになってしまうという問題がある。
本発明の目的は、データベースにおいて広大な割当て可能空間を持つIDを管理した場合に、検索処理が高速な索引を生成および検索する方法、装置、プログラムを提供することにある。
図6は本発明の原理を説明するための図である。
本発明は、図6に示すように、ID体系の意味構造の区分に合わせて、文字列、数字列、バイナリ列等のデータ列であるIDを固定部と帯域部と通番部の3つに分割し、帯域部および通番部それぞれに対して帯域部索引と通番部索引を生成する。通番部索引は複数ある帯域部索引の要素に対応してそれぞれ生成する。
また、本発明の帯域部索引はハッシュ法により構成し、各通番部索引はツリー法あるいはハッシュ法により構成する。
固定部は、索引生成対象のデータベース表の中でIDが固定的な値となる部分であり、例えば、IDとしてある市外局番配下の電話番号を管理するデータベース表では、国番号や市外局番にあたる。帯域部は、索引生成対象のデータベース表の中で半固定的な値となり、変化は少ないが可変的な部分であり、例えば、IDとしてある市外局番配下の電話番号を管理するデータベース表では、市内局番にあたる。通番部は、索引生成対象のデータベース表の中で全くランダムな値となり、変化が大きい部分であり、例えば、IDとしてある市外局番配下の電話番号を管理するデータベース表では、加入者番号にあたる。
帯域部索引の要素数は限られているので、衝突率が0もしくは非常に低くなるようにハッシュ関数を選定するのは容易である。
また、本発明の索引生成方法は、
索引の生成対象となるIDの意味構造における固定部長さ情報と帯域部長さ情報が記録されている、記憶装置内のID情報表を参照して固定部長さ情報と帯域部長さ情報を取得するステップと、
記憶装置内のデータベース表からIDとそのIDに対応するレコードの格納位置を取得するステップと、
固定部長さ情報と帯域部長さ情報により、データベース表から取得したIDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割するステップと、
分割されたIDの帯域部に対してハッシュ法を適用し、対応する帯域部索引の要素を選択し、選択された帯域部索引の要素に対応する通番部索引を確定するステップと、
通番部索引をツリー法により構成する場合は、分割されたIDの通番部に対してツリー法を適用し、通番部索引の要素を生成し、生成された要素に前記レコードの格納位置を登録し、通番部索引をハッシュ法により構成する場合は、分割されたIDの通番部に対してハッシュ法を適用し、確定された通番部索引の要素を選択し、選択された要素に前記レコードの格納位置を登録するステップを有する。
本発明の他の索引検索方法は、
検索を行う対象となるIDを取得するステップと、
ID情報表を参照して固定部長さ情報と帯域部長さ情報を取得するステップと、
固定部長さ情報と帯域部長さ情報により、前記IDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割するステップと、
分割されたIDの帯域部に対してハッシュ法を適用し、対応する帯域部索引の要素を選択し、選択された帯域部索引の要素に対応する通番部索引を確定するステップと、
分割したIDの通番部に対してツリー法あるいはハッシュ法を適用し、確定された通番部索引の要素を選択し、選択された要素から、前記IDに対応するレコードの格納位置を確定するステップを有する。
本発明では、索引生成対象となるID列に対して1個の索引を生成するのではなく、IDの意味構造の区分に合わせてIDを固定部と帯域部と通番部の3つに分割し、固定部は除外し、帯域部および通番部それぞれに対して索引を構成することにより、ID全体のうち固定部および帯域部までの部分は、帯域部索引の1回もしくは非常に少ない回数のハッシュ法による検索により特定することが可能になっている。
これは、要素数が限られている帯域部索引において衝突率を0もしくは非常に低くなるようなハッシュ関数を選定することが容易だからである。
そして、通番部の検索も要素数が限られたツリー法やハッシュ法による通番部索引の検索になるので、短い時間での検索処理が可能になっている。これは、帯域部索引の各要素に対応して複数の通番部索引を生成するため、各通番部索引で管理する要素数の大小の制御が可能であり、ツリー法による通番部索引において少ない要素数のツリーとすることや、ハッシュ法による通番部索引における衝突率を0もしくは非常に低くするようなハッシュ関数の選定およびハッシュ値の空間の用意が容易だからである。
したがって、IDを分割せずにツリー法で索引を構成した場合や、IDを分割せずにハッシュ法で索引を構成した場合に比べ、検索処理の時間を短縮することが可能となる。
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明の一実施形態で、インターネットにおいてドメイン名を管理する名前データベースであるDNS(Domain Name System)サーバにおいて、ENUM(RFC2916)の仕組みによりIDとして電話番号を管理するシステムを示している。
本システムでは、DNSサーバ装置2とDNSクライアント装置3がネットワーク4を介して接続されている。
DNSサーバ装置2は索引構成装置1とDNS検索処理部21とDNS名前データベース表22から構成されている。
DNS名前データベース表22は、ドメイン名22aと、それに対応するリソースレコード22bを列値として持つデータベース表である。
IDとしての電話番号は、ENUMの仕組みによりドメイン名に変換される。例えば、「+81−3−123−4567」という電話番号(E.164番号)は、「7.6.5.4.3.2.1.3.1.8.e164.arpa.」というドメイン名に変換される。
IDである電話番号は国番号、市外局番、市内局番、加入者番号という意味構造に分割することができるので、DNSサーバ装置2が、市外局番が3配下(「+81−3−XXX−YYYY」)の電話番号に対応する名前空間を管理するDNSサーバだとすると、固定部は「3.1.8.e164.arpa.」、帯域部は「X.X.X」、通番部は「Y.Y.Y.Y」とすることができる。
索引構成装置1は索引生成部11と索引検索部12とID情報表管理部13と帯域部索引管理部14と通番部索引管理部15とID情報表16と帯域部索引17と通番部索引18から構成される。本実施形態では、通番部索引18はツリー法により構成されるものとする。
DNS名前データベース表22、ID情報表16、帯域部索引17、通番部索引18は記憶装置に記憶されている。
索引生成部11はDNS名前データベース表22から列値としてIDとそのIDのレコード(ドメイン名22aとリソースレコード22b)の格納位置(記憶装置上の位置情報)を取得し、ID情報管理部13から取得した固定部長さ情報16aと通番部長さ情報16bによりIDを固定部と帯域部と通番部の3つに分割し、帯域部索引管理部14および通番部索引管理部15を使って帯域部索引17および通番部索引18を生成し、取得したレコード格納位置を生成された帯域部索引17、通番部索引18に登録する(記憶させる)。索引検索部12は、検索対象となるIDをDNS検索処理部21から取得し、ID情報表管理部13から取得した固定部長さ情報16aと帯域部長さ情報16bによりIDを固定部と帯域部と通番部の3つに分割し、帯域部索引管理部14および通番部索引管理部15を使って帯域部索引17および通番部索引18を検索し、レコード格納位置を確定(検索)する。ID情報表管理部13は、固定部長さ情報16aと帯域部長さ情報16bを列値として持つID情報表16を管理する。帯域部索引管理部14は、帯域部索引17の要素の管理をする。帯域部索引管理部15は通番部索引18の要素を管理をする。
図2は本システムにおける索引の生成に関する処理のフローチャート、図3はそのシーケンス図である。
索引生成部11による索引生成の事前準備として、DNSサーバ装置2のオペレータは、索引の生成対象となるIDの意味構造に応じて、ID情報表16に固定部長さ情報16aと帯域部長さ情報16bを設定する(ステップ101)。
次に、索引生成部11では、ID情報表16を参照して固定部長さ情報16aと帯域部長さ情報16bを取得し(ステップ102)、DNS名前データベース表22から列値としてID(ドメイン名22a)とそのIDのレコードの格納位置を取得する(ステップ103)。次に、固定部長さ情報16aと帯域部長さ情報16bにより、DNS名前データベース表22から取得したIDを固定部、帯域部、通番部の3つに分割する(ステップ104)。次に、分割されたIDの帯域部に対してハッシュ法を適用し、複数ある通番部索引のうちどれか1つを選択する。すなわち分割されたIDの帯域部をハッシュ関数の入力としてハッシュ値を算出し、算出されたハッシュ値に対する要素を帯域部索引17から検索し選択する。帯域部索引17の各要素には、複数ある通番部索引18のうちのどれか1つを選択するための情報が記憶されているので、検索された帯域部索引17の要素から通番部索引18が選択される(ステップ105)。通番部索引をツリー法により構成する場合は、分割されたIDの通番部に対してツリー法を適用し、レコード格納位置を通番部索引18に記憶させる。すなわち、分割されたIDの通番部に対する要素を、ステップ105で特定された通番部索引18から検索し、その要素にレコード格納位置を記憶させる。
(ステップ106)。通番部索引をハッシュ法により構成する場合は、分割されたIDの通番部に対してハッシュ法を適用し、レコード格納位置を通番部索引18に記憶させる。すなわち、分割されたIDの通番部をハッシュ関数の入力としてハッシュ値を算出し、算出されたハッシュ値に対する要素を通番部索引18から検索し、その要素にレコード格納位置を記憶させる(ステップ106)。
次に、索引の生成の処理を具体例により説明する。
DNS検索処理は、DNSクライアント装置3がDNSサーバ装置2にドメイン名を問い合わせ、DNSサーバ装置2がそのドメイン名に対応するリソースレコードを応答する動作である。
DNS名前データベース表22には、市外局番が3配下(「+81−3−XXX−YYYY」)の電話番号に対応する名前が管理されているものとする。
DNSサーバ装置2では、索引生成の事前準備としてDNSサーバ装置2のオペレータが、ID情報管理部13を使ってID情報表16に固定部長さ情報16aおよび通番部長さ情報16bとしてそれぞれ「5」および「3」を設定する(ステップ101)。
索引構成装置1では、索引生成として、索引生成部11が、ID情報管理部13を使ってID情報表16から固定部長さ情報16aおよび通番部長さ情報16bとしてそれぞれ「5」および「3」を取得し(ステップ102)、DNS名前データベース表22に格納されているドメイン名22aとその格納位置を取得し(ステップ103)、固定部長さ情報16aおよび通番部長さ情報16bを使ってドメイン名22aを固定部と帯域部と通番部の3つに分割する(ステップ104)。例えば、「7.6.5.4.3.2.1.3.1.8.e164.arpa.」というドメイン名の場合には、固定部長さ情報16aおよび通番部長さ情報16bがそれぞれ「5」、「3」なので、固定部は「3.1.8.e164.arpa.」、帯域部は「3.2.1」、通番部は「7.6.5.4」となる。
次に、索引生成部11は、帯域部索引管理部14を使って帯域部「3.2.1」に対応する帯域部索引17の要素を検索して対応する通番部索引18を選択し(ステップ105)、通番部索引管理部15を使って、選択された通番部索引18の中に通番部「7.6.5.4」に対応する要素を生成し、生成された要素にレコード格納位置を記憶させる(ステップ106)。
複数のドメイン名がDNS名前データベース表22に格納されている場合は、ステップ103からステップ106を繰り返して索引を生成していく。
図4は索引の検索に関する処理のフローチャート、図5はそのシーケンス図である。索引検索部12による索引検索の前準備としてDNSクライアント装置3は所定のドメイン名に対応するリソースレコードをDNSサーバ装置2に問い合わせる(ステップ201)。DNSサーバ装置2ではDNS検索処理部21が問い合わせを受けて、問い合わされたドメイン名に対応するリソースレコードを検索するために、問い合わせされたドメイン名に対するレコードの格納位置を索引検索部12に問い合わせる(ステップ202)。索引検索部12はID情報管理部13を使ってID情報表16から固定部長さ情報16aと帯域部長さ情報16bを取得し(ステップ203)、固定部長さ情報16aと帯域部長さ情報16bにより、検索対象となるIDを固定部と帯域部と通番部の3つに分割し(ステップ204)、分割されたIDの帯域部に対してハッシュ法を適用し、索引生成の場合と同様にして、対応する帯域部索引17の要素を選択し、選択された帯域部索引17の要素に対応する通番部索引18を選択し(ステップ205)、分割されたIDの通番部に対してツリー法あるいはハッシュ法を適用し、索引生成の場合と同様にして、記憶された通番部索引18の要素を選択し、選択された要素からレコードの格納位置を選択し(ステップ206)、DNS検索処理部21に選択されたレコード格納位置を応答する(ステップ207)。
DNS検索処理部21は索引検索部12より応答されたレコード格納位置の情報を元にDNS名前データベース表22を検索し、問い合わされたドメイン名に対応するリソースレコード22bを取得し(ステップ208)、DNSクライアント装置3にリソースレコード22bを応答する(ステップ209)。
次に、索引の検索の処理を具体例により説明する。
「7.6.5.4.3.2.1.3.1.8.e164.arpa.」というドメイン名に対応するリソースレコードを検索するものとする。
DNSクライアント装置3ではネットワーク4を介してDNSサーバ装置2に対して、「7.6.5.4.3.2.1.3.1.8.e164.arpa.」というドメイン名に対応するリソースレコードを問い合わせる(ステップ201)。
DNSサーバ装置2では、DNS検索処理部21が問い合わせを受けて、問い合わされたドメイン名に対応するリソースレコードを検索するために、索引を検索する。具体的には、レコードの格納位置を索引検索部12に問い合わせる(ステップ202)。
索引検索部12では、ID情報管理部13を使ってID情報管理表16から固定部長さ情報16aおよび通番部長さ情報16bとしてそれぞれ「5」および「3」を取得し(ステップ203)、問い合わされたドメイン名「7.6.5.4.3.2.1.3.1.8.e164.arpa.」を固定部と帯域部と通番部の3つに分割する(ステップ204)。固定部長さ情報16aおよび通番部長さ情報16bがそれぞれ「5」および「3」なので、固定部は「3.1.8.e164.arpa.」、帯域部は「3.2.1」、通番部は「7.6.5.4」となる。次に、索引検索部12は、帯域部索引管理部14を使って帯域部「3.2.1」に対応する帯域部索引17の要素を検索して対応する通番部索引を確定し(ステップ205)、通番部索引管理部15を使って、確定した通番部索引18の中から通番部「7.6.5.4」に対応する要素を選択し、選択した要素からレコードの格納位置を確定し(ステップ206)、DNS検索処理部21にレコード格納位置を応答する(ステップ207)。
DNS検索処理部21は、索引検索部12により検索されたレコード格納位置の情報を元にDNS名前データベース表22を検索し、問い合わされたドメイン名「7.6.5.4.3.2.1.3.1.8.e164.arpa.」に対応するリソースレコード22bを取得し(ステップ208)、DNSクライアント装置3にリソースレコード22bを応答する(ステップ209)。
なお、DNS検索処理部および索引構成装置は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フロッピーディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。
本発明の一実施形態のシステム構成図である。 索引生成の処理を示すフローチャートである。 索引の生成に関するシステム全体の動作のシーケンス図である。 索引検索の処理を示すフローチャートである。 DNS検索処理に関するシステム全体の動作のシーケンス図である。 IDの分割に関する本発明の原理を説明する図である。
符号の説明
1 索引構成装置
2 DNSサーバ装置
3 DNSクライアント装置
4 ネットワーク
11 索引生成部
12 索引検索部
13 ID情報管理部
14 帯域部索引管理部
15 通番部索引管理部
16 ID情報表
16a 固定部長さ情報
16b 帯域部長さ情報
17 帯域部索引
18 通番部索引
21 DNS検索処理部
22 DNS名前データベース表
22a ドメイン名
22b リソースレコード
101〜106,201〜209 ステップ

Claims (10)

  1. IDを管理するデータベースにおける索引生成方法であって、
    ID体系の意味構造の区分に合わせて、データ列であるIDを、固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割し、
    帯域部および通番部それぞれに対して帯域部索引と通番部索引を生成し、
    前記通番部索引は複数ある帯域部索引の要素に対応してそれぞれ生成する索引生成方法。
  2. 前記帯域部索引はハッシュ法により構成し、
    各通番部索引はツリー法あるいはハッシュ法により構成する、請求項1に記載の索引生成方法。
  3. IDを管理するデータベースにおける索引検索方法であって、
    ID体系の意味構造の区分に合わせて、データ列であるIDを、固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割し、
    分割されたIDの帯域部に対してハッシュ法を適用して帯域部索引を検索し、複数ある通番部索引の中から1つの通番部索引を選択し、
    分割されたIDの通番部に対してツリー法あるいはハッシュ法を適用して選択された通番部索引を検索し、前記IDに対応するレコードの格納位置を確定する索引検索方法。
  4. IDを管理するデータベースにおける索引生成方法であって、
    索引の生成対象となるIDの意味構造における固定部長さ情報と帯域部長さ情報が記録されている、記憶装置内のID情報表を参照して固定部長さ情報と帯域部長さ情報を取得するステップと、
    記憶装置内のデータベース表からIDとそのIDに対応するレコードの格納位置を取得するステップと、
    前記固定部長さ情報と前記帯域部長さ情報により、前記データベース表から取得したIDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割するステップと、
    分割されたIDの帯域部に対してハッシュ法を適用し、対応する帯域部索引の要素を選択し、選択された帯域部索引の要素に対応する通番部索引を確定するステップと、
    通番部索引をツリー法により構成する場合は、分割されたIDの通番部に対してツリー法を適用し、通番部索引の要素を生成し、生成された要素に前記レコードの格納位置を登録し、通番部索引をハッシュ法により構成する場合は、分割されたIDの通番部に対してハッシュ法を適用し、確定された通番部索引の要素を選択し、選択された要素に前記レコードの格納位置を登録するステップを有する索引生成方法。
  5. 前記ID情報表に固定部長さ情報と帯域部長さ情報を設定するステップをさらに有する、請求項4に記載の索引生成方法。
  6. IDを管理するデータベースにおける索引検索方法であって、
    検索を行う対象となるIDを取得するステップと、
    索引の生成対象となるIDの意味構造における固定部長さ情報と帯域部長さ情報が記録されている、記憶装置内のID情報表を参照して固定部長さ情報と帯域部長さ情報を取得するステップと、
    前記固定部長さ情報と前記帯域部長さ情報により、前記IDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割するステップと、
    分割されたIDの帯域部に対してハッシュ法を適用し、対応する帯域部索引の要素を選択し、選択された帯域部索引の要素に対応する通番部索引を確定するステップと、
    分割されたIDの通番部に対してツリー法あるいはハッシュ法を適用し、確定された通番部索引の要素を選択し、選択された要素から、前記IDに対応するレコードの格納位置を確定するステップを有する索引検索方法。
  7. IDを管理するデータベースにおける索引生成および索引検索のための索引構成装置であって、
    固定部長さ情報と帯域部長さ情報をレコードとして持つID情報表を管理するID情報表管理手段と、
    帯域部索引の要素の管理をする帯域部索引管理手段と、
    通番部索引の要素を管理をする通番部索引管理手段と、
    記憶装置内のデータベース表からIDとそのIDに対応するレコードの格納位置を取得し、前記ID情報表管理手段から取得した固定部長さ情報と帯域部長さ情報により前記IDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割し、前記帯域部索引管理手段および前記通番部索引管理手段を使って帯域部索引および通番部索引を生成し、前記レコードの格納位置を登録する索引生成手段と、
    検索対象となるIDを取得し、前記ID情報表管理手段から取得した固定部長さ情報と帯域部長さ情報により前記IDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割し、前記帯域部索引管理手段および前記通番部索引管理手段を使って帯域部索引および通番部索引を検索し、該IDに対応するレコードの格納位置を確定する索引検索手段とを有する索引構成装置。
  8. IDを管理するデータベースにおける索引生成をコンピュータに実行させるための索引生成プログラムであって、
    索引の生成対象となるIDの意味構造における固定部長さ情報を帯域部長さ情報が記録されている、記憶装置内のID情報表を参照して固定部長さ情報と帯域部長さ情報を取得する手順と、
    記憶装置内のデータベース表からIDとそのIDに対応するレコードの格納位置を取得する手順と、
    前記固定部長さ情報と前記帯域部長さ情報により、前記データベース表から取得したIDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割する手順と、
    分割されたIDの帯域部に対してハッシュ法を適用し、対応する帯域部索引の要素を選択し、選択された帯域部索引の要素に対応する通番部索引を確定する手順と、
    通番部索引をツリー法により構成する場合は、分割されたIDの通番部に対してツリー法を適用し、通番部索引の要素を生成し、生成された要素に前記レコードの格納位置を登録し、通番部索引をハッシュ法により構成する場合は、分割されたIDの通番部に対してハッシュ法を適用し、確定された通番部索引の要素を選択し、選択された要素に、前記レコードの格納位置を登録する手順を有する索引生成プログラム。
  9. 前記ID情報表に固定部長さ情報と帯域部長さ情報を設定する手順をさらに有する、請求項8に記載の索引生成プログラム。
  10. IDを管理するデータベースにおける索引検索をコンピュータに実行させる索引検索プログラムであって、
    検索を行う対象となるIDを取得する手順と、
    索引の生成対象となるIDの意味構造における固定部長さと帯域部長さが情報が記録されている、記憶装置内のID情報表を参照して固定部長さ情報と帯域部長さ情報を取得する手順と、
    前記固定部長さ情報と前記帯域部長さ情報により、前記IDを固定的な固定部、半固定的な帯域部、ランダムな通番部の3つに分割する手順と、
    分割されたIDの帯域部に対してハッシュ法を適用し、対応する帯域部索引の要素を選択し、選択された帯域部索引の要素に対応する通番部索引を確定する手順と、
    分割されたIDの通番部に対してツリー法あるいはハッシュ法を適用し、確定された通番部索引の要素を選択し、選択された要素から、前記IDに対応するレコードの格納位置を確定する手順を有する索引検索プログラム。
JP2003277574A 2003-07-22 2003-07-22 意味分割索引生成・索引検索方法、装置、およびプログラム Pending JP2005044125A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003277574A JP2005044125A (ja) 2003-07-22 2003-07-22 意味分割索引生成・索引検索方法、装置、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003277574A JP2005044125A (ja) 2003-07-22 2003-07-22 意味分割索引生成・索引検索方法、装置、およびプログラム

Publications (1)

Publication Number Publication Date
JP2005044125A true JP2005044125A (ja) 2005-02-17

Family

ID=34264262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003277574A Pending JP2005044125A (ja) 2003-07-22 2003-07-22 意味分割索引生成・索引検索方法、装置、およびプログラム

Country Status (1)

Country Link
JP (1) JP2005044125A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58112141A (ja) * 1981-12-25 1983-07-04 Fujitsu Ltd ハツシング処理方式
JPH06139280A (ja) * 1992-10-29 1994-05-20 Toshiba Corp ファイル管理システム
JPH11134232A (ja) * 1997-10-29 1999-05-21 Hitachi Building Systems Co Ltd データ記憶・検索方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58112141A (ja) * 1981-12-25 1983-07-04 Fujitsu Ltd ハツシング処理方式
JPH06139280A (ja) * 1992-10-29 1994-05-20 Toshiba Corp ファイル管理システム
JPH11134232A (ja) * 1997-10-29 1999-05-21 Hitachi Building Systems Co Ltd データ記憶・検索方式

Similar Documents

Publication Publication Date Title
KR100981857B1 (ko) 인덱스 키를 사용하여 검색 범위를 제한하기 위한 시스템및 방법
CN110362727B (zh) 用于搜索系统的第三方搜索应用
US9703830B2 (en) Translation of a SPARQL query to a SQL query
JP5203733B2 (ja) コーディネータサーバ、データ割当方法及びプログラム
CN107783985B (zh) 一种分布式数据库查询方法、装置及管理系统
CN101416179A (zh) 用来向每个用户提供调整推荐字的系统和方法及记录用来执行上述方法的程序的计算机可读记录介质
CN111475105B (zh) 监控数据存储方法、设备、服务器及存储介质
CN109815232B (zh) 一种利用二叉查找树的数据排名的检索、数据处理的方法和系统
JP2006092316A (ja) 構造化文書検索装置、構造化文書検索方法及び構造化文書検索のためのデータを記憶した記憶媒体
RU2348062C2 (ru) Способ и устройство для динамического связывания/динамического разрешения путевых имен
US8055744B2 (en) Resolution of group membership for resources
US20100281053A1 (en) Method, apparatus, and computer-readable medium for distributing a query
CN106682210B (zh) 日志文件查询方法及装置
JP5492146B2 (ja) データベースシステム及び制御方法
CN107239568B (zh) 分布式索引实现方法及装置
JP5367179B1 (ja) データ処理装置、データ管理システム、データ処理方法およびプログラム
JP2005044125A (ja) 意味分割索引生成・索引検索方法、装置、およびプログラム
CN107515867B (zh) 一种NoSQL数据库的数据存储、查询方法和装置以及一种rowKey全组合的生成方法和装置
KR102503028B1 (ko) 블룸필터를 이용한 분산식별자 검색 방법
JP4331733B2 (ja) 検索処理装置、検索処理方法および検索処理プログラム
CN107545026B (zh) 一种接口名字解析树功能的实现方法和装置
CN112579743B (zh) 一种说明书内容查询方法、装置、电子设备及存储介质
JP2005210513A (ja) ドメイン名別ビューアクセス制御方法及びdnsサーバシステム装置及びドメイン名別ビューアクセス制御プログラム及びドメイン名別ビューアクセス制御プログラムを格納した記憶媒体
JP3630045B2 (ja) T木インデックス構築方法及びt木インデックス検索方法及びt木インデックス構築装置及びt木インデックス検索装置及びt木インデックス構築プログラムを格納した記憶媒体及びt木インデックス検索プログラムを格納した記憶媒体
US8423532B1 (en) Managing data indexed by a search engine

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071003

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080319

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080411

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090709

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090909