JPH06332799A - 木情報格納方式 - Google Patents

木情報格納方式

Info

Publication number
JPH06332799A
JPH06332799A JP5145412A JP14541293A JPH06332799A JP H06332799 A JPH06332799 A JP H06332799A JP 5145412 A JP5145412 A JP 5145412A JP 14541293 A JP14541293 A JP 14541293A JP H06332799 A JPH06332799 A JP H06332799A
Authority
JP
Japan
Prior art keywords
data
node
speed storage
storage unit
tree structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5145412A
Other languages
English (en)
Other versions
JP2560610B2 (ja
Inventor
Hajime Watabe
元 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5145412A priority Critical patent/JP2560610B2/ja
Publication of JPH06332799A publication Critical patent/JPH06332799A/ja
Application granted granted Critical
Publication of JP2560610B2 publication Critical patent/JP2560610B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Memory System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 木構造を有するデータの処理を行う場合に、
低速記憶部へのアクセス回数を減らしてデータ処理時間
を短縮する。 【構成】 木構造を有する各データが木構造に従ってア
クセスされる場合に、各データ毎にアクセス回数を算出
すると共に、このアクセス回数に基づいて各データの参
照確率を求め、低速記憶部M2に格納されているデータ
のうち参照確率の高いデータを選択して読み出し高速記
憶部M1に格納する。したがって、各データを参照して
データ処理を行う場合に低速記憶部へのアクセスを少な
くでき、高速でデータ処理を行うことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、木構造にしたがってア
クセスされるデータを格納する木情報格納方式に関す
る。
【0002】
【従来の技術】従来のこの種の木情報格納方式を適用し
た装置は、図3に示すように、CPU1、高速記憶部M
1、低速記憶部M2から構成されている。ここで、低速
記憶部M2のデータ格納エリアD2には各データb1 ,
b2 ,b3 ,・・・,bn が格納されている。また、こ
れらの各データには各々ラベルが付与されこれらのラベ
ルは上記各データに対応する各ノードa1 ,a2 ,a3
,・・・,an として高速記憶部M1に格納される。
なお、これらの各ノードa1 ,a2 ,a3 ,・・・,a
n は、木構造となっており、これらのノードは木構造体
Tとして高速記憶部M1に格納される。ここで本装置の
データ参照方式は、各ノードが木構造となっていること
から、或ノードに対応するデータが参照されると、これ
より先祖のノード、つまり「葉」から「根」のノードに
相応するデータへと順次参照されるものである。即ち、
ノードak に対応するデータbk が参照されると、先祖
のノードであるノードa1 の方向へ順次参照が行われ
る。そしてこのとき対応するデータbk は低速記憶部M
2のエリアD2から読みだされ高速記憶部M1のデータ
格納エリアD1に格納される。
【0003】図4は、このような従来装置のCPU1の
動作を示すフローチャートである。即ち、CPU1がス
テップST11で木構造体Tのノードakを選択したと
する。するとステップST12では、高速記憶部M1の
データ格納エリアD1中からノードak に対応するデー
タbk の検索を開始する。次いで、ステップST13で
は高速記憶部M1内のエリアD1中にデータbk の有無
を判断し、データbkがエリアD1に存在しなければス
テップST14で低速記憶部M2のデータ格納エリアD
2から該当のデータを読みだし高速記憶部M1のデータ
格納エリアD1へ格納する。続いてステップST15で
はデータ格納エリアD1上のデータbkを参照する。
【0004】次にステップST16では、「k=1」つ
まりデータの参照がノードa1 まで行われたか否かを判
断し、これが「N」となると、ノードa1 の方向にノー
ドが選択されるように次のノードをステップST17で
選択する。そしてステップST12へ戻り、選択された
ノードに対応するデータの参照を行う。このようなデー
タの参照動作は、ノードa1 に対応するデータb1 の参
照が終了するまで繰り返し反復実行される。ここで、低
速記憶部M2のデータbk を読み出して高速記憶部M1
に格納する際には、格納エリアD1上の旧データを1つ
つぶしてこのエリアに格納しなければならない。この場
合、つぶされる旧データは、このデータにアクセスした
時刻に基づいて決定される。
【0005】
【発明が解決しようとする課題】従来は、各ノードに対
応するデータを参照しようとする際には、データが高速
記憶部M1に存在しなければ低速記憶部M2から読み出
すようにしており、低速記憶部M2へのアクセスは時間
がかかることから、データの処理時間が長くなるという
欠点があった。
【0006】したがって本発明は、木構造を有するデー
タの処理を行う場合に、低速記憶部へのアクセス回数を
減らしてデータ処理時間を短縮することを目的とする。
【0007】
【課題を解決するための手段】このような課題を解決す
るために本発明は、各データを木構造に従ってアクセス
した場合のアクセス回数を各データ毎に算出するアクセ
ス回数算出手段と、算出された各データのアクセス回数
に基づいて各データの参照確率を算出する参照確率算出
手段と、低速記憶部に格納されたデータのうち参照確率
の高いデータを選択して高速記憶部へ格納する手段とを
設けたものである。
【0008】
【作用】木構造を有する各データが木構造にしたがって
アクセスされる場合に、各データ毎にアクセス回数が算
出されると共に、アクセス回数に基づいて各データの参
照確率が求められ、参照確率の高いデータが高速記憶部
に格納される。したがって、各データを参照してデータ
処理を行う場合に低速記憶部へのアクセスを少なくで
き、高速でデータ処理を行うことができる。
【0009】
【実施例】以下、本発明について図面を参照して説明す
る。図1は本発明に係る木情報格納方式を適用した装置
のブロック図である。ここで、図1に示す装置の構成は
上記した図3に示す従来構成とほぼ同一の構成となって
いるが、従来例とは、高速記憶部M1内のデータ格納エ
リアD1に対するデータの格納方法の点が異なってい
る。
【0010】ところで、低速記憶部M2のデータ格納エ
リアD2には本装置の全てのデータb1 ,b2 ,b3 ,
・・・,bn が格納されていると共に、これらの各デー
タに対応した各ノードa1 ,a2 ,a3 ,・・・,an
は、例えば「根」に相当するノードa1 から「葉」に相
当するノードan までの木構造体Tとして高速記憶部M
1内の木構造体格納エリアTEに格納されている。した
がって、各データを検索する場合、本装置は、各データ
に対応する各ノードが木構造となっていることから、こ
の木構造にしたがい順次データの検索を行うように構成
されている。従来は、高速アクセス可能な高速記憶部M
1内のデータ格納エリアD1に格納されるデータは、木
構造とは無関係に格納されており、このため木構造にし
たがってデータを検索した場合、上記エリアD1には該
当するデータが存在せずに高速アクセス不可能な低速記
憶部M2内のデータ格納エリアD2がしばしばアクセス
され、データ処理に時間がかかる欠点を有していた。こ
れに対して、本装置では、高速アクセスが可能なデータ
格納エリアD1にアクセス頻度の高いデータを格納する
ものである。
【0011】一般に、上記した「根」ノードと「葉」ノ
ードとの関係、即ち「親」ノードと「子」ノードとの関
係を有する木構造データは、「子」ノードに対応するデ
ータが参照されると、必ず「親」ノードに対応するデー
タも参照される関係にあり、したがって、「親」ノード
のデータ参照確率は「子」ノードのデータ参照確率より
も高くなる。本装置では、このような各ノードが参照さ
れる確率を予め計算し、この確率の高いものから順番に
上記高速記憶部M1のエリアD1に格納することによ
り、高速アクセスが不可能な低速記憶部M2内のデータ
格納エリアD2へのアクセス回数を減らし、データ処理
時間を短縮するようにしたものである。
【0012】次に、上記実施例装置のCPU1の動作を
図2のフローチャートに基づいて説明する。本実施例装
置では、参照される高速記憶部M1のデータ格納エリア
D1のデータは、予め次の手順により設定される。即
ち、ステップST1として、ノードをai とした場合、
まずノードai の呼出回数(即ち、アクセス回数)Ni
を求める。即ち、
【0013】
【数1】
【0014】ここで式中のIは、ノードai を「親」
ノードとした場合、「子孫」に相当するノードを意味し
ている。即ち、各ノードは木構造を有していることから
ノードai の総アクセス回数Ni は、ノードai のみの
アクセス回数ni に、子孫のノードがアクセスされるこ
とによりアクセスされる回数を加えた総和として表され
る。
【0015】こうしてノードai の総アクセス回数Ni
が算出されると、同様に各ノードについてそれぞれその
総アクセス回数を求め、さらに全ノードのアクセス回数
の総和(後述の式中の分母に相当)を算出する。次
に、ノードai の総アクセス回数Ni と全ノードのアク
セス回数の総和とからノードai のアクセス確率Pi を
次式にしたがって算出する。即ち、
【0016】
【数2】
【0017】こうして、ノードai のアクセス確率Pi
が算出されると、同様に各ノードのアクセス確率を算出
する。次にステップST2では、算出された各ノードの
アクセス確率のうち、値の大きいものから順にl(エ
ル)個(i1 ,i2 ,i3 ,・・・,il )選択する。
そしてステップST3では、選択されたアクセス確率を
有するノードに対応するデータ(bi1,bi2,bi3,・
・・,bil)を、低速記憶部M2のデータ格納エリアD
2から読みだして高速記憶部M1のデータ格納エリアD
1へ格納する。
【0018】このようにしてアクセス頻度の高いデータ
を高速記憶部M1のエリアD1へ予め格納しておくこと
により、データ参照の際には高速アクセス可能なエリア
D1がアクセスされることになり、データの処理時間を
従来例と比べて大幅に短縮することができる。なお、デ
ータ参照の際にエリアD1にデータが存在しない場合
は、低速記憶部M2のデータ格納エリアD2を検索して
このエリアから該当のデータを読み出すが、この際、読
み出したデータは高速記憶部M1のエリアD1には格納
しない。
【0019】
【発明の効果】以上説明したように本発明によれば、木
構造を有する各データが木構造にしたがってアクセスさ
れる場合に、各データ毎にアクセス回数を算出すると共
に、このアクセス回数に基づいて各データの参照確率を
求め、参照確率の高いデータを高速記憶部に格納するよ
うにしたので、各データを参照してデータ処理を行う場
合に低速記憶部へのアクセスを少なくでき、したがって
高速でデータ処理が行えるという効果がある。
【図面の簡単な説明】
【図1】本発明に係る木情報格納方式を適用した装置の
一実施例を示すブロック図である。
【図2】上記実施例装置の動作を示すフローチャートで
ある。
【図3】従来装置のブロック図である。
【図4】従来装置の動作を示すフローチャートである。
【符号の説明】
1 CPU M1 高速記憶部 M2 低速記憶部 D1,D2 データ格納エリア TE 木構造体格納エリア
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成6年5月12日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正内容】
【0007】
【課題を解決するための手段】このような課題を解決す
るために本発明は、各データを木構造に従ってアクセス
した場合のアクセス回数を各データ毎に算出するアクセ
ス回数算出手段と、算出された各データのアクセス回数
に基づいて各データの参照確率を算出する参照確率算出
手段と、低速記憶部に格納されたデータのうち参照確率
の高いデータを選択して高速記憶部へ格納する手段とを
設けたものである。また、アクセス回数算出手段による
アクセス回数の算出は、あるノードのみのアクセス回数
にそのノードの葉に対するノードのアクセス回数を加算
した総和としてそのノードの総アクセス回数を求め、参
照確率算出手段によるアクセス確率の算出は、前記ノー
ドの総アクセス回数を全ノードについて算出して全ノー
ドアクセス回数総和を求め、前記あるノードの総アクセ
ス回数をこの全ノードアクセス回数総和で除してそのノ
ードのアクセス確率として求めるものである。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 高速記憶部及び低速記憶部を備え、前記
    各記憶部の何れか一方に格納された木構造を有する各デ
    ータを前記木構造にしたがってアクセスしデータ処理を
    行うデータ処理装置において、 各データを前記木構造にしたがってアクセスした場合の
    アクセス回数を各データ毎に算出するアクセス回数算出
    手段と、算出された各データのアクセス回数に基づいて
    各データの参照確率を算出する参照確率算出手段と、前
    記低速記憶部に格納されたデータのうち参照確率の高い
    データを選択して前記高速記憶部へ格納する手段とを備
    えたことを特徴とする木情報格納方式。
JP5145412A 1993-05-26 1993-05-26 データ処理装置 Expired - Lifetime JP2560610B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5145412A JP2560610B2 (ja) 1993-05-26 1993-05-26 データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5145412A JP2560610B2 (ja) 1993-05-26 1993-05-26 データ処理装置

Publications (2)

Publication Number Publication Date
JPH06332799A true JPH06332799A (ja) 1994-12-02
JP2560610B2 JP2560610B2 (ja) 1996-12-04

Family

ID=15384665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5145412A Expired - Lifetime JP2560610B2 (ja) 1993-05-26 1993-05-26 データ処理装置

Country Status (1)

Country Link
JP (1) JP2560610B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676401B2 (en) 1998-03-26 2010-03-09 Sharp Kabushiki Kaisha Data distribution system and data selling apparatus therefor, data retrieving apparatus, duplicated data detecting system, and data reproduction apparatus
JP2011076420A (ja) * 2009-09-30 2011-04-14 Toshiba Corp 構造化文書検索システム及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5885986A (ja) * 1981-11-18 1983-05-23 Hitachi Ltd 記憶装置
JPS62293451A (ja) * 1986-06-12 1987-12-21 Nec Corp キユ−フアイルの操作方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5885986A (ja) * 1981-11-18 1983-05-23 Hitachi Ltd 記憶装置
JPS62293451A (ja) * 1986-06-12 1987-12-21 Nec Corp キユ−フアイルの操作方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676401B2 (en) 1998-03-26 2010-03-09 Sharp Kabushiki Kaisha Data distribution system and data selling apparatus therefor, data retrieving apparatus, duplicated data detecting system, and data reproduction apparatus
JP2011076420A (ja) * 2009-09-30 2011-04-14 Toshiba Corp 構造化文書検索システム及びプログラム

Also Published As

Publication number Publication date
JP2560610B2 (ja) 1996-12-04

Similar Documents

Publication Publication Date Title
EP0250705B1 (en) Method and apparatus for retrieval of symbol strings from data
US7680791B2 (en) Method for sorting data using common prefix bytes
US7457799B2 (en) Apparatus and method for searching data of structured document
JP3003915B2 (ja) 単語辞書検索装置
US5659739A (en) Skip list data structure enhancements
JP2769065B2 (ja) デジタルデータ処理システムに使用する方法及び装置
JP2000357115A (ja) ファイル検索装置及びファイル検索方法
US20070255771A1 (en) Method and system for renewing an index
CN111597407A (zh) 一种基于tcam的关键字匹配方法、装置、设备及存储介质
JP2560610B2 (ja) データ処理装置
US20050060314A1 (en) System and methods involving a data structure searchable with O(logN) performance
US20110029570A1 (en) Systems and methods for contextualized caching strategies
Lin Cat: An execution model for concurrent full text search
JPH04257062A (ja) ハッシュキューを用いるデータ処理装置
JPH04101272A (ja) データエレメント検索方法
JP2596397B2 (ja) 木構造データ格納方式
JPS633351A (ja) バツフア検索制御方式
JP3318787B2 (ja) データ管理方法およびその装置
JPH04156624A (ja) 知識ベースシステムにおける高速アクセス方式
JPH0528194A (ja) データアクセス方式
JPH08101843A (ja) 情報検索装置
JPH10240627A (ja) セクタ管理方法及び装置
JPH0546666A (ja) 情報検索装置
JP2000020527A (ja) データベースにおける検索方式
JPH04205173A (ja) 情報検索システム