JPS581242A - Storage controlling system for tree structure information - Google Patents

Storage controlling system for tree structure information

Info

Publication number
JPS581242A
JPS581242A JP56099985A JP9998581A JPS581242A JP S581242 A JPS581242 A JP S581242A JP 56099985 A JP56099985 A JP 56099985A JP 9998581 A JP9998581 A JP 9998581A JP S581242 A JPS581242 A JP S581242A
Authority
JP
Japan
Prior art keywords
tree structure
information
area
node
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56099985A
Other languages
Japanese (ja)
Inventor
Akio Shinagawa
明雄 品川
Hiroshi Hayashi
弘 林
Akira Hattori
彰 服部
Takeshi Shinoki
剛 篠木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56099985A priority Critical patent/JPS581242A/en
Publication of JPS581242A publication Critical patent/JPS581242A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees

Abstract

PURPOSE:To remarkably reduce the processing time, by possibly locating node information corresponding to a node located to an upper hierarchy of the tree structure into a resident region, in a tree structure retrieval processing device. CONSTITUTION:In a tree structure retrieval processing system in which a tree structure storage information storing section is constituted in page units respectively stored in a resident area 4 and a nonresident area 5 on a main storage device, the information corresponding to the node of upper hierarchy of the tree structure is stored to the resident area 4 in the order of higher accessing frequency, and a plural-hierarchy information is assigned to a page unit transferred and stored to the nonresident area 5 so that the node located at the lower hierarchy takes a pair to one node in the page unit, allowing to execute the roll-in/ roll-out processing between the nonresident area 5 and an external storage area. Thus, the frequency of generation of page fault can remarkably be reduced and the number of times of roll-in/roll-out with the external storage device can be decreased.

Description

【発明の詳細な説明】 本発明は、木構造情報記憶制御方式、特に木構造KmH
されて格納されている情報を記憶する記憶構成において
、主記憶上に常駐される情報が上記本構造のより上位階
層に対応するものとなるようページ単位管構成し、非所
望にページ・フォールトが生じる発生頻度を減少するよ
うにし丸木構造情報記憶制御方式に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention provides a tree-structured information storage control system, particularly a tree-structured KmH
In a memory structure that stores information stored in a main memory, a page-by-page management structure is used so that the information resident in the main memory corresponds to a higher layer of the main structure, and undesired page faults are avoided. This invention relates to a log structure information storage control method that reduces the frequency of occurrence.

従来から、例えば英語辞書の場合のように複数個のキー
情報の列に対応して出力情報が対応づけられて偽る如き
、木構造に展開される対応関係を情報格納部に格納して
おき、検索に当って入力され九検索コード列にもとづい
て上記情報格納部をアクセスし、上記キー情報と上記検
索コード列上のコードと対比しつつ出力情報を抽出する
ことが行なわれている。
Conventionally, correspondence relationships expanded into a tree structure have been stored in an information storage unit, for example in the case of an English dictionary, where output information is falsely associated with a plurality of columns of key information. The information storage unit is accessed based on the nine search code strings input during the search, and output information is extracted while comparing the key information with the codes on the search code string.

このような木構造の情報は、ノードに対応して与えられ
るキー情報と当該ノードからどの下位ノードに至るかを
指示するポインタとを1つの組の例えば1語単位として
構成されるが、これらの1語単位の情報は1つのページ
単位にまとめられて、仮想記憶方式をもつデータ処理シ
ステムに組入れられる。
Such tree-structured information is composed of a set of key information given corresponding to a node and a pointer indicating which lower node to reach from that node, for example, in units of one word. Information in units of one word is collected in units of one page and incorporated into a data processing system having a virtual storage method.

上配本構造の情報をページ単位にまとめるに当りては、
例えば1つのノードから4分岐が生じる如き木構造の場
合を例に挙げると、例えば1つのノードとその配下に位
置する4個のノードと更にその下に位置する16偏のノ
ードとに関する情報即ち合計21個のノードに関する情
報1−1ページとして構成する方式が採用されている。
When summarizing the information in the upper volume structure on a page-by-page basis,
For example, in the case of a tree structure in which four branches occur from one node, for example, information about one node, four nodes located under it, and 16 nodes located further under it, that is, the total A method is adopted in which information regarding 21 nodes is configured as a 1-1 page.

この方式は、1つのノードが主記憶装置上に転送される
とき、その下位階層のノードも一緒に主記憶装置上に転
送される可能性が高く、第2階層をアクセスした後に第
(p’+ 1 )階層をアクセスしようとする際に非所
望なページ・7オールトが生じる頻度が少なくなるとい
う考えに文っていると考えてよい。
In this method, when one node is transferred to the main memory, there is a high possibility that the nodes in the lower hierarchy will also be transferred to the main memory, and after accessing the second layer, the +1) This can be considered to be based on the idea that the frequency of undesired page/7-orts occurring when attempting to access a hierarchy will be reduced.

しかし、上記の如く分割されたページ単位が主記憶装置
上と外部記憶装置上とに分散配置される場合、1llp
K主記憶装置上に常駐域が4うけられて当骸常駐域上に
も上記ページ単位を常駐せしめようとする場合、第1図
を参照して後述する如き問題が生じ、ページ・フォール
トの発生回数が増加することが生じる。
However, when the page units divided as described above are distributed on the main storage device and the external storage device, 1llp
If there are four resident areas on the K main memory and you try to make the above page units resident in the main permanent area, a problem will occur as described later with reference to Figure 1, and a page fault will occur. It happens that the number of times increases.

本発明は、この点を解決することを目的としており、常
駐域あるいはロール・アウトされる可能性の少ない領域
に対して、木構造上でよシ上位階層にあるノードに対応
する情報を格納せしめるようにして、ベージφフォール
ドの発生sItをよシノードに対応してキー情報と1つ
または複数のポインタとが設定された本構造をもって出
力情報が格納されてなシ、複数のキー拳コードに本とづ
〈コード列の各コードを上記ノードに対応して設定され
ているキー情報と対比しつつ上記出力情報を抽出する木
構造検索も理装置において、上記本構造にもとづいて上
記キー情報と上記ポインタとを格納した木構造格納情報
格納部をそなえ、該木構造格納情報格納部が主記憶装置
上の常駐域と主記憶装置上の非常駐域とに夫々格納され
るページ単位によって構成される木構造検索処理システ
ムにおいて、上記常駐域上に上記本構造の上位階層のノ
ードに対応する情報をよ)もアクセス頻度の高い順に格
納するよう構成すると共に、上記非常駐域上に転送され
て格納されるページ単位に関して、当該ページ単位内に
1つのノードに対して下位階層に位置するノードが組と
なるよう複数階層の情報を割付け、上記非常駐域と外部
記憶域との閣で、ロール・イン/−−ル・アウト処理が
奥行されるようKしたことを特徴としている。以下図面
を参照しつつ説明する。
The present invention aims to solve this problem, and stores information corresponding to nodes higher up in the tree structure in a permanent area or an area that is less likely to be rolled out. In this way, the output information is stored in this structure in which key information and one or more pointers are set corresponding to the synode, and the output information is stored in multiple key codes. Tozu〈A tree structure search that extracts the above output information while comparing each code of the code string with the key information set corresponding to the above node is also performed in the logical device. The tree-structured information storage section includes a tree-structured storage information storage section that stores pointers, and the tree-structured information storage section is a tree configured by page units stored in a resident area on the main storage device and a non-resident area on the main storage device, respectively. In the structure search processing system, the information corresponding to the upper layer nodes of the main structure is also stored in the resident area in descending order of access frequency, and the information is also transferred and stored in the non-resident area. Regarding page units, information of multiple hierarchies is allocated so that nodes located in lower hierarchies are paired with one node within the page unit, and roll-in/- - The feature is that the loop-out processing is extended in depth. This will be explained below with reference to the drawings.

第1図は従来の記憶制御方式の一例を示し、第。FIG. 1 shows an example of a conventional storage control system.

2図は本発明の一実施例、第3図(4)(B) (C)
(ロ)は本発明に関連し九説明図を示す。
Figure 2 is an embodiment of the present invention, Figure 3 (4) (B) (C)
(b) shows nine explanatory views related to the present invention.

第1図において、1−1.1−2.・・・・・・は夫々
ページ単位、2はノード、3はパス、4は常駐域、5は
非常駐域および外部記憶域を表わしている。
In FIG. 1, 1-1.1-2. . . . represent a page unit, 2 a node, 3 a path, 4 a resident area, and 5 a non-resident area and an external storage area.

そして、図示ノード2は当該ノードに対応するキー情報
とポインタとをひとまとめにし九ノード情報を代表して
示している。
The illustrated node 2 represents the nine node information in which the key information and pointer corresponding to the node are grouped together.

今1つのノード2から4分岐している木構造を考え、各
ノード情報と駿て、キー情報が12バイト分、4つの下
位ノードへのポインタとして3×4+バイト分が用いら
えると考える。1ページ当、9811バイトの情報を収
容できるものとすると、第1図図示の如く、1つのペー
ジ内に最大合計21個のノード情報を収容できることか
ら、第を階層に属するノード情報を1個と第(p+1)
階層に属するノード情報を4個と第(p+2>8層に属
するノード情報を16個とをひとまとめにして1ペ一ジ
分が構成される(但し1m8m−2:sは自然数)。
Now consider a tree structure with four branches from one node 2, and consider that 12 bytes of key information and 3×4+ bytes can be used as pointers to the four lower nodes, including each node information. Assuming that 9811 bytes of information can be accommodated per page, as shown in Figure 1, a maximum of 21 pieces of node information can be accommodated in one page, so the number of pieces of node information belonging to the hierarchy is one. (p+1)th
One page is composed of four pieces of node information belonging to a layer and 16 pieces of node information belonging to the (p+2>8th layer) (where 1m8m-2:s is a natural number).

そして木構造が今8階層で構成されている本のとし、主
記憶装置上の常駐域4内K 16ペ一ジ分を収容できる
本のとすると、第1図図示の如く、最上位から数えて第
3階層までの分をまとめたページ1−1、第4階層を含
めて3階層分をまとめたページ1−2ないし1−16ま
でが常駐域に収容され、それ以下のページ1−17.・
・・・・・、 1−65 。
Assuming that the tree structure of the book is currently composed of 8 levels, and that the book can accommodate 16 pages in the resident area 4 of the main memory, the tree structure is counted from the top level as shown in Figure 1. Page 1-1, which summarizes the content up to the third level, pages 1-2 to 1-16, which summarize the content of three levels including the fourth level, are accommodated in the resident area, and the following pages 1-17 ..・
..., 1-65.

・・・・・・、1−69.・・・・・・、 1−416
1は主記憶装置上の非常駐域と外部記憶装置上の外部記
憶域とに配置される形となる。
......, 1-69. ......, 1-416
1 is arranged in a non-resident area on the main storage device and an external storage area on the external storage device.

第1図はこの状態を示しておシ、上記非常駐域上のペー
ジは、仮想記憶方式が採用されるときによく知られてい
る如く、外部記憶域との間で自由にロール・イン/ロー
ル・アウトサレる。
Figure 1 shows this state. Pages in the non-resident area can be freely rolled in and out of the external storage area, as is well known when a virtual storage system is adopted.・Outsale.

該第1図図示の構だ 見ると判る如く、ページ1−2な
いし1−INにおいて#−を第5階層のノードや第6階
層のノードに対応するノード情報が常駐域4内に常駐さ
れているにも拘らず、ページ1−1グないし1−65に
おいては第4階層のノードに対応するノード情報が非常
駐状態忙おかれている形となる。
The structure shown in FIG. 1 As can be seen, in pages 1-2 to 1-IN, node information corresponding to #- for nodes in the 5th layer and nodes in the 6th layer is resident in the resident area 4. However, on pages 1-1 to 1-65, the node information corresponding to the nodes in the fourth layer is in a non-resident state.

今、第1図に示すごとく、木の根から各末端ノードへ至
るパス上のノード数が全てのパスにわたって等しい木に
@りて考えて、かつ各パス上を探索する頻度が全バスに
わたって尋しいと仮定すると一般に木構造のより上位階
層のノードに対応するノード情報が主記憶装置上に存在
することが、上記ページ・フォールト発生#J度を減少
する途であり、第1図図示の構成の場合には(木構造の
末端ノードが平均して探索されるものと考える)、1回
の探索あたり平均して 41−1515 2 X −41x−自L78(回) 343 のページ・フォールトが発生する形となる。
Now, as shown in Figure 1, consider a tree in which the number of nodes on the path from the root of the tree to each end node is equal across all paths, and the frequency of searching on each path is approximately equal across all buses. Assuming that the existence of node information corresponding to a node in a higher layer of the tree structure in the main memory is the way to reduce the number of page fault occurrences described above, in the case of the configuration shown in Figure 1. (assuming that the end nodes of the tree structure are searched on average), there is a form in which on average 41-1515 2 X -41x-selfL78(times) 343 page faults occur per search. becomes.

第2図は本発明の一実施例を示し、図中の符号1−1 
、1−2 、・・・・・・、2.3.4は第1図に対応
している。
FIG. 2 shows an embodiment of the present invention, and the reference numeral 1-1 in the figure shows an embodiment of the present invention.
, 1-2, . . . , 2.3.4 correspond to FIG.

第2図図示の場合、木構造のより上位階層に位置するノ
ードに対応するノード情報を可能な限り、常駐域4に配
置するという発想にもとづいて、常駐域4内に常駐され
るページを構成するよう忙している。
In the case shown in Figure 2, the page resident in resident area 4 is configured based on the idea that node information corresponding to nodes located at higher levels of the tree structure is placed in resident area 4 as much as possible. I'm so busy.

このようkするととKよって、第2図図示0如く第5階
層までのノードに対応するノード情報を常駐域4内に常
駐させる構成をとることが可能となる。そして、第6階
層以下のノードに対応するノード情報は、第8階層まで
の計21個のノードに対応するノード情報が1ページ内
に、1とめられて、非常駐域と外部記憶域との間で必要
忙応じてロール・イン/ロール・アウトされる。
In this way, it becomes possible to adopt a configuration in which node information corresponding to nodes up to the fifth layer resides in the resident area 4, as shown in FIG. 2 (0). Then, the node information corresponding to the nodes of the 6th layer and below is stored in one page, and the node information corresponding to a total of 21 nodes up to the 8th layer is stored between the non-resident area and the external storage area. Roll in/roll out as needed.

第2図図示の如く第5階層までを常駐域4上に置くこと
Kよって、1回の探索あたシの平均ページ・フォールト
回数は最悪でも1回となり、きわめて効果的である。
By placing up to the fifth layer in the resident area 4 as shown in FIG. 2, the average number of page faults per search is one at the worst, which is extremely effective.

なお、・第2図図示構成の場合にはページ・7オールト
の発生頻度が減少されることを示した。しかし、すべて
の場合において第1図図示の構成にくらべて第2図図示
の構成がよシベージ、フォールト発生頻度が減少すると
は限らないものであり、ベージ単位の区切シの発生態様
の如何による。即ち今木の構造を第3図面図示の如くモ
デル化して斜線部分が常駐域に格納できるものとしかつ
点線管ページ単位の階層とする。このとき第3図(B)
図示の場合と館3図(C1図示の場合とでは、第3図(
B)図示の場合がより好ましいものである。何故ならば
前者ではページ・フォールトが2回発失する場合と3回
発生する場合とがあるが、後者でtia回発生すること
となるからである。しかし第3図CB)の構成を整浮し
て第3図(ロ)図示の構成にできれば、館3図(至)の
構成が好ましい。
It has been shown that in the case of the configuration shown in FIG. 2, the frequency of occurrence of page 7 oorts is reduced. However, in all cases, the configuration shown in FIG. 2 does not necessarily reduce the frequency of occurrence of errors and faults compared to the configuration shown in FIG. That is, the structure of the current tree is modeled as shown in the third drawing, so that the shaded area can be stored in the resident area, and the hierarchy is set in dotted page units. At this time, Figure 3 (B)
In the case shown and in the case shown in Figure 3 (C1),
B) The case shown is more preferable. This is because in the former case, page faults may occur twice or three times, but in the latter case, page faults occur tia times. However, if the configuration shown in Figure 3 (CB) can be made into the configuration shown in Figure 3 (B), the configuration shown in Figure 3 (To) is preferable.

以上説明した如く、本発明によれば、出力情報を抽出す
るに当って、ページ・フォールトが発生する頻度が大幅
に減少され、外部記憶装置との間でロール・イン/ロー
ル・アウトされる回数が減少することから、処理時間が
大幅に翅給される。
As explained above, according to the present invention, when extracting output information, the frequency of page faults occurring is significantly reduced, and the number of times of roll-in/roll-out to/from an external storage device is significantly reduced. processing time is significantly reduced.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来の配憶制御方式の一例を示し、第2図は本
発明の一実施例、第3図(4)(B) (C1(至)は
本発明に関連し九説明図を示す。 図中、1はページ単位、2#iノード、4は常駐域、5
は非常駐域および外部記憶域を示す。 特開昭58−1242(4) 矛1回 す2図
FIG. 1 shows an example of a conventional storage control system, FIG. 2 shows an embodiment of the present invention, and FIG. In the figure, 1 is page unit, 2#i-node, 4 is resident area, 5
indicates non-resident area and external storage area. Unexamined Japanese Patent Publication No. 58-1242 (4) Illustration of two twirling spears

Claims (1)

【特許請求の範囲】[Claims] ノードに対応してキー情報と1つまたは複数のポインタ
とが設定された木構造をもって出力情報が格納されてな
シ、複数のキー・コードにもとづくコード列の各コード
を上記ノードに対応して設定されているキー情報と対比
しつつ上記出力情報を抽出する本構造検索処理装雪にお
いて、上記木構造にもとづいて上記キー情報と上記ポイ
ンタとを格納した木構造格納情報格納部をそなえ、該木
構造格納情報格納部が主記憶装置上の常駐域と主記憶装
置上の非常駐域とに夫々格納されるページ、′4位によ
って構成される木構造検索処理システムにおいて、上記
常駐域上に上記木構造の上位階層のノードに対応する情
報をよシアクセス頻度の高いM?C格納するよう構成す
ると共に、上記非常駐域上に転送されて格納されるペー
ジ単位に関して、当該ページ単位内に1つのノードに対
して下位階層に位置するノードが組となるよう複数階層
の情報を割付け、上記非常駐域と外部記憶域との間でロ
ール・イン/ロールeアウト処理が実行されるようkし
たことを特徴とする木構造情報記憶制御方式。
Output information is not stored in a tree structure in which key information and one or more pointers are set corresponding to the nodes, and each code of a code string based on multiple key codes is stored in a tree structure in which key information and one or more pointers are set corresponding to the nodes. The present structured search processing system for extracting the output information while comparing with the set key information is provided with a tree structure storage information storage unit storing the key information and the pointer based on the tree structure, In a tree structure search processing system in which a tree structure storage information storage section is configured of pages stored in a permanent area on the main storage device and a non-resident area on the main storage device, the above page is stored in the permanent area on the main storage device. Is the information corresponding to the nodes in the upper layer of the tree structure frequently accessed? In addition, regarding the page unit transferred and stored in the non-resident area, information of multiple hierarchies is stored so that one node is paired with a node located in a lower hierarchy within the page unit. A tree-structured information storage control method, characterized in that roll-in/roll-out processing is executed between the non-resident area and the external storage area.
JP56099985A 1981-06-27 1981-06-27 Storage controlling system for tree structure information Pending JPS581242A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56099985A JPS581242A (en) 1981-06-27 1981-06-27 Storage controlling system for tree structure information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56099985A JPS581242A (en) 1981-06-27 1981-06-27 Storage controlling system for tree structure information

Publications (1)

Publication Number Publication Date
JPS581242A true JPS581242A (en) 1983-01-06

Family

ID=14261944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56099985A Pending JPS581242A (en) 1981-06-27 1981-06-27 Storage controlling system for tree structure information

Country Status (1)

Country Link
JP (1) JPS581242A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0547992A2 (en) * 1991-12-17 1993-06-23 International Business Machines Corporation Method and system for enhanced efficiency of data recovery in balanced tree memory structures
US5446887A (en) * 1993-09-17 1995-08-29 Microsoft Corporation Optimal reorganization of a B-tree
WO2006051869A1 (en) * 2004-11-12 2006-05-18 Justsystems Corporation Document processing device and document processing method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0547992A2 (en) * 1991-12-17 1993-06-23 International Business Machines Corporation Method and system for enhanced efficiency of data recovery in balanced tree memory structures
JPH05233392A (en) * 1991-12-17 1993-09-10 Internatl Business Mach Corp <Ibm> Data retrieving efficiency improving method for balanced tree memory structure and virtual memory data processing system
US5446887A (en) * 1993-09-17 1995-08-29 Microsoft Corporation Optimal reorganization of a B-tree
US5522068A (en) * 1993-09-17 1996-05-28 Microsoft Corporation Statistic-based reorganization of B-trees yielding an approximate optimal fill on substantially every page
WO2006051869A1 (en) * 2004-11-12 2006-05-18 Justsystems Corporation Document processing device and document processing method
JPWO2006051869A1 (en) * 2004-11-12 2008-05-29 株式会社ジャストシステム Document processing apparatus and document processing method

Similar Documents

Publication Publication Date Title
US6671694B2 (en) System for and method of cache-efficient digital tree with rich pointers
US6584458B1 (en) Method and apparatuses for creating a full text index accommodating child words
US6532457B1 (en) Look-ahead tree structure
Bancilhon et al. On Line Processing of Compacted Relations.
KR890007156A (en) How to fetch, insert, and delete key record data
Giancarlo A generalization of the suffix tree to square matrices, with applications
Schuegraf et al. A comparison of algorithms for data base compression by use of fragments as language elements
CN102867049B (en) Chinese PINYIN quick word segmentation method based on word search tree
US6675171B2 (en) Memory based on a digital trie structure
McCreight Pagination of B*-trees with variable-length records
WO2014179354A2 (en) Index for fast batch updates of large data tables
Diehr et al. Optimal pagination of B-trees with variable-length items
JPS581242A (en) Storage controlling system for tree structure information
Lang et al. Batch insertion for tree structured file organizations—improving differential database representation
US6076089A (en) Computer system for retrieval of information
Bercea et al. An extendable data structure for incremental stable perfect hashing
Lomet Multi-table search for B-tree files
Kriegel et al. Weighted multidimensional b-trees used as nearly optimal dynamic dictionaries
JP2874810B2 (en) Key memory allocation method
Aoe A fast digital search algorithm using a double‐array structure
Nievergelt Trees as data and file structures
Comer English dictionary searching with little extra space
Walker et al. Hybrid trees: A data structure for lists of keys
Maly A note on virtual memory indexes
Gopal et al. Access path optimization in relational joins