JPH04276836A - 可変長データの記録方法とその検索方法 - Google Patents

可変長データの記録方法とその検索方法

Info

Publication number
JPH04276836A
JPH04276836A JP3036986A JP3698691A JPH04276836A JP H04276836 A JPH04276836 A JP H04276836A JP 3036986 A JP3036986 A JP 3036986A JP 3698691 A JP3698691 A JP 3698691A JP H04276836 A JPH04276836 A JP H04276836A
Authority
JP
Japan
Prior art keywords
data
keyword
section
recorded
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3036986A
Other languages
English (en)
Inventor
Kazuyoshi Goya
合屋 和好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3036986A priority Critical patent/JPH04276836A/ja
Publication of JPH04276836A publication Critical patent/JPH04276836A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は可変長データの記録方法
とその検索方法に関し、特に中央処理装置などで作成し
たデータを外部記憶装置内にデータ量に応じた可変長の
レコードに記憶させる記録方法と上述した外部記憶装置
に記録されたデータを検索するための可変長データの記
録方法とその検索方法に関する。
【0002】
【従来の技術】たとえば整数をキーワードとして持つ一
連のデータを複数まとめ、キーワードによる索引部を設
けたファイルとしてデータを記録、すなわち記憶し、ま
た記録したデータを検索し読み出す場合に、対象となる
データが一定長ではない場合、すなわち可変長である場
合には何らかの工夫を施す必要がある。このような可変
長データの記録方法としては、従来、データを固定長と
して扱う記録およびその検索方法、あるいは、補足レコ
ードを設ける記録およびその検索方法などで対応してい
た。
【0003】図4は従来のデータを固定長として扱う記
録方法によるファイルの領域を示す説明図である。ファ
イル領域10は索引部11とデータ部12より成ってい
る。索引部11には各キーワードとそのキーワードに属
するデータの始まりを指すアドレスとが対応してキーワ
ード別に記憶されている。またデータ部12は同一長の
レーコードに分割されており各レーコードは最初にキー
ワードが記録されているキー部121と、そのキー部1
21に記録されているキーワードに属するデータが記録
されているデータ部122とこのキーワードに属するデ
ータを記録することができるが実際には何も記録されて
いない無効データ部123で構成されている。
【0004】もし、同一のキーワードに属するデータの
長さが上述のデータ部122と無効データ部の長さの和
に等しいときには無効データ部123は存在しない。情
報処理装置によって異なるキーワードを持つ複数のデー
タが作成されると、索引部11には各キーワードとこの
キーワードに対応したデータの内で最初のデータが記憶
されているアドレスとが対照して記録される、また、各
キーワードは索引部11の中で昇順に記録される。
【0005】図5は図4で示したファイル領域10にデ
ータが記録された状態を示す説明図である。図5におい
て各レコード長は2000桁とし、レコード125には
キー部121とデータ部122の合計したものが200
0桁であるデータが記録され、他の200個ののレコー
ド126にはキー部121とデータ部122の合計した
ものが何れも100桁であるデータが記録されている状
態が示されている。
【0006】すなわち、固定長として扱う記録方法にお
いてはレコード長は記憶すべきデータの内で最大の長さ
を有するデータの長さまたはそれ以上の長さとする必要
がある。そのため、図5の説明図においては、キー部1
21とデータ部122の合計したものが、(2000桁
×1+100桁×200)=22000桁あればよいの
に対して、実際には、ファイル領域として、(2000
桁×201)=402000桁の記録領域が必要になる
。このような場合には無効データ部123の合計した桁
数が95パーセントを占めることになる。すなわち、記
録すべきデータの間のデータ長の差が大であるほどデー
タ長の合計の桁数に対して必要とするファイル領域の中
には無効データ部123を多く必要とする。
【0007】図6は従来の補足レコードを設ける記録方
法によるファイル領域を示した説明図である。ファイル
領域30は図4に示したファイル領域10とおなじ索引
部31を持ちその他にデータ部32を持っている。先述
した固定長レコードによる記録方法においては、一つの
キーワードに属するデータはファイル中の一つのレコー
ドに記録するのに対して、補足レコードを設ける記録の
方法では一つのキーワードに属するデータを複数の一定
長のレコードに分けて記録する。データ部32は複数の
同一長のレコードに分割されており、それぞれのレコー
ドにはキーワードが記録されるキー部321と、データ
が記録されるデータ記録部322および補足レコード情
報を記録する補足レコード情報部324とにこの順に分
割されている。すなわち、一つのレコードの始まりの部
分がキー部321で、中間にデータ記録部322、最後
に補足レコード情報部324が続いている。図6におい
ては最上部のレコードとこのレコードに続く次のレコー
ドには同じキーワード004を持つデータが記録され、
その下のレコードにはキーワード123を持つデータが
1レコード分だけ記録されている。すなわち、一つのキ
ーワードに属するデータのデータ長がデータ記録部32
2の長さ以下である場合にはこのデータに対しては一つ
のレコードが使用され、もし、データ長が一つのレコー
ド記録部322に収容できないときには、そのデータを
すべて記録するのに十分な数のレコードが使用される。
【0008】図7はこのような補足レコードを設ける記
録方法の説明図である。図示されていない情報処理装置
によって複数のキーワード別のデータが作成されると、
ファイルの索引部にキーワードとそのキーワードに対応
してファイル中でそのキーワードを持つデータの最初の
部分が記録されるアドレスが決定されそのアドレスがキ
ーワードに対応づけて記録される。またキーワードは昇
順に並べられて記憶される。データ部32の各レコード
のキー部321にはそのデータの属するキーワードが記
録される。また、同一キーワードに属するデータはデー
タ記録部322に記録される。図7においてはキーワー
ドは205であり、キーワード205を有する最初のレ
コードはレコード41である。キーワード205に属す
るデータの長さはレコード41のデータ記録部322の
長さより長いので、レコード41の補足レコード情報部
324に、情報処理装置はレコード41に続いてデータ
が記録される次のレコードの先頭のアドレスを記録する
。図7においては次のレコードは42であるのでレコー
ド42の先頭のアドレスがレコード41の補足レコード
情報部324に記録されることになる。キーワード20
5に属するデータ長はレコード長に対して長く、レコー
ド42のデータ記録部にもレコード41に記録した残り
を記録しきれないので、今まで説明したと同様にレコー
ド42の補足レコード情報部にはレコード43の先頭ア
ドレスが情報処理部によって書き込まれる、同様にして
レコード43のキー部にはキーワードが、また、データ
記録部にはレコード42に記録できなかったデータの残
りの部分が記録され、レコード43のレコード記録部に
もデータの残りの部分をすべて記録することができない
ので、レコード43の補足レコード情報部には残りのデ
ータが記録されるレコード44の先頭アドレスが記録さ
れる。キーワード205に属する残りのデータがレコー
ド44のレコード記録部にすべて記録できたとすると、
レコード44の補足レコード情報部324にはキーワー
ド205のデータを記録したレコードの終りを示す記号
が記録される。この終りを示す符号は、たとえば、16
進数表示でFFFなどのデータを記録するアドレスでは
取り得ない数値を予め決めておき、この決められた数値
を記録しておけばよい。
【0009】このようにして外部記憶装置に記憶された
データの内の希望するデータをこの外部記憶装置に接続
された情報処理装置上に読み込むときには、予め、デー
タを記録したファイルの索引部を情報処理装置が読み出
し、読み出した索引部をそのまま情報処理装置がもつメ
モリ部の一部に書込んでおき、情報処理装置は読み出そ
うとするデータのキーワードを参照してメモリ部よりそ
のデータが記録されている外部記憶装置のレコードのア
ドレスを見い出し、そのアドレスにアクセスしてデータ
を読み出し、各レコードの終りの補足レコード情報部の
内容によってこのデータがそれで終りであるか、残りの
データが記録されているレコードの先頭アドレスを読み
出し、読み出したアドレスにアクセスして残りのデータ
を読み出すという動作をアクセスしたレコードの補足レ
コード情報部にデータの終りを示す予め決められた符号
を読み出すまで続けることによりデータを情報処理装置
に読み出していた。すなわち、図7に示されたデータの
索引を行う場合には、索引部を参照して希望するデータ
の先頭アドレスを読み出すのに1回、データ記録部から
データの読み出しに4回の情報処理部からのアクセスを
必要としていた。
【0010】
【発明が解決しようとする課題】上述した従来のデータ
を固定長として扱う記録方法では、記録するデータの長
さが一定ではなく、異なるキーワードに属しているデー
タ長の間の差が大である場合には、記憶するファイルの
記憶領域に大きな無駄な領域を生じるという欠点があっ
た。
【0011】また、従来の補足レコードを設けるデータ
の記録方法においては、レコード長を短くすればそれに
対応してファイルの記憶領域に生ずる無駄な領域は少な
くなるが、レコード長を短かくするのに比例して、この
データが記憶されているファイルに接続されている情報
処理装置がファイルをアクセスする回数が増加するので
記録されたデータの読み出しに長時間を要するという欠
点があった。
【0012】本発明の目的は、一つのキーワードに属す
るデータを記録するレコードの長さを予め決められた単
位長さの整数倍とし、同一のキーワードに属するデータ
についてはそのデータを記録したレコードの先頭部分だ
けにキーワードを記録し、記録すべきデータを記録する
ことができる長さまたはそれ以上の長さになるまで単位
長を整数倍した連続したデータ記録部をもつレコードと
し、データ長に対応して単位長の数を変更する可変長の
レコード上にデータを記録しておき、このデータが記録
されているファイルに別に索引部を設け、この索引部に
は各キーワードとこのキーワードに属するデータの先頭
アドレスとこのデータが専有する単位長レコードの数と
を対応して記憶しておくことによって、ファイル内にデ
ータを記録するときに生ずる無駄な領域部分を少なくし
、かつ情報処理装置によってこの記録されたデータを読
み出すときに従来より短時間でアクセスすることができ
る可変長データの記録方法とその検索方法を提供するこ
とにある。
【0013】
【課題を解決するための手段】本発明の可変長データの
記録方法は、キーワード別に作成されたデータであって
前記異るキーワードに属するデータの長さが互いにかな
らずしも一定でない可変長のデータを情報処理装置が作
成しこの作成されたデータを前記情報処理装置に接続さ
れた外部記憶装置に記録する可変長データの記録方法に
おいて、前記外部記憶装置内のファイル領域内に索引情
報格納部とデータ部とを設け、前記データ部に前記デー
タをそのデータ長に応じて予じめ決められた長さを持つ
単位長レコードの整数倍の連続したレコードに前記キー
ワードを先頭としてその後に前記キーワードに属するデ
ータを連続して記録し、前記記録したキーワードを含む
データの先頭のアドレスと前記キーワードが記録されて
いる単位長レコードの数とを前記キーワードに対応づけ
て前記索引情報格納部内に前記キーワード別に記録する
【0014】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0015】図1(A)は本発明の可変長データの記録
方法によって記録したファイル領域の説明図、図1(B
)は図1(A)の部分説明図である。
【0016】ファイル領域6は索引情報格納部61とデ
ータ部62より構成される。ファイル情報格納部61は
さらにこのファイル領域6に記録されるデータの持つキ
ーワード別に区分される複数の部分情報格納領域611
に細分される。一つの部分情報格納領域611にはキー
ワードとそのキーワードに属するデータか記録されてい
るデータ部62の先頭アドレスとこのキーワードに属す
るデータが記録されている単位長レコード数が、それぞ
れ予め決められた桁数で予め決められた順序で記録され
る。また、このキーワードは必要ならば、たとえば、昇
順あるいは降順に索引情報格納部61の中に格納してお
くこともできる。
【0017】図2はファイル領域6にデータを記録する
ときおよびファイル領域6に記録されているデータを索
引するときに使用する情報処理装置と外部記憶装置との
一例を示すブロック図である。ファイル領域6のデータ
部62に記録すべきデータが、たとえば、情報処理装置
4の内部の中央処理装置1によって作成され、そのデー
タがメモリ部3に記憶されているとする、また、作成さ
れたデータは外部記憶装置2内のファイル領域6に記録
されるものとする。作成されたデータのデータ長を中央
処理装置1が算出し外部記憶装置2にアクセスし、予め
決められているファイル領域6の中でこのデータを記録
すべきデータ部62の記録可能な先頭アドレスを求め、
予め決められている単位長レコードの長さと記録すべき
データ長とから必要とする単位長レコードの所要数を算
出し、ファイル領域6内の索引情報格納部61内の未記
録部分の部分情報格納領域611の一つに前述したキー
ワードとデータ部62にそのキーワードに属するデータ
が記録される先頭アドレスとこのデータが使用する単位
長レコードの所要数を対応づけて記録し、この部分情報
格納領域611に記録されたデータ部62内の先頭アド
レスからキーワードを記録し、それに引続く領域、すな
わち、部分情報格納領域611に書き込まれたと同数の
単位長レコードが連続した領域にデータを記録する。な
おこの領域には先述したキーワードも含まれる。
【0018】このようにして情報処理装置4内で作成さ
れたデータを外部記憶装置2のファイル領域6に順次記
録すればよい。また、複数のデータがこのように記録さ
れてから、中央処理装置1が索引情報格納部61の内容
を読み取りキーワードが昇順または降順になるように部
分情報格納領域611単位で並べかえてもよい。従って
、予め決められた単位長レコードのレコード長に対して
、あるキーワードに属するデータのデータ長がキーワー
ドの長さを含んで等しいか短かい場合にはこのデータは
一つの単位長レコードに格納されることになる。また、
あるキーワードに属するデータのデータ長がキーワード
の長さを含めて単位長レコード一つの長さより長く、ま
た、単位長レコードの長さの2倍よりも短いときには、
このキーワードに属するデータは二つの連続した単位長
レコードに記録されることになる。ただし、このような
場合にはこのキーワードに属するデータの最初のアドレ
ス部分のみにキーワードが記録されるのみであり、この
キーワードが記録されている単位長レコードに続く単位
長レコードにはキーワードは記録されない。
【0019】次に、このよう本発明の記録方法で記録し
たデータを検索する場合には、たとえば、図2に示され
ている情報処理装置4が希望するキーワードを指定して
外部記憶装置2をアクセスし、ファイル領域6内の索引
情報格納部61内の希望するキーワードが記録されてい
る部分情報格納領域611を見い出す。次にこの部分情
報格納領域611から希望するキーワードに属するデー
タの先頭アドレスとこのデータが記憶されている単位長
レコード数とを読み出し、これらの読み出した情報に基
づいたデータ部62のアドレスからデータの読み出しを
行い、また前述の情報に基づいた数の単位長レコード内
のデータを連続して読み出し、メモリ部3に記憶し、こ
のデータを情報処理装置4が使用目的に応じて使用する
【0020】図3は本発明の記録方法によって記録され
た外部記憶装置2内の索引情報格納部61の情報を情報
処理装置4が読み取り、メモリ部3に記憶した状態を示
す説明図である。メモリ部3の記憶領域31内に予め外
部記憶装置2のファイル領域6の索引情報格納部61と
同じ記憶領域であるメモリ内索引情報格納部71を設け
ておく。このメモリ内索引情報格納部71を索引情報格
納部61内の部分情報格納領域611と同一の記憶領域
と構造をもつメモリ内部分情報格納領域711に分割し
ておく。
【0021】情報処理装置4が起動されたとき、情報処
理装置4が外部記憶装置2のファイル領域6の索引情報
格納部61に記録されている内容を読み出しメモリ部3
の予め決められているメモリ内索引情報格納部71にそ
のまま同一形式で記憶させる。以後、情報処理装置4が
ファイル領域6内のデータを読み出すときには、メモリ
部3のメモリ内索引情報格納部71を参照して、希望す
るキーワードに属するデータのファイル領域6内の先頭
アドレスとこのデータの記憶に使用されている単位長レ
コードの数を読み取り、この読み取った情報に基づいて
外部記憶装置2のファイル領域6をアクセスして所望の
データをメモリ部3に書き込み、この書き込んだデータ
を情報処理装置4が処理することができる。
【0022】一般に、外部記憶装置装置に記録されてい
る索引情報格納部に情報処理装置がアクセスしてすでに
説明したデータの先頭アドレスとデータが記録されてい
る単位長レコードの数を読み取るのに要する時間にくら
べて、情報処理装置内のメモリ部に記憶されている索引
情報格納部から同一の情報を読み取るのに要する時間の
方が短いので図3のように情報処理装置4のもつメモリ
部3に一旦外部記憶装置2の索引情報格納部61に記録
されている情報をそのまま図3に示したようにメモリ部
3の記憶領域31に記憶してこの記憶領域31に対して
情報処理装置4がアクセスした方が短時間で所望のデー
タを外部記憶装置2から読み出すことができる。
【0023】
【発明の効果】以上説明したように、本発明の可変長デ
ータの記録方法によって外部記憶装置のファイル領域に
データを記憶することにより、データの長さにかかわら
ず、情報処理装置が特定のデータを外部記憶装置から読
み出すのに索引情報を1回アクセスし続いてデータを読
み込むときに1回アクセスを行うことにより所望のデー
タを外部記憶装置から情報処理装置に読み取りを行うこ
とができるので、従来のこの種の可変長のデータの記録
方法にくらべて、データの読み取りを短時間で行うこと
ができるという効果を有している。また、キーワード毎
にデータの長さが異なるデータを記録する場合には、そ
のデータ長に応じて単位長レコードを連続させた可変長
のレコードにデータを一括して記録するため、従来のこ
の種のデータの記録方法にくらべてファイル領域に生ず
る無駄な領域を少なくすることができ、有効にファイル
領域を使用することができるという効果を有している。
【図面の簡単な説明】
【図1】本発明の可変長データの記録方法によって記録
したファイル領域を示す説明図である。
【図2】本実施例の可変長データの記録方法で可変長デ
ータを記憶する装置の一例を示すブロック図である。
【図3】本発明の記録方法によって記録された外部記憶
装置2内の索引情報格納部61の情報を情報処理装置4
が読み取り、メモリ部3に記憶した状態を示す説明図で
ある。
【図4】従来のデータを固定長として扱う記録方法によ
るファイルの領域を示す説明図である。
【図5】図4で示したファイル領域10にデータが記録
された状態を示す説明図である。
【図6】従来の補足レコードを設ける記録方法によるフ
ァイル領域を示した説明図である。
【図7】図6に示した補足レコードを設ける記録方法の
説明図である。
【符号の説明】
1    中央処理装置 2    外部記憶装置 3    メモリ部 4    情報処理装置 6    ファイル領域 61    索引情報格納部 62    データ部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  キーワード別に作成されたデータであ
    って前記異るキーワードに属するデータの長さが互いに
    かならずしも一定でない可変長のデータを情報処理装置
    が作成しこの作成されたデータを前記情報処理装置に接
    続された外部記憶装置に記録する可変長データの記録方
    法において、前記外部記憶装置内のファイル領域内に索
    引情報格納部とデータ部とを設け、前記データ部に前記
    データをそのデータ長に応じて予じめ決められた長さを
    持つ単位長レコードの整数倍の連続したレコードに前記
    キーワードを先頭としてその後に前記キーワードに属す
    るデータを連続して記録し、前記記録したキーワードを
    含むデータの先頭のアドレスと前記キーワードが記録さ
    れている単位長レコードの数とを前記キーワードに対応
    づけて前記索引情報格納部内に前記キーワード別に記録
    することを特徴とする可変長データの記録方法。
  2. 【請求項2】  請求項2に記載の可変長データの記録
    方法によって前記外部記憶装置内に記録された可変長デ
    ータを前記情報処理装置が検索し前記外部記憶装置より
    所望のデータを前記情報処理装置内のメモリ部に読み出
    す可変長データの検索方法において、前記情報処理装置
    の起動時に前記外部記憶装置内の前記索引情報格納部に
    記憶されている情報を索引情報としてすべて前記情報処
    理装置が読み取り前記読み取った索引情報をすべて前記
    メモリ部に記憶しておき、前記情報処理装置が前記可変
    長データを前記外部記憶装置より読み出すときには、前
    記メモリ部に記憶されている前記索引情報を参照して所
    望のキーワードに属するデータに関する前記外部記憶装
    置内の先頭アドレスとこのデータが記憶されている単位
    長レコードの数を読み取り、これら読み取った情報を基
    に前記外部記憶装置内の前記データ部より所望のキーワ
    ードに属するデータを一括して読み取ることを特徴とす
    る可変長データの検索方法。
JP3036986A 1991-03-04 1991-03-04 可変長データの記録方法とその検索方法 Pending JPH04276836A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3036986A JPH04276836A (ja) 1991-03-04 1991-03-04 可変長データの記録方法とその検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3036986A JPH04276836A (ja) 1991-03-04 1991-03-04 可変長データの記録方法とその検索方法

Publications (1)

Publication Number Publication Date
JPH04276836A true JPH04276836A (ja) 1992-10-01

Family

ID=12485076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3036986A Pending JPH04276836A (ja) 1991-03-04 1991-03-04 可変長データの記録方法とその検索方法

Country Status (1)

Country Link
JP (1) JPH04276836A (ja)

Similar Documents

Publication Publication Date Title
US5497485A (en) Method and apparatus for implementing Q-trees
EP0124097B1 (en) Method for storing and retrieving data in a data base
US4991087A (en) Method of using signature subsets for indexing a textual database
US4677550A (en) Method of compacting and searching a data index
US5293616A (en) Method and apparatus for representing and interrogating an index in a digital memory
JPS6254329A (ja) フアイル装置へのデ−タの登録方法および検索方法
KR970067139A (ko) 자기 테이프 매체와 그 프리포매팅 방법
KR100414052B1 (ko) 주기억장치 데이터베이스의 인덱스 데이터 관리방법
JPH04276836A (ja) 可変長データの記録方法とその検索方法
JP2675958B2 (ja) 情報検索用計算機システム及びその記憶装置の動作方法
JP3129248B2 (ja) 2次元配列コードを用いた文字列検索方法
JPH0962697A (ja) 商品コード検索方式
JPH0239225A (ja) ファイルシステム
JPS6143338A (ja) 連想技術を使用して稀薄なデータベースをサーチする方法
JPH06295313A (ja) インデックス付き検索ファイルのデータ検索装置
JPH0225946A (ja) ファイル管理装置
JP3439364B2 (ja) 不定長データの格納方法および検索方法
JP3564173B2 (ja) 相対編成フアイルのアクセス装置
JP2540821B2 (ja) デ―タベ―ス検索システム
JP3348279B2 (ja) プライスルックアップデータ検索回路及びその検索方法並びにその制御プログラムを記録した記録媒体
JP3578501B2 (ja) 文書検索方法及び装置
JPS61103242A (ja) 高速検索方式
JPH0196728A (ja) データベース・テーブルを検索する方法
JPS5827240A (ja) フアイル記憶方式
JPH07182215A (ja) データ管理装置