JP2003131933A - 文書ファイル保存方法及び文書ファイル保存プログラム - Google Patents

文書ファイル保存方法及び文書ファイル保存プログラム

Info

Publication number
JP2003131933A
JP2003131933A JP2001325535A JP2001325535A JP2003131933A JP 2003131933 A JP2003131933 A JP 2003131933A JP 2001325535 A JP2001325535 A JP 2001325535A JP 2001325535 A JP2001325535 A JP 2001325535A JP 2003131933 A JP2003131933 A JP 2003131933A
Authority
JP
Japan
Prior art keywords
tag
area
element description
saving
document file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001325535A
Other languages
English (en)
Inventor
Takashi Kato
隆 加藤
Shoichiro Ogawa
正一郎 小川
Kazuhiro Kamimura
和宏 上村
Toshihiro Uehara
年博 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2001325535A priority Critical patent/JP2003131933A/ja
Publication of JP2003131933A publication Critical patent/JP2003131933A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 タグを有するファイルを補助記憶装置に保存
する際に、タグ名毎に要素記述を抽出し、特定記憶領域
に前記要素記述を保存する文書ファイル保存方法及び文
書ファイル保存プログラムを提供することを課題とす
る。 【解決手段】 マークアップ言語で記述された文書ファ
イルを補助記憶装置に保存する際に、文書ファイルから
文書の定義や文書構造等を格納するProfile3と、タグ
毎に要素記述が保存されるトラック番号またはパーティ
ション番号等を格納するTag-Table4と、各文書を構成
する要素記述が保存されているトラック内またはパーテ
ィション内の具体的な位置情報等を格納するData-Table
5とを作成する。また、1つの記録媒体の記録領域を、
これら3つの情報を保存する定義情報領域1と、要素記
述だけを保存する要素記述保存領域2の2つに分割し、
それぞれを保存する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】XML文書ファイルやHTM
L文書ファイル等、タグを埋め込んだ文書ファイルの保
存方法及び文書ファイル保存プログラムに関する。
【0002】
【従来の技術】XML(eXtensible Markup Language)
やHTML(HyperText Markup Language)はマークア
ップ言語(Markup Language)と呼ばれ、マークアップ
言語によって記述された文書をXML文書またはHTM
L文書と呼ぶ。マークアップ言語によって記述された文
書の特徴の1つに、タグと呼ばれる<…>、</…>という
形をした要素を文書中に持つことが上げられ、このタグ
によって囲まれた文章を要素記述と呼ぶ。HTML文書
ではタグの種類は予め決められており、またXML文書
ではユーザーが自由にタグを定義することができる。
【0003】 図11はXML文書のサンプルである。
この様な文書を「妥当なXML文書(Valid XML Docume
nt)」と呼び、スキーマの1つであるDTD(Document
TypeDefinition)が与えられ、それに対して完全に適
合したXML文書が記述されている。
【0004】 またXML文書ファイルは、通常単なる
テキストファイルとして扱われる。テキスト形式である
ため、ユーザーにとっては非常に内容が理解しやすく、
また機種やOSに依存することなくファイルのやり取り
を行えるという長所がある。
【0005】
【発明が解決しようとする課題】しかしながら、テキス
ト形式であるがために、ファイル内の要素記述を抽出す
る際にはいくつかの問題を生じる。
【0006】 複数ファイルまたは同一ファイル内の同
一のタグで囲まれた要素記述を抽出する場合、ファイル
全体を読み込み、文字列の検索を行わなければならな
い。例えばタグ<CPU>… <CPU>で囲まれた要素記述(文
字列)を抽出する場合、ファイルの先頭から<CPU>と<CP
U>を検索し、その間にある要素記述を逐一抽出しなけれ
ばならず、またファイル全体の文字列を検索しなければ
ならないため、検索作業に非常に時間がかかってしま
う。
【0007】 また、単なるテキスト形式のファイルで
あるため、保存する際の記録媒体の記録場所はユーザー
からは指定することができない。そのため同一のタグを
持つファイルでも、関連性を持って保存(配置)される
ことがない。従って複数ファイルを検索する場合は、フ
ァイルごとにシークタイムが発生することになる。
【0008】 そこでファイルの保存時にファイルとは
別にインデックス要素を作成し、そのインデックス要素
のみを検索する方式が提案されている。この方法では、
高速に検索を行うことができるが、検索の精度を上げる
ためにはインデックス要素の量を増加させる必要があ
り、限られた記憶容量の記録媒体に保存できるファイル
数が減少してしまう。
【0009】また全てのファイルにおける各タグが記録
されている位置の対応テーブルを作成して、各ファイル
の所望のタグだけに直接アクセスし、高速化することも
考えられているが、結局は要素記述がファイルごとに記
録されているため、データを抽出するには離れて記録さ
れた要素記述間のシークタイムが必要となってしまい時
間がかかってしまう。
【0010】本願発明は上記事情を鑑みてなされたもの
であり、補助記憶装置にXML文書ファイル等タグを有
する文書を保存する際に、異なるファイルまたは同一の
ファイル内の、同一のタグで囲まれた要素を前記タグ毎
に抽出し、前記要素からタグを取り除いた要素記述を保
存する領域としてタグ名毎に前記記録媒体上の任意の記
憶領域を指定し、同一のタグ名で抽出された1以上の前
記要素記述を前記記憶領域に連続して保存する文書ファ
イル保存方法及び文書ファイル保存プログラムを提供す
ることを目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に記載の発明である文書ファイル保存方法
は、マークアップ言語で記述されタグを埋め込まれた文
書を、ディスク状の記録媒体を用いる補助記憶装置に保
存する文書ファイル保存方法において、保存対象となる
文書ファイルからタグで囲まれた要素をタグ名毎に抽出
し、前記要素からタグを取り除いた要素記述を保存する
領域としてタグ名毎に前記記録媒体上の任意のトラック
を指定し、以後は文書ファイル中で同一のタグ名で抽出
された1以上の要素記述を前記トラックに連続して保存
することを特徴とする。
【0012】 請求項1の発明によれば、同一トラック
に同一のタグで示された要素記述が連続して記録される
ので、高速に検索を行うことができる。
【0013】 請求項2に記載の発明である文書ファイ
ル保存方法は、請求項1に記載の文書ファイル保存方法
において、前記要素記述を保存する領域として連続する
複数トラックを指定することを特徴とする。
【0014】 請求項2の発明によれば、同一タグで示
される要素記述が分散して保存されることを防ぐことが
できるので、シークタイムを短くすることができる。
【0015】 請求項3に記載の発明である文書ファイ
ル保存方法は、請求項1または請求項2に記載の文書フ
ァイル保存方法において、前記要素記述を保存する際
に、当該要素記述のデータ容量がトラックの残記憶容量
を超えた場合には、そのトラックと隣接するトラックま
たは近隣のトラックに保存することを特徴とする。
【0016】 請求項3の発明によれば、要素記述を読
み出すためのトラック間のヘッド移動及びディスクの回
転待ち時間が短く、高速に検索を行うことができる。
【0017】 請求項4に記載の発明である文書ファイ
ル保存方法は、マークアップ言語で記述されタグを埋め
込まれた文書を、テープ状の記録媒体を用いる補助記憶
装置に保存する文書ファイル保存方法において、保存対
象となる文書ファイルからタグで囲まれた要素をタグ名
毎に抽出し、前記要素からタグを取り除いた要素記述を
保存する領域としてタグ名毎に前記記録媒体上の任意の
パーティションを指定し、以後は文書ファイル中で同一
のタグ名で抽出された1以上の要素記述を前記パーティ
ションに連続して保存することを特徴とする。
【0018】 請求項4の発明によれば、同一パーティ
ションに同一タグで示される要素記述が連続して記録さ
れるので、高速に検索を行うことができる。
【0019】 請求項5に記載の発明である文書ファイ
ル保存方法は、請求項4に記載の文書ファイル保存方法
において、要素記述を保存する際に、当該要素記述のデ
ータ容量がパーティションの残記憶容量を超えた場合に
は、そのパーティションと隣接するパーティションまた
は近隣のパーティションに保存することを特徴とする。
【0020】 請求項5の発明によれば、要素記述を読
み出すためのパーティション間の頭出し時間が短く、高
速に検索を行うことができる。
【0021】 請求項6に記載の発明である文書ファイ
ル保存プログラムは、マークアップ言語で記述されタグ
を埋め込まれた文書を補助記憶装置に保存する方法を提
供するプログラムであって、保存対象となる文書ファイ
ルを読み込み、タグ定義情報が記述されているかを判定
する機能と、タグ定義情報が記述されていれば、そのタ
グ定義情報からタグ名毎に補助記憶装置に要素記述を保
存する領域が確保されているかを判定する機能と、前記
領域が確保されていなければ、要素記述を保存する領域
として新たにタグ名毎に記録媒体上の任意の領域を確保
する機能と、タグ定義情報が記述されていない場合、ま
たは要素記述を保存する領域が確保されていた場合、ま
たは領域を新たに確保した後は、当該文書ファイルに記
述されている要素を1つずつ読み込み、当該要素から抽
出したタグがタグ定義情報に定義されていないものであ
れば、タグ名毎に補助記憶装置に要素記述を保存する領
域が確保されているかを判定する機能と、領域が確保さ
れていなければ、要素記述を保存する領域として新たに
タグ名毎に記録媒体上の任意の領域を確保する機能と、
領域が確保されていた場合、または領域が新たに確保さ
れた後は、当該要素から抽出した要素記述を確保された
領域に保存する機能と、当該要素記述が当該文書ファイ
ル内に記述されていた場所を示す情報と、当該要素記述
が保存された当該領域のアドレス情報を取得し補助記憶
装置に保存する機能と、当該文書ファイルに記述されて
いる全ての要素記述を保存するまで処理を繰り返す機能
とを有することを特徴とする。
【0022】 請求項6の発明によれば、タグ名毎に要
素記述が保存される領域が確保され、かつ要素記述が文
書ファイル内に記述されていた場所を示す情報と、要素
記述が保存された領域のアドレス情報が保存されるの
で、両情報を元に分割して保存された文書ファイルを再
構成することができる。
【0023】
【発明の実施の形態】図1〜図11に基づいて本願発明
の実施形態を説明する。まず1つのXML文書ファイル
を1つの記録媒体上に保存される場合を例にして説明す
る。
【0024】 通常XML文書は、XML宣言、DTD
等のスキーマ、要素(XML文書本体)とから構成され
ている。XML宣言には文字コードやバージョン情報が
記述され、スキーマではXML文書の構造やタグの規則
などが定義される。図9のサンプル文書ではスキーマと
してDTDが用いられ、9つのタグが定義されている。
【0025】 本願発明では図1に示す通り、XML文
書ファイルを補助記憶装置に保存する際に、XML文書
からXML文書の定義や文書構造等を格納するProfile
3と、タグ毎に要素記述が保存されているトラック番号
またはパーティション番号等を格納するTag-Table4
と、各XML文書を構成する要素記述が保存されている
トラック内またはパーティション内の具体的な位置情報
等を格納するData-Table5とを作成する。また、記録媒
体の記録領域をこれら3つの情報を保存する定義情報領
域1と、要素記述だけを保存する要素記述保存領域2の
2つに分割する。
【0026】 定義情報領域1に保存される3つの情報
のうちProfile3には、XML文書のXML宣言及びD
TD等で定義される情報(要素以外の記述を含む)が保
存され、文書内に含まれるタグの種類やタグの階層構造
等の定義が保存される。DTDは省略される場合もある
ので、XML文書を展開する際DTDが存在しない場合
は、タグと要素記述を抽出する段階でタグの定義と階層
構造を作成するようにしてもよい。また外部サブセット
としてDTDが別ファイルに保存されている場合は、X
ML文書を展開する際にその別ファイルを読み込み、Pr
ofile3を作成するようにしてもよい。
【0027】 Tag-Table4は図2に示す通り、n種類
のタグ名と、そのタグ名で示された要素が記録されるm
本のトラック番号またはパーティション番号Tn(m)(m
は変数)との対応表である。Tag-Table4にはタグ毎に
要素記述が保存されているトラック番号またはパーティ
ション番号等の宛先情報が保存される。Tag-Table4が
保存するトラックまたはパーティションを指定する方法
としては、タグの種類毎に1トラックずつまたは1パー
ティションずつ確保する方法と、タグの種類ごとに予め
連続した複数のトラックまたはパーティションを1領域
として確保する方法がある。
【0028】 図3のData-Table5は、各XML文書フ
ァイルと、XML文書ファイル毎にファイルの先頭から
順に抽出された要素記述の番号と、その要素記述が保存
されているトラック番号またはパーティション番号、及
びセクタ番号等のアドレス情報と、要素記述のデータ長
(文字列の長さ、文字数等)と、入れ子構造の階層レベ
ルとの対応表である。図3中、Tn(m)は図2のTag-Table
4に保存されているT1(1)〜Tn(m)のいずれかのトラック
番号またはパーティション番号であり、Bはアドレス情
報、Lはデータ長、Hは階層レベルを示す。なお1つの要
素記述が複数のトラックに分割されて保存される場合に
は、1つの要素記述に対してトラック番号またはパーテ
ィション番号、及びセクタ番号等のアドレス情報と、要
素記述のデータ長と、入れ子構造の階層レベルは複数存
在することになる。
【0029】 アドレス情報には、セクタ番号の他にト
ラック内またはパーティション内にデータを読み出す基
準位置を設け、その基準位置からの相対距離や絶対距離
を用いてもよい。また階層レベルは図9のサンプルに示
す通り、基準となるタグの階層レベルをLevel 0(Bas
e)として、階層が深くなる毎にLevel 1、Level 2…と
する。または前後のタグとの相対的な階層の深さを用い
て、前のタグより階層が1つ深くなれば+1、同じ階層な
らば0、階層が1つ浅くなれば-1としてもよい。
【0030】 図4はTag-Table4とData-Table5で示
された要素記述がどのように要素記述保存領域2のトラ
ックまたはパーティションに保存されるかを示したもの
である。各ファイルから抽出された要素記述は、それぞ
れのタグで指定されたトラックまたはパーティションに
順に保存されている。
【0031】 次に図9のXML文書を用いて、XML
文書ファイルのタグと要素記述の抽出方法について説明
する。
【0032】 一般的な記述方法でXML文書が記述さ
れている場合、図11のサンプル中の<CPU>Duron<CPU>
を例にすると、タグ名としてTag-Table4に格納される
情報は「<CPU>」となり、要素記述保存領域2内のタグ<
CPU>が指定するトラックまたはパーティションに格納さ
れる要素記述は「Duron」となる。また要素の記述方法
としては、要素記述がない場合には<CPU>のように記述
することもできるので、その場合にはTag-Table4に「<
CPU>」というタグが格納される。
【0033】 また<Size>80GB</Size>等、要素記述に
単位まで記述することがあるが、これは<Size UNIT=”G
B”>80</Size>のようにタグの中に単位等のパラメータ
を含めて記述することも可能である。パラメータはスキ
ーマ内に記述される属性リスト宣言(Attribute List D
eclaration)によって定義され、パラメータを除いた部
分をタグとする方法と、パラメータを含めて1つのタ
グとする方法がある。 タグ:<Size> 要素記述:<UNIT=”GB”>80 タグ:<Size UNIT=”GB”> 要素記述:80
【0034】 またXML文書の特徴として、1対のタ
グに要素記述として他のタグが含まれる階層構造があ
る。図11のサンプル中のタグ<HD>には、<Type>と<Siz
e>というタグが入れ子として存在している。
【0035】 タグ<HD>とタグ<Type>の関係を例にする
と、この場合、タグ<HD>の要素記述を<Type>UDMA5 RAID
<Type>とし、タグ<Type>の要素記述をUDMA5として二重
に保存する方法と、タグ<HD>の要素記述を“空”に
し、タグ<Type>の要素記述をUDMA5として保存する方法
がある。 タグ:<HD> 要素記述:<Type>UDMA5 RAID<Type> タグ:<Type> 要素記述:UDMA5 RAID タグ:<HD> 要素記述:“空” タグ:<Type> 要素記述:UDMA5 RAID 方法の場合、検索する項目の中に入れ子がある場合で
もその中(下の階層)まで検索ができる反面、重複して
記述する部分があるため、記録媒体に記録できるファイ
ル数が少なくなる。方法の場合は、要素内の入れ子の
要素記述を検索するためには、別のタグ名のトラックに
移動しなければならず検索に多少時間を要するが、方法
より記録できるファイル数は多くなる。また“空”で
はなく、具体的にData-Table5における要素記述の番号
を入力してもよい。さらに入れ子構造が多段に及ぶ場
合、記録する段数に上限を設けるようにしてもよい。
【0036】 <ディスク状の記録媒体を用いる場合の
保存処理>まずディスク状の記録媒体を使用する補助記
憶装置にXML文書ファイルを保存する場合を考える。
ディスク状の記録媒体とは、媒体上に同心円状または螺
旋状のトラックが形成された記録媒体を指す。例えば磁
気ディスク、光ディスク、光磁気ディスク等が上げられ
る。
【0037】 ディスク状の記録媒体の場合、1枚の媒
体に存在するトラック数は予め決まっており、総トラッ
ク数から定義情報領域1に必要とされるトラック数を差
し引いたトラック数が、その記録媒体に保存できるタグ
の種類の上限となる。この上限を目安としてXML文書
ファイルの展開処理が行われる。またハードディスク装
置の場合、プラッタ単位ではなくハードディスク装置を
1つの媒体として取り扱う。また螺旋状にトラックが存
在する場合は、ディスク1周を1トラックとして取り扱
う。
【0038】 図5のフローチャート(メインルーチ
ン)に基づいて一連の保存処理を説明する。
【0039】 まずXML文書ファイルを読み込む(ス
テップSM01)。XML宣言から、DTDが外部参照
ファイルとして存在するか、またはXML宣言の後続に
DTDが記述されているか確認し(ステップSM0
2)、XML文書内に、または外部参照ファイルとして
DTDが存在する場合、DTDからタグ情報を抽出する
(ステップSM03)。
【0040】 次にTag-Table4に登録されているのタ
グを参照し、DTDから抽出したタグが既にTag-Table
4に存在するか確認する(ステップSM04)。DTD
から抽出したタグがTag-Table4に存在しない場合、新
規タグとして新たにそのタグ用の要素記述を保存するた
めの保存領域確保の処理(ステップSM05)に進む。
【0041】 次に読み込んだXML文書にDTDが存
在しない場合、または抽出したタグが既にTag-Table4
に存在していた場合、または新規タグの示す要素記述用
の保存領域確保を行った後は、要素を文書の先頭から1
つずつ読み込む(ステップSM06)。
【0042】 次に読み込んだ要素のタグがTag-Table
4のタグ名に存在するか確認する処理を行う(ステップ
SM07)が、DTDが記述され既に定義されていたタ
グについては、この処理を省略し、DTDに未定義のタ
グが現れた場合のみ、そのタグがTag-Table4に存在す
るか確認する。またDTDが記述されていなかった場合
は、この処理でTag-Table4にタグが存在するか確認を
行い、新たなタグが現れた場合には、そのタグで示され
る要素記述を保存するため保存領域確保の処理(ステッ
プSM08)へ進む。
【0043】 次に要素記述を抽出し保存作業の処理
(ステップSM09)に進む。保存作業が無事に終了す
ると、Data-Table5を更新する(ステップSM10)。
全要素を読み込むまでステップSM06〜ステップSM
10の処理を繰り返す(ステップSM11)。
【0044】 次に保存領域確保の処理(ステップSM
05及びステップSM08)を図6のフローチャート
(サブルーチン1)に基づいて説明する。
【0045】 まず要素記述保存領域2に空きトラック
が存在するか確認する(ステップSS01)。空きトラ
ックが全く無い場合、または既に全てのトラックが他の
タグで示される要素記述を保存するために予約されてい
る場合は、1つの記録媒体にXML文書全てを保存でき
ないということになるので、そのXML文書ファイルに
対する全ての処理を中断する(ステップSS02)。ま
た空きトラックが存在する場合は、新規タグで示される
要素記述用に領域を確保する。その際1トラックだけを
確保しても良いし、複数トラックを連続して確保できる
場合は、複数トラックを1領域として確保しても良い
(ステップSS03)。
【0046】 次にTag-Table4に新規タグ名と、その
タグで示される要素記述を保存するトラック番号が追加
され(ステップSS04)、処理はメインルーチンへ戻
る(ステップSS05)。
【0047】 次に要素記述を抽出、保存する処理を図
7のフローチャート(サブルーチン2)に基づいて説明
する。
【0048】 まず、抽出された要素記述のデータ長
と、1本のトラックに最大限記録可能なデータ長(トラ
ック長)とを比較する(ステップSS10)。要素記述
のデータ長がトラック長以下の場合、Tag-Table4にお
いてその要素記述を保存するように指定されたトラック
(指定トラック)に保存可能か判断する処理に進む。逆
に、要素記述のデータ長がトラック長よりも長い場合、
データを分割して記録するための処理に進む。
【0049】 要素記述のデータ長がトラック長以下の
場合、要素記述のデータ長と、Tag-Table4においてそ
の要素記述を保存するよう指定された各トラック(指定
トラック)の空き容量とを比較し、データ長に対し空き
領域が十分なトラックがあれば保存処理へ進む(ステッ
プSS11)。その際、複数のトラックが該当する場合
もあり得るが、その場合には、そのうちの1つを選択す
る。例えば、Tag-Table4に示された順で最初の該当ト
ラックを要素記述の保存場所として選択する。
【0050】 Tag-Table4に記載された指定トラック
内のいずれにも抽出した要素記述がすべて保存できない
場合、連続するトラックが空きトラックであるか確認す
る(ステップSS12)。連続するトラックが空きトラ
ックでない場合、他の領域に空きトラックがあるか確認
する(ステップSS13)。
【0051】 空きトラックが全く無い場合、その要素
記述を保存できないことになり、1つの記録媒体にXM
L文書を保存できないということになるので、そのXM
L文書ファイルに対する全ての処理を中断する(ステッ
プSS14)。連続するトラックが確保できる場合、そ
のトラックまたは空きトラックが確保できる場合、Tag-
Table4に記載された指定トラックにできるだけ近隣の
空きトラックを新規に指定トラック(新規指定トラッ
ク)として確保し(ステップSS15)、Tag-Table4
内の該当するタグ名にそのトラック番号を追加する(ス
テップSS16)。
【0052】 次に要素記述を指定トラックに保存する
(ステップSS17)。その際、保存処理が行われる指
定トラックは、Tag-Table4に示されたトラックのうち
要素記述が保存できる1つのトラックを選択する方法
と、要素記述の長さより空き容量が小さいトラックを含
めて複数のトラックを選択する方法があげられる。前述
の方法は、1つの要素記述が連続して保存されるため処
理が容易である。一方後述する方法は、1つの要素記述
が分割して保存される場合も含まれるが、保存領域の有
効的に利用することができる。保存処理が終了した後
は、メインルーチンへ戻る(ステップSS18)。
【0053】 次に要素記述のデータ長がトラック長よ
りも長い場合、各指定トラックにおいて要素記述を書き
込むスペースがどの位あるかを判断する。抽出された要
素技術の指定トラックが、トラック長のx%以上に空き
があるか比較し、空きが無い場合は次の指定トラックが
あるか確認する処理に進む(ステップSS19)。
【0054】 x%以上に空きがある場合には、要素記
述の一部を記録するトラックとして領域を予約する(S
S20)。なお、ここでxは0より大きく100以下の
実数であり、予め設定しておく。xが大きければ、1つ
の要素記述が分断される数が少ないが、要素記述が記録
されない無駄な領域が多くなる可能性は高くなる。
【0055】 次に、要素記述のデータ長から指定トラ
ック内に記録可能な空き領域の長さを減算したものを、
新たなデータ長とする(ステップSS21)。データ長
が0より大きいか判断し、大きければ抽出された要素記
述全体を書き込むことができないので、次の指定トラッ
クがあるか確認する処理に進む(ステップSS22)。
抽出された要素記述の全指定トラックに対して、ステッ
プSS19からステップSS23までの処理を繰り返す
(ステップSS23)。ステップSS22において、デ
ータ長が0以下の場合、ステップSS20で予約したト
ラック内の領域に要素記述を分割して保存する(ステッ
プSS24)。保存処理終了後は、メインルーチンへ戻
る(ステップSS18)。
【0056】 全ての指定トラックに対してステップS
S19からステップSS23までの処理を繰り返して
も、データ長が0より大きく、抽出された要素記述全体
を書き込むことができない場合、新たなトラックを確保
する処理に進む。そのため、指定トラックに連続する空
きトラックがあるか確認する(ステップSS25)。
【0057】 連続するトラックが空きトラックでない
場合、他に空きトラックがあるか確認する(ステップS
S26)。空きトラックがない場合、その要素記述を保
存できないことになり、1つの記録媒体にXML文書を
保存できないことになるので、そのXML文書ファイル
に対する全ての処理を中断する(ステップSS27)。
【0058】 連続するトラックを確保できる場合はそ
のトラックを、または空きトラックが確保できる場合は
指定トラックにできるだけ近隣の空きトラックを、新規
に指定トラックとして確保し(ステップSS28)、要
素記述のデータ長からトラック長を減算したものを、新
たなデータ長とする(ステップSS29)。
【0059】 このデータ長が0よりも大きければ、ス
テップSS25からステップSS29の処理を繰り返す
(ステップSS30)。データ長が0以下であれば、Ta
g-Table4内の該当するタグ名にステップSS28で新
規に確保した指定トラック番号を追加する(ステップS
S31)。そして、ステップSS20で予約したトラッ
ク内領域とステップSS28で確保したトラック領域に
要素記述を分割し保存する(ステップSS32)。この
保存処理が終了した後は、メインルーチンへ戻る(ステ
ップSS18)。
【0060】このように要素記述をタグ名毎に連続して
保存することによって、高速に検索を行うことができ
る。また要素記述を読み出すためのトラック間のヘッド
移動及びディスクの回転待ち時間が短く、高速に検索を
行うことができる。
【0061】 <テープ状の記録媒体を用いる場合の保
存処理>次にテープ状の記録媒体を使用する補助記憶装
置にXML文書ファイルを保存する場合を考える。
【0062】 前述のディスク状の記録媒体に保存する
方法と同様に、Profile3、Tag-Table4、Data-Table5
はテープ上に保存される。なおテープカートリッジにI
Cメモリ等、テープ以外の記録可能な媒体が一体化して
存在する場合は、その記録可能な媒体を定義情報領域1
としてProfile3、Tag-Table4、Data-Table5を保存
し、テープを要素記述保存領域2として要素記述を保存
する。
【0063】 また図10に示す通り、要素記述を保存
する領域の単位として、前述のトラックに代わってテー
プを一定長毎に区切って作成するパーティションを用い
る。パーティションのサイズは任意であるが、全てのパ
ーティションは同じ大きさとすることも可能であるし、
パーティションを確保するたびに適時適当な大きさで作
成してもよい。またパーティションとパーティションの
間にはシステム領域を区切りとして設け、タグの番号
等、Tag-Table4に関連する事項や、パーティションの
予約情報等を保存する領域として利用してもよい。
【0064】 テープ状の記録媒体を使用する場合の要
素記述の保存処理は、図5〜図7のフローチャート中の
「トラック」を「パーティション」に置き換えることに
よって現すことができる。
【0065】 まずXML文書ファイルを読み込む(ス
テップSM01)。XML宣言から、DTDが外部参照
ファイルとして存在するか、またはXML宣言の後続に
DTDが記述されているか確認し(ステップSM0
2)、XML文書内に、または外部参照ファイルとして
DTDが存在する場合、DTDからタグ情報を抽出する
(ステップSM03)。
【0066】 次にTag-Table4に登録されているのタ
グを参照し、DTDから抽出したタグが既にTag-Table
4に存在するか確認する(ステップSM04)。DTD
から抽出したタグがTag-Table4に存在しない場合、新
規タグとして新たにそのタグ用の要素記述を保存するた
めの保存領域確保の処理(ステップSM05)に進む。
【0067】 次に読み込んだXML文書にDTDが存
在しない場合、または抽出したタグが既にTag-Table4
に存在していた場合、または新規タグの示す要素記述用
の保存領域確保を行った後は、要素を文書の先頭から1
つずつ読み込む(ステップSM06)。
【0068】 次に読み込んだ要素のタグがTag-Table
4のタグ名に存在するか確認する処理を行う(ステップ
SM07)が、DTDが記述され既に定義されていたタ
グについては、この処理を省略し、DTDに未定義のタ
グが現れた場合のみ、そのタグがTag-Table4に存在す
るか確認する。またDTDが記述されていなかった場合
は、この処理でTag-Table4にタグが存在するか確認を
行い、新たなタグが現れた場合には、そのタグで示され
る要素記述を保存するため保存領域確保の処理(ステッ
プSM08)へ進む。
【0069】 次に要素記述を抽出し保存作業の処理
(ステップSM09)に進む。保存作業が無事に終了す
ると、Data-Table5を更新する(ステップSM10)。
全要素を読み込むまでステップSM06〜ステップSM
10の処理を繰り返す(ステップSM11)。
【0070】 次に保存領域確保の処理(ステップSM
05及びステップSM08)を図6のフローチャート
(サブルーチン1)に基づいて説明する。
【0071】 まず要素記述保存領域2に空きパーティ
ションが存在するか確認する(ステップSS01)。空
きパーティションが全く無い場合、または既に全てのパ
ーティションが他のタグで示される要素記述を保存する
ために予約されている場合は、1つの記録媒体にXML
文書全てを保存できないということになるので、そのX
ML文書ファイルに対する全ての処理を中断する(ステ
ップSS02)。また空きパーティションが存在する場
合は、新規タグで示される要素記述用に領域を確保す
る。その際1パーティションだけを確保しても良いし、
複数パーティションを連続して確保できる場合は、複数
パーティションを1領域として確保しても良い(ステッ
プSS03)。
【0072】 次にTag-Table4に新規タグ名と、その
タグで示される要素記述を保存するパーティション番号
が追加され(ステップSS04)、処理はメインルーチ
ンへ戻る(ステップSS05)。
【0073】 次に要素記述を抽出、保存する処理を図
7のフローチャート(サブルーチン2)に基づいて説明
する。
【0074】 まず、抽出された要素記述のデータ長
と、1本のパーティションに最大限記録可能なデータ長
(パーティション長)とを比較する(ステップSS1
0)。要素記述のデータ長がパーティション長以下の場
合、Tag-Table4においてその要素記述を保存するよう
に指定されたパーティション(指定パーティション)に
保存可能か判断する処理に進む。逆に、要素記述のデー
タ長がパーティション長よりも長い場合、データを分割
して記録するための処理に進む。
【0075】 要素記述のデータ長がパーティション長
以下の場合、要素記述のデータ長と、Tag-Table4にお
いてその要素記述を保存するよう指定された各パーティ
ション(指定パーティション)の空き容量とを比較し、
データ長に対し空き領域が十分なパーティションがあれ
ば保存処理へ進む(ステップSS11)。その際、複数
のパーティションが該当する場合もあり得るが、その場
合には、そのうちの1つを選択する。例えば、Tag-Table
4に示された順で最初の該当パーティションを要素記述
の保存場所として選択する。
【0076】 Tag-Table4に記載された指定パーティ
ション内のいずれにも抽出した要素記述がすべて保存で
きない場合、連続するパーティションが空きパーティシ
ョンであるか確認する(ステップSS12)。連続する
パーティションが空きパーティションでない場合、他の
領域に空きパーティションがあるか確認する(ステップ
SS13)。
【0077】 空きパーティションが全く無い場合、そ
の要素記述を保存できないことになり、1つの記録媒体
にXML文書を保存できないということになるので、そ
のXML文書ファイルに対する全ての処理を中断する
(ステップSS14)。連続するパーティションが確保
できる場合、そのパーティションまたは空きパーティシ
ョンが確保できる場合、Tag-Table4に記載された指定
パーティションにできるだけ近隣の空きパーティション
を新規に指定パーティション(新規指定パーティショ
ン)として確保し(ステップSS15)、Tag-Table4
内の該当するタグ名にそのパーティション番号を追加す
る(ステップSS16)。
【0078】 次に要素記述を指定パーティションに保
存する(ステップSS17)。その際、保存処理が行わ
れる指定パーティションは、Tag-Table4に示されたパ
ーティションのうち要素記述が保存できる1つのパーテ
ィションを選択する方法と、要素記述の長さより空き容
量が小さいパーティションを含めて複数のパーティショ
ンを選択する方法があげられる。前述の方法は、1つの
要素記述が連続して保存されるため処理が容易である。
一方後述する方法は、1つの要素記述が分割して保存さ
れる場合も含まれるが、保存領域を有効的に利用するこ
とができる。保存処理が終了した後は、メインルーチン
へ戻る(ステップSS18)。
【0079】 次に要素記述のデータ長がパーティショ
ン長よりも長い場合、各指定パーティションにおいて要
素記述を書き込むスペースがどの位あるかを判断する。
抽出された要素技術の指定パーティションが、パーティ
ション長のx%以上に空きがあるか比較し、空きが無い
場合は次の指定パーティションがあるか確認する処理に
進む(ステップSS19)。
【0080】 x%以上に空きがある場合には、要素記
述の一部を記録するパーティションとして領域を予約す
る(SS20)。なお、ここでxは0より大きく100
以下の実数であり、予め設定しておく。xが大きけれ
ば、1つの要素記述が分断される数が少ないが、要素記
述が記録されない無駄な領域が多くなる可能性は高くな
る。
【0081】 次に、要素記述のデータ長から指定パー
ティション内に記録可能な空き領域の長さを減算したも
のを、新たなデータ長とする(ステップSS21)。デ
ータ長が0より大きいか判断し、大きければ抽出された
要素記述全体を書き込むことができないので、次の指定
パーティションがあるか確認する処理に進む(ステップ
SS22)。抽出された要素記述の全指定パーティショ
ンに対して、ステップSS19からステップSS22ま
での処理を繰り返す(ステップSS23)。ステップS
S22において、データ長が0以下の場合、ステップS
S20で予約したパーティション内の領域に要素記述を
分割して保存する(ステップSS24)。保存処理終了
後は、メインルーチンへ戻る(ステップSS18)。
【0082】 全ての指定パーティションに対してステ
ップSS19からステップSS23までの処理を繰り返
しても、データ長が0より大きく、抽出された要素記述
全体を書き込むことができない場合、新たなパーティシ
ョンを確保する処理に進む。そのため、指定パーティシ
ョンに連続する空きパーティションがあるか確認する
(ステップSS25)。
【0083】 連続するパーティションが空きパーティ
ションでない場合、他に空きパーティションがあるか確
認する(ステップSS26)。空きパーティションがな
い場合、その要素記述を保存できないことになり、1つ
の記録媒体にXML文書を保存できないことになるの
で、そのXML文書ファイルに対する全ての処理を中断
する(ステップSS27)。
【0084】 連続するパーティションを確保できる場
合はそのパーティションを、または空きパーティション
が確保できる場合は指定パーティションにできるだけ近
隣の空きパーティションを、新規に指定パーティション
として確保し(ステップSS28)、要素記述のデータ
長からパーティション長を減算したものを、新たなデー
タ長とする(ステップSS29)。
【0085】 このデータ長が0よりも大きければ、ス
テップSS25からステップSS29の処理を繰り返す
(ステップSS30)。データ長が0以下であれば、Ta
g-Table4内の該当するタグ名にステップSS28で新
規に確保した指定パーティション番号を追加する(ステ
ップSS31)。そして、ステップSS20で予約した
パーティション内領域とステップSS28で確保したパ
ーティション領域に要素記述を分割し保存する(ステッ
プSS32)。この保存処理が終了した後は、メインル
ーチンへ戻る(ステップSS18)。
【0086】 このように要素記述をタグ名毎に連続し
て保存することによって、高速に検索を行うことができ
る。また要素記述を読み出すためのパーティション間の
頭出し時間が短く、高速に検索を行うことができる。
【0087】 以上、1つのXML文書ファイルが1つ
の記録媒体に保存される場合を例にして説明した。
【0088】 上述したように、ファイル数が増えて要
素記述の量が増えてきた場合には、サブルーチン2にお
ける中断処理(ステップSS14)が生じ、XML文書
ファイルが1つの記録媒体(記録媒体A)に記録できな
くなる場合が生じる。この場合、別の記録媒体(記録媒
体B)を用意し、記録媒体Aと同じ処理を行うことで記
録媒体Aに記録できなかったXML文書ファイルを記録
媒体Bに記録することができる。この方法では、あるタ
グで示された要素記述の検索を行う際に、記録媒体Aと
記録媒体Bを同時に動作させて読み込むことが可能であ
るため、高速に保存処理を行うことができる。
【0089】 しかし、要素の数が多くなると、サブル
ーチン1における中断処理(ステップSS02)が生
じ、XML文書ファイルが記録できなくなる場合が生じ
る。この場合、確保されたトラック(またはパーティシ
ョン)内では要素記述が書き込まれない領域が多くな
り、記録領域の無駄な部分が生じてしまう場合もありえ
る。また、要素数が1つの記録媒体のトラック数(また
はパーティション数)より多いXML文書ファイルの場
合には、記録できないことになる。
【0090】 そこで、複数の記録媒体を1つの仮想的
な記録媒体と見立てて、上述した処理を行う方法も存在
する。これにより、記録可能なトラック数(またはパー
ティション数)を増やすことができ、上記の問題を解決
することができる。ただし、上述した連続するトラック
(またはパーティション)および隣接するトラック(ま
たはパーティション)は、同一記録媒体上で確保するこ
とを優先事項とする。
【0091】 またTag-Table4とData-Table5に関し
ては、複数の記録媒体に保存する場合には図8、図9に
示すように、記録媒体番号D(r) (rは変数)を加える
ことによって、あるタグ名が存在する記録媒体とトラッ
ク(またはパーティション)を特定することができ、フ
ァイルの再編成が可能となる。この場合、記録媒体数の
数が増えるとTag-Table4とData-Table5が大きくな
り、各記録媒体で同じテーブルを持つことは冗長となる
ので、Tag-Table4とData-Table5を共通に1つの記録
媒体上に保存、または複数の記録媒体上に分割して保存
すると効果的である。
【0092】 <XML文書ファイルの再構成処理>X
ML文書ファイルを再構成する場合には、まず、定義情
報領域1からProfile3を読み出し、XML宣言とDT
Dの記述を行う。次に、定義情報領域1のData-Table5
から、要素の順番にトラック番号を読みとり、このトラ
ック番号(またはパーティション番号)に応答するタグ
名をTag-Table4から探し、そのタグ名を基に要素を作
成する。例えば、タグ名が「CPU」であったとすると、 <CPU></CPU> というタグの対を作成する。
【0093】 そして、先ほどトラック番号(またはパ
ーティション番号)を読みとった定義情報領域1の Dat
a-Table5の要素からアドレス情報、データ長を読みと
り、その位置および長さに該当する場所に保存されてい
るデータを要素記述として読み出し、先に作成した1対
のタグの間に挿入する。例えば、そのデータが「Duro
n」であったとすると、 <CPU>Duron</CPU> となる。このようなステップを定義情報領域1のData-T
able5に記載された要素が無くなるまで繰り返すことで
ファイルを再構成することができる。
【0094】 なお、要素記述として1対のタグに他の
タグが含まれる階層構造の場合に、前述したように、保
存する方法として2つの方法ととがある。この2つ
の保存方法により、ファイルの再構成の方法が異なるの
で、方法とは併用しないこととする。
【0095】 前述の例で説明すると、方法の場合に
は、定義情報領域1のData-Table5に記載された要素の
トラック番号(またはパーティション番号)に対応する
タグ名が「HD」であったとすると、 <HD></HD> のタグの対が作成される。
【0096】 次に、先ほどトラック番号(またはパー
ティション番号)を読みとった定義情報領域1のData-T
able5の要素からアドレス情報、データ長を読み込む。
その位置および長さに該当する場所に保存されているデ
ータ(要素記述)は<Type>UDMA5 RAID<Type>であり、こ
れを先ほど作成した1対のタグの間に挿入するので、 <HD><Type>UDMA5 RAID</Type></HD> となる。
【0097】 この際、定義情報領域1の Data-Table
5に記載された先ほどの要素の階層レベルも読み込んで
おく。それが例えばLevel 2であったとすると、Data-Ta
ble5に記載された次の要素に移ると、そこに記載され
た要素のトラック番号(またはパーティション番号)に
対応するタグ名は「Type」となっており、これから <Type></Type> というタグの対が作成される。Data-Table5の該要素に
記載されているアドレス情報、データ長に該当する場所
に保存されているデータ(要素記述)は「UDMA5RAID」
となっており、これから、 <Type>UDMA5 RAID</Type> となる。またData-Table5に記載されたこの要素の階層
レベルはLevel 3となっている。
【0098】 方法の場合には、前要素の階層レベル
と比較して深い階層レベルである時は、その要素の再構
成は省略する。この場合、階層レベルがLevel 2である
タグ<HD>の要素に続いたタグ<Type>の要素の階層レベル
がLevel 3であるため、タグ<Type>の要素は省略され
る。そこで、最終的に <HD><Type>UDMA5 RAID</Type></HD> を構成することができる。
【0099】 次に、方法の場合について説明する。
【0100】定義情報領域1のData-Table5に記載され
た要素のトラック番号(またはパーティション番号)に
対応するタグ名が「HD」であったとすると、 <HD></HD> のタグの対が作成される。次に、先ほどトラック番号
(またはパーティション番号)を読みとった定義情報領
域1のData-Table5の要素からアドレス情報、データ長
を読み込む。その位置および長さに該当する場所に保存
されているデータ(要素記述)は“空”であり、これを
先ほど作成した1対のタグの間に挿入するので、<HD></
HD>となる。
【0101】この際、定義情報領域1のData-Table5に
記載された先ほどの要素の階層レベルも読み込んでお
き、それが例えばLevel 2であったとする。Data-Table
5に記載された次の要素に移ると、そこに記憶された要
素のトラック番号(またはパーティション番号)に対応
するタグ名は「Type」となっており、これから <Type></Type> というタグの対が作成される。
【0102】 Data-Table5の該要素に記載されている
アドレス情報、データ長に該当する場所に保存されてい
るデータ(要素記述)が「UDMA5 RAID」となっており、
これから、 <Type>UDMA5 RAID</Type> となる。またData-Table5に記載されたこの要素の階層
レベルはLevel 3となっている。
【0103】 方法の場合には、前要素の階層レベル
と比較して深い階層レベルである時は、その階層レベル
に基づき入れ子状態を作成する。この場合、階層レベル
がLevel 2であるタグ<HD>の要素に続いたタグ<Type>の
要素の階層レベルがLevel 3であるため、タグ<Type>の
要素はタグ<HD>の要素記述として挿入される。そこで、
最終的に <HD><Type>UDMA5 RAID</Type></HD> を構成することができる。
【0104】 なお実施形態としてXML文書を用いた
例を示したが、本願発明はこれに限定されるものではな
く、マークアップ言語で記述された文書、例えばHTM
L文書やXHTML文書等にも適用することができる。
【0105】
【発明の効果】以上のように文書ファイルを分割して保
存することによって、同一タグで示される要素記述が連
続して記録されるので、高速に検索を行うことができ
る。また、あるタグ名で検索しヒットした要素記述が含
まれる文書ファイルを、Data-Tableを利用することによ
って高速に抽出することができ、さらにProfile、Tag-T
able、Data-Tableを用いることで、元の文書ファイルを
再構成することができる。
【図面の簡単な説明】
【図1】XML文書ファイルを分割保存する方法の概略
図である。
【図2】Tag-Tableの詳細を示す表である。
【図3】Data-Tableの詳細を示す表である。
【図4】要素記述保存領域2の詳細図である。
【図5】本願発明のXML文書ファイルの分割保存する
処理を表したフローチャートである。
【図6】記録媒体上に保存領域を確保する処理を表した
フローチャート(サブルーチン1)である。
【図7】要素記述を抽出保存する処理を表したフローチ
ャート(サブルーチン2)である。
【図8】複数の記録媒体に保存する場合のTag-Tableの
詳細を示す表である。
【図9】複数の記録媒体に保存する場合のData-Tableの
詳細を示す表である。
【図10】磁気テープのパーティションを表した図であ
る。
【図11】XML文書のサンプルである。
【符号の説明】
1 定義情報領域 2 要素記述保存領域 3 Profile 4 Tag-Table 5 Data-Table
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上村 和宏 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内 (72)発明者 上原 年博 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内 Fターム(参考) 5B075 NR03 NR20 UU06 5B082 CA03 CA17

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 マークアップ言語で記述されタグを埋め
    込まれた文書を、ディスク状の記録媒体を用いる補助記
    憶装置に保存する文書ファイル保存方法において、 保存対象となる文書ファイルからタグで囲まれた要素を
    タグ名毎に抽出し、前記要素からタグを取り除いた要素
    記述を保存する領域としてタグ名毎に前記記録媒体上の
    任意のトラックを指定し、以後は文書ファイル中で同一
    のタグ名で抽出された1以上の要素記述を前記トラック
    に連続して保存することを特徴とする文書ファイル保存
    方法。
  2. 【請求項2】 請求項1に記載の文書ファイル保存方法
    において、 前記要素記述を保存する領域として連続する複数トラッ
    クを指定することを特徴とする文書ファイル保存方法。
  3. 【請求項3】 請求項1または請求項2に記載の文書フ
    ァイル保存方法において、 前記要素記述を保存する際に、当該要素記述のデータ容
    量がトラックの残記憶容量を超えた場合には、そのトラ
    ックと隣接するトラックまたは近隣のトラックに保存す
    ることを特徴とする文書ファイル保存方法。
  4. 【請求項4】 マークアップ言語で記述されタグを埋め
    込まれた文書を、テープ状の記録媒体を用いる補助記憶
    装置に保存する文書ファイル保存方法において、 保存対象の文書ファイルからタグで囲まれた要素をタグ
    名毎に抽出し、前記要素からタグを取り除いた要素記述
    を保存する領域としてタグ名毎に前記記録媒体上の任意
    のパーティションを指定し、以後は文書ファイル中で同
    一のタグ名で抽出された1以上の要素記述を前記パーテ
    ィションに連続して保存することを特徴とする文書ファ
    イル保存方法。
  5. 【請求項5】 請求項4に記載の文書ファイル保存方法
    において、 要素記述を保存する際に、当該要素記述のデータ容量が
    パーティションの残記憶容量を超えた場合には、そのパ
    ーティションと隣接するパーティションまたは近隣のパ
    ーティションに保存することを特徴とする文書ファイル
    保存方法。
  6. 【請求項6】 マークアップ言語で記述されタグを埋め
    込まれた文書を補助記憶装置に保存する方法を提供する
    プログラムであって、 保存対象となる文書ファイルを読み込み、タグ定義情報
    が記述されているかを判定する機能と、 タグ定義情報が記述されていれば、そのタグ定義情報か
    らタグ名毎に補助記憶装置に要素記述を保存する領域が
    確保されているかを判定する機能と、 前記領域が確保されていなければ、要素記述を保存する
    領域として新たにタグ名毎に記録媒体上の任意の領域を
    確保する機能と、 タグ定義情報が記述されていない場合、または要素記述
    を保存する領域が確保されていた場合、または領域を新
    たに確保した後は、当該文書ファイルに記述されている
    要素を1つずつ読み込み、当該要素から抽出したタグが
    タグ定義情報に定義されていないものであれば、タグ名
    毎に補助記憶装置に要素記述を保存する領域が確保され
    ているかを判定する機能と、 領域が確保されていなければ、要素記述を保存する領域
    として新たにタグ名毎に記録媒体上の任意の領域を確保
    する機能と、 領域が確保されていた場合、または領域が新たに確保さ
    れた後は、当該要素から抽出した要素記述を確保された
    領域に保存する機能と、 当該要素記述が当該文書ファイル内に記述されていた場
    所を示す情報と、当該要素記述が保存された当該領域の
    アドレス情報を取得し補助記憶装置に保存する機能と、 当該文書ファイルに記述されている全ての要素記述を保
    存するまで処理を繰り返す機能と、 を有することを特徴とする文書ファイル保存プログラ
    ム。
JP2001325535A 2001-10-23 2001-10-23 文書ファイル保存方法及び文書ファイル保存プログラム Pending JP2003131933A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001325535A JP2003131933A (ja) 2001-10-23 2001-10-23 文書ファイル保存方法及び文書ファイル保存プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001325535A JP2003131933A (ja) 2001-10-23 2001-10-23 文書ファイル保存方法及び文書ファイル保存プログラム

Publications (1)

Publication Number Publication Date
JP2003131933A true JP2003131933A (ja) 2003-05-09

Family

ID=19142079

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001325535A Pending JP2003131933A (ja) 2001-10-23 2001-10-23 文書ファイル保存方法及び文書ファイル保存プログラム

Country Status (1)

Country Link
JP (1) JP2003131933A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010129001A (ja) * 2008-11-28 2010-06-10 Internatl Business Mach Corp <Ibm> 情報処理装置、データベース・システム、情報処理方法、およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010129001A (ja) * 2008-11-28 2010-06-10 Internatl Business Mach Corp <Ibm> 情報処理装置、データベース・システム、情報処理方法、およびプログラム
JP4688111B2 (ja) * 2008-11-28 2011-05-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、データベース・システム、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US9400816B1 (en) System for indexing collections of structured objects that provides strong multiversioning semantics
CN100452029C (zh) 用于管理媒体文件数据库的方法和系统
US8024507B2 (en) Transaction-safe FAT file system improvements
US6691136B2 (en) Fast data retrieval based upon contiguous consolidation of records according to frequency of access
US7822931B2 (en) File storage device, host apparatus, method for formatting nonvolatile semiconductor memory, and method of writing data in nonvolatile semiconductor memory
CN102023979A (zh) 元数据管理方法及系统
JP2005267600A5 (ja)
CN107729558A (zh) 文件系统碎片整理的方法、系统、装置及计算机存储介质
KR100899147B1 (ko) 메타 데이터 저장 방법 및 메타 데이터 저장 시스템
JP2006301892A (ja) 階層ストレージ管理装置、方法、およびプログラム
JP4310120B2 (ja) ユニバーサルディスクフォーマットファイルシステムのための情報制御ブロック追跡ストリームのためのシステムおよび方法
KR100907477B1 (ko) 플래시 메모리에 저장된 데이터의 인덱스 정보 관리 장치및 방법
US20060206543A1 (en) Database reorganization program and method
EP3940572A1 (en) Data generalization device, data generalization method, and program
CN201522706U (zh) 元数据管理系统
JP2003131933A (ja) 文書ファイル保存方法及び文書ファイル保存プログラム
JPWO2007032068A1 (ja) データベース管理プログラム
US20100185652A1 (en) Multi-Dimensional Resource Fallback
US7680832B1 (en) Techniques for managing configuration information among different physical devices
JPH0298779A (ja) データベース管理方法
JPS5851348A (ja) 可変長レコ−ドの高速アクセス方式
CN106033454B (zh) 虚拟文件系统的格式化方法、处理方法和装置
JP5906810B2 (ja) 全文検索装置、プログラム及び記録媒体
JP3016255B2 (ja) データベース管理システム
Christodoulakis et al. File organizations and access methods for CLV disks