JP2007012058A - フラッシュ様媒体におけるトランザクションレコードを格納するファイルシステム - Google Patents

フラッシュ様媒体におけるトランザクションレコードを格納するファイルシステム Download PDF

Info

Publication number
JP2007012058A
JP2007012058A JP2006173213A JP2006173213A JP2007012058A JP 2007012058 A JP2007012058 A JP 2007012058A JP 2006173213 A JP2006173213 A JP 2006173213A JP 2006173213 A JP2006173213 A JP 2006173213A JP 2007012058 A JP2007012058 A JP 2007012058A
Authority
JP
Japan
Prior art keywords
file
transaction
record
memory
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006173213A
Other languages
English (en)
Inventor
Dan Dodge
ドッジ ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QNX Software Systems GmbH
Original Assignee
QNX Software Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QNX Software Systems GmbH filed Critical QNX Software Systems GmbH
Publication of JP2007012058A publication Critical patent/JP2007012058A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1865Transactional file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0656Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

【課題】ファイルシステムを回復するためにトランザクションファイルを好適に使用できるコンピュータシステムを提供する。
【解決手段】コンピュータシステム(10)に含まれるファイルシステムソフトウェア(47)は、ファイルデータ、および、固定データ記憶装置(30)に格納されるファイルのシステム構造を管理し、フラッシュ様媒体に格納されたトランザクションファイル(220)を維持する。トランザクションファイルは、それぞれが論理ヘッダセクションおよび論理データセクションを含む、複数のトランザクションレコードを含む。それぞれのトランザクションレコードの論理ヘッダセクションは、フラッシュ様媒体の同一のブロック内において、二つ以上の隣接するメモリページのスペアメモリ領域に対応し、一方で、それぞれのトランザクションレコードの論理データセクションは、二つ以上の隣接するメモリページのデータメモリ領域に対応する。
【選択図】図1

Description

本発明は一般に、コンピュータ、埋め込み型コントローラなどにおける使用のためのファイルシステムに関する。より詳細には、本発明は、ファイルシステムがフラッシュ様(flash−like)媒体におけるファイルシステムのためのトランザクションレコードを格納する、トランザクションベースのファイルシステムに関する。
コンピュータ、内蔵コントローラ、および他のマイクロプロセッサベースのシステムは、通常、様々な異なるハードウェアの構成要素から構成される。ハードウェア構成要素は、プロセッサ、I/Oデバイス、ヒューマンインターフェースデバイスなどを含み得る。付け加えて、そのようなシステムは、システムにおいて使用されるデータを維持するための、メモリ格納ユニットを使用する。メモリ格納ユニットは、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブ、ランダムアクセスメモリ、フラッシュメモリなどを含む、様々な異なる形態を取り得るが、それらに限定されるわけではない。
そのようなシステムにおいて実行されるハイレベルのアプリケーションプログラムは、しばしば、メモリ記憶装置ユニットを含むこれらのハードウェア構成要素とシームレスに遣り取りをしなければならない。この目的に対して、多くのシステムは、アプリケーションプログラムとシステムハードウェアとの間におけるインターフェースとしての機能を果たすオペレーティングシステムを実行する。ファイルシステムソフトウェアはオペレーティングシステムの一部として含まれ得るか、または、オペレーティングシステムと遣り取りをする補助的なソフトウェア構成要素として提供され得る。いずれかの例において、ファイルシステムソフトウェアは、プロセッサおよびそのプロセッサが実行するハイレベルアプリケーションプログラムによる素早いアクセスのために、メモリ記憶装置ユニット内のデータを編成する。
多数の異なるファイルシステムの分類が存在する。というのは、ファイルシステムをインプリメントする多くの方法が存在するからである。例えば、トランザクションベースのファイルシステムは、ファイルシステムが常に一定の状態に維持されているものである。というのは、ファイルシステム構造およびデータの全ての更新は、トランザクションファイルに対するトランザクション(transaction)としてログがとられるからである。より詳細には、ファイルシステムの全ての更新は、トランザクションファイル内のトランザクションとしてなされ、ファイルシステムのコンテンツは、なされるトランザクションの全てに首尾良く適用することによって、ダイナミックに再構成される。
トランザクションファイルにおけるトランザクションは、なされるか、または完了されないかである。ファイルシステムの動作が、停電などのために、中断される場合、例えば、ファイルシステムの状態は、トランザクションファイルのコンテンツを参照することによって回復され得る。任意のなされたトランザクションはファイルシステムによって使用され、完了していない任意のトランザクションは、ロールバックされ、トランザクションが、企てられた更新以前の状態に、ファイルシステムを回復する。
トランザクションファイルはファイルシステムを回復するために使用されるゆえ、固定データ記憶装置の一部の形式において格納されなければならない。不揮発性集積回路記憶装置がこの目的のために使用され得る。しかしながら、これらの不揮発性集積回路記憶装置の多くは、トランザクションファイルをインプリメントするためにそれらを使用することを困難にさせる物理メモリの組織属性を有する。
トランザクションベースのファイルシステムを有するコンピュータシステムが説明される。コンピュータシステムは、プロセッサ、プロセッサによってアクセス可能である固定データ記憶装置、および、プロセッサによって実行可能であるファイルシステムソフトウェアを含む。固定データ記憶装置は、それぞれが複数の隣接する(contiguous)メモリページを含む、複数の隣接するメモリブロックに組織されるフラッシュ様記憶装置媒体を含む。メモリページのそれぞれは、データメモリおよびスペアメモリ領域を含む。ファイルシステムソフトウェアは、ファイルデータ、および、固定データ記憶装置に格納されるファイルのシステム構造を管理し、さらに、フラッシュ様媒体に格納されたトランザクションファイルを維持する。トランザクションファイルは、それぞれが論理ヘッダセクションおよび論理データセクションを含む、複数のトランザクションレコードを含む。それぞれのトランザクションレコードの論理ヘッダセクションは、フラッシュ様記憶装置媒体の同一のブロック内において、二つ以上の隣接するメモリページのスペアメモリ領域に対応し、一方で、それぞれのトランザクションレコードの論理データセクションは、二つ以上の隣接するメモリページのデータメモリ領域に対応する。
一つのインプリメンテーションにおいて、それぞれのトランザクションレコードの論理ヘッダセクションは、同一のメモリブロック内において隣接する第1および第2のメモリページのスペアメモリ領域に対応し、それぞれのトランザクションレコードの論理データセクションは、第1および第2のメモリページのデータメモリ領域に対応する。論理ヘッダのフィールドは、トランザクションレコードを確認するために、および/またはファイルシステムを再作成するために、ファイルシステムのスタートアップの間に使用される第1の(principal)情報が、第1のメモリページのスペア領域に置かれるように、配置される。トランザクションレコードの完全な確認を実行するために必要とされる第2の情報は、第2のメモリページのスペア領域に配置され得る。
本発明は、さらに以下の手段を提供する。
(項目1)
プロセッサと、
該プロセッサによってアクセス可能な固定データ記憶装置であって、該固定データ記憶装置はフラッシュ様記憶装置媒体を含み、該フラッシュ様記憶装置媒体は、複数の隣接するメモリブロックを含み、該複数の隣接するメモリブロックのそれぞれが複数の隣接するメモリページを含み、該複数の隣接するメモリページのそれぞれがデータメモリ領域およびスペアメモリ領域を含む、固定データ記憶装置と、
該固定データ記憶装置上に格納されたファイルデータおよびファイルのファイルシステム構造を管理するための、該プロセッサによって実行可能であるファイルシステムソフトウェアと、
該ファイルシステムソフトウェアによって、該フラッシュ様媒体において維持されるトランザクションファイルと
を備える、コンピュータシステムであって、
該トランザクションファイルは、複数のトランザクションレコードを含み、それぞれのトランザクションレコードは、論理ヘッダセクションおよび論理データセクションを含み、
それぞれのトランザクションレコードの該論理ヘッダセクションは、同一のブロック内において、二つ以上の隣接するメモリページのスペアメモリ領域に対応し、それぞれのトランザクションレコードの該論理データセクションは、二つ以上の隣接するメモリページのデータメモリ領域に対応する、
コンピュータシステム。
(項目2)
プロセッサと、
該プロセッサによってアクセス可能な固定データ記憶装置であって、該固定データ記憶装置はフラッシュ様記憶装置媒体を含み、該フラッシュ様記憶装置媒体は、複数の隣接するメモリブロックを含み、該複数の隣接するメモリブロックのそれぞれが複数の隣接するメモリページを含み、該複数の隣接するメモリページのそれぞれがデータメモリ領域およびスペアメモリ領域を含む、固定データ記憶装置と、
該固定データ記憶装置上に格納されたファイルデータおよびファイルのファイルシステム構造を管理するための、該プロセッサによって実行可能であるファイルシステムソフトウェアと、
該ファイルシステムソフトウェアによって、該フラッシュ様媒体において維持されるトランザクションファイルと
を備える、コンピュータシステムであって、
該トランザクションファイルは、複数のトランザクションレコードを含み、それぞれのトランザクションレコードは、論理ヘッダセクションおよび論理データセクションを含み、
それぞれのトランザクションレコードの該論理ヘッダセクションは、第1のメモリページのスペアメモリ領域および第2のメモリページのスペアメモリ領域に対応し、該第1および第2のメモリページは、同一のメモリブロック内において隣接し、
それぞれのトランザクションレコードの該論理データセクションは、該第1および第2のメモリページのデータメモリ領域に対応する、
コンピュータシステム。
(項目3)
それぞれのトランザクションレコードの上記論理ヘッダセクションが、トランザクション識別フィールドを含み、該トランザクション識別フィールドは、ファイルに関連する一つ以上のトランザクションレコードの時間順の順序を容易にする、項目1に記載のコンピュータシステム。
(項目4)
上記トランザクション識別フィールドが、上記ファイルシステムソフトウェアによって割り当てられた、単調に増加するトランザクション識別子を含む、項目3に記載のコンピュータシステム。
(項目5)
上記ファイルシステムソフトウェアが、ブロック内におけるトランザクションレコードのオフセットに基づいて、固定データ記憶装置の同一のブロック内に格納されたトランザクションレコードに対する時間順の情報を引き出す、項目1に記載のコンピュータシステム。
(項目6)
それぞれのトランザクションレコードの上記論理ヘッダセクションは、該個々のトランザクションレコードに対応する上記トランザクションがなされるかどうかを決定するために、上記ファイルシステムソフトウェアによってアクセス可能であるトランザクション状態フィールドを含む、項目1に記載のコンピュータシステム。
(項目7)
それぞれのトランザクションレコードの上記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックの状態を示すメモリ状態フィールドを含む、項目1に記載のコンピュータシステム。
(項目8)
それぞれのトランザクションレコードの上記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックが消去された状態にあるかどうかを示すメモリ状態フィールドを含む、項目1に記載のコンピュータシステム。
(項目9)
上記ファイルシステムソフトウェアによってアクセス可能であるメタファイルをさらに含む、項目1に記載のコンピュータシステム。
(項目10)
上記メタファイルが多数のメタファイルレコードを含み、該メタファイルレコードのそれぞれが、ファイル識別フィールドを含む、項目9に記載のコンピュータシステム。
(項目11)
それぞれのトランザクションレコードの上記論理ヘッダセクションが、ファイル識別フィールドを含む、項目10に記載のコンピュータシステム。
(項目12)
上記論理ヘッダセクションの上記ファイル識別フィールドが、上記メタファイルの該ファイル識別フィールドに対応する、項目11に記載のコンピュータシステム。
(項目13)
上記フラッシュ様媒体は、NORフラッシュメモリおよびNANDフラッシュメモリからなる群から選択されたフラッシュメモリを含む、項目1に記載のコンピュータシステム。
(項目14)
上記プロセッサによってアクセス可能なランダムアクセスメモリに格納された、再構成されたファイルシステムをさらに含む、項目1に記載のコンピュータシステム。
(項目15)
上記再構成されたファイルシステムが、逆階層方法において、ファイルおよびディレクトリを組織する、項目14に記載のコンピュータシステム。
(項目16)
それぞれのトランザクションレコードの上記論理ヘッダセクションが、トランザクション識別フィールドを含み、該トランザクション識別フィールドは、ファイルに関連する一つ以上のトランザクションレコードの時間順の順序を容易にする、項目2に記載のコンピュータシステム。
(項目17)
上記トランザクション識別フィールドが、上記ファイルシステムソフトウェアによって割り当てられた、単調に増加するトランザクション識別子を含む、項目16に記載のコンピュータシステム。
(項目18)
上記ファイルシステムソフトウェアが、ブロック内におけるトランザクションレコードのオフセットに基づいて、固定データ記憶装置の同一のブロック内に格納されたトランザクションレコードに対する時間順の情報を引き出す、項目2に記載のコンピュータシステム。
(項目19)
それぞれのトランザクションレコードの上記論理ヘッダセクションは、該個々のトランザクションレコードに対応する上記トランザクションがなされるかどうかを決定するために、上記ファイルシステムソフトウェアによってアクセス可能であるトランザクション状態フィールドを含む、項目2に記載のコンピュータシステム。
(項目20)
それぞれのトランザクションレコードの上記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックの状態を示すメモリ状態フィールドを含む、項目2に記載のコンピュータシステム。
(項目21)
それぞれのトランザクションレコードの上記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックが消去された状態にあるかどうかを示すメモリ状態フィールドを含む、項目2に記載のコンピュータシステム。
(項目22)
上記ファイルシステムソフトウェアによってアクセス可能であるメタファイルをさらに含む、項目2に記載のコンピュータシステム。
(項目23)
上記メタファイルが多数のメタファイルレコードを含み、該メタファイルレコードのそれぞれが、ファイル識別フィールドを含む、項目22に記載のコンピュータシステム。
(項目24)
それぞれのトランザクションレコードの上記論理ヘッダセクションが、ファイル識別フィールドを含む、項目23に記載のコンピュータシステム。
(項目25)
上記論理ヘッダセクションの上記ファイル識別フィールドが、上記メタファイルの該ファイル識別フィールドに対応する、項目24に記載のコンピュータシステム。
(項目26)
上記ファイルのファイルシステム構造が、ファイルおよびディレクトリの階層構造を含む、項目2に記載のコンピュータシステム。
(項目27)
上記フラッシュ様媒体は、NORフラッシュメモリおよびNANDフラッシュメモリからなる群から選択されたフラッシュメモリを含む、項目2に記載のコンピュータシステム。
(項目28)
上記プロセッサによってアクセス可能なランダムアクセスメモリに格納された、再構成されたファイルシステムをさらに含む、項目2に記載のコンピュータシステム。
(項目29)
上記再構成されたファイルシステムが、逆階層方法において、ファイルおよびディレクトリを組織する、項目28に記載のコンピュータシステム。
本発明の他のシステム、方法、特徴および利点は、以下に続く図面および詳細な記載の検討において、当業者にとって明らかである。そのような追加的なシステム、方法、特徴、および利点は、本記載内に含まれ、本発明の範囲内であり、添付の特許請求の範囲によって保護されるべきことが意図される。
本発明は、添付の図面および記載を参照してより良く理解され得る。図における構成要素は、必ずしも縮尺通りである必要はなく、その代わり、本発明の原理を例示することに強調が置かれる。さらに、図において、同様の参照番号は様々な図を通して、対応する部分を示す。
図1は、例示的なトランザクションベースのコンピュータシステム10において用いられ得る構成要素を示す。示されるように、例示的なシステム10は、プロセッサ15、読み出し専用メモリ20、および固定記憶装置ユニット30を含む。コンピュータシステム10はまた、ランダムアクセスメモリ35、I/Oインターフェース40、およびユーザインターフェース45を含み得る。コンピュータシステム10において使用される特定の構成要素は、コンピュータシステム10によって実行される特定の機能に対して変更され得る。従って、プロセッサ15以外の構成要素の存在または不在は、コンピュータシステム10に課される設計基準に対して特定的であり得る。例えば、コンピュータシステム10が内蔵のコントローラなどの形式をとる場合、ユーザインターフェース45は省かれ得る。
読み出し専用メモリ20は、プロセッサ15によって実行されるハイレベルのアプリケーションプログラムと、メモリデバイス20および35、固定記憶装置ユニット30、ならびに、インターフェースデバイス40および45を含む、様々なハードウェア構成要素との間の遣り取りを制御する、オペレーティングシステムコード43を含み得る。オペレーティングシステムコード43は、固定記憶装置ユニット30上に格納されたファイルを編成するためのファイルシステムソフトウェアを含み得る。あるいは、ファイルシステムソフトウェアは、オペレーティングシステムコード43と単に遣り取りするする別個のソフトウェア構成要素として提供され得る。後者の場合において、ファイルシステムソフトウェアに対応するコードは、読み出し専用メモリ20、固定記憶装置ユニット30などに格納され得る。コンピュータシステム10がI/Oインターフェース40を介して、他のコンピュータおよび/または記憶装置とネットワーク化される場合、ファイルシステムソフトウェアは、遠隔に格納され得、必要に応じて、コンピュータシステム10へダウンロードされ得る。しかしながら、図1は、読み出し専用メモリ20におけるファイルシステムソフトウェア47の格納を例示する。
固定記憶装置ユニット30は任意の数の異なる形式を取り得る。例えば、固定記憶装置ユニット30は、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブ、などの形式を取り得る。また、集積回路形式(例えば、フラッシュメモリなど)においてインプリメントされる不揮発性メモリなどの、非回転式メディアデバイスの形式であり得る。さらに、固定記憶装置ユニット30は単一のメモリ構造に限定される必要はない。むしろ、固定記憶装置ユニット30は、多数の同様のタイプ(例えば、全てのフラッシュメモリ)の別個の記憶装置、および/または多数の異なるタイプ(例えば、一つ以上のフラッシュメモリユニットおよび一つ以上のハードディスクドライブ)の別個の記憶装置を含み得る。
固定記憶装置30に格納されたファイルは、アプリケーションプログラムによってか、またはオペレーティングシステムコード43によって使用される所定のフォーマットに従って解釈されるデータを含む。例えば、ファイル内に格納されたデータは、実行可能なプログラム、データベースレコードのASCIIテキスト、コンピュータシステム10によって実行される(または実行されない)トランザクションに対応するデータなどのソフトウェアコードを構成し得る。
この例示的なシステム10において、ファイルシステムソフトウェア47は、逆階層構造を使用した固定記憶装置ユニット30に格納されたファイルを組織する。図2は、全体が、参照番号50にて示される逆階層構造がインプリメントされ得る一方法を示す図である。多くのファイルシステムによって使用される従来の階層構造において、ファイル構造の最上位はルートディレクトリから始まり、それぞれのディレクトリは、そのディレクトリ内に含まれるファイルおよびサブディレクトリへ下がっていく。例示的な逆階層構造50においては、しかしながら、親ディレクトリ内に含まれる子ファイルおよび子ディレクトリは、親ディレクトリに上がっていく。ファイルシステムがどこでその編成を開始するかに依存しつつ、ルートディレクトリは、ファイルシステム構造の最下位レベルを構成し得る。
例示的な逆階層構造50は、ファイルシステム構造の最上位レベルにおける、5つのファイル、55、60、65、70、および75を含む。ファイル55、60、および65はディレクトリ80内に含まれる一方で、ファイル70および75はディレクトリ85内に含まれる。従って、ファイルシステムソフトウェア47は、子ファイル55、60、および65を表すファイルシステムレコードがそれらの親ディレクトリ80に対するレコードに向かうように、ファイルシステムを編成する。同様に、子ファイル70および75を表すファイルシステムレコードは、それらの親ディレクトリ85に対するレコードに向かう。
例示的な逆階層構造50の次なるレベルにおいて、ファイル90、95およびディレクトリ80はディレクトリ100内に含まれ、一方で、ディレクトリ85はディレクトリ105内に含まれ得る。従って、ファイルシステムソフトウェア47は、子ディレクトリ80、ならびに子ファイル90および95を表すファイルシステムレコードがそれらの親ディレクトリ100に対するレコードに向かうようにファイルシステムを編成する。同様に、子ディレクトリ85を表すファイルシステムレコードは、その親ディレクトリ105に対するレコードに向かう。
ルートディレクトリ110は、逆階層構造50のトランク(trunk)を形成し得る。この例において、ディレクトリ100および105、ならびにファイル115は、ルートディレクトリ110内に含まれる。ファイルシステムソフトウェア47は、子ディレクトリ100および105ならびに子ファイル115を表すファイルシステムレコードがそれらの親ディレクトリ105に対するレコードに向かうように、ファイルシステムを編成する。
ファイルシステムソフトウェア47が逆階層構造をインプリメントするためにファイルシステムのレコードを編成し得る一方法が、図3において示される。ファイルシステムのこのインプリメンテーションにおいて、ファイルシステムソフトウェア47は、そのファイルシステムにおいて使用されるそれぞれのファイルおよびディレクトリに対応するレコードを含む一つ以上のメタファイルを生成し得る。図3は、単一のメタファイル120、および、そのメタファイル120内のレコードが配置され得、フォーマットされ得る例示的な方法を示す。この例において、メタファイル120は、複数の等しい長さのレコードエントリ125を含むテーブルとして配置され得る。それぞれのレコードエントリ125は、ファイルシステムにおいて使用され得る単一のファイルまたはディレクトリに対応する。参照番号130にて示される独自のファイル識別子は、ファイルシステムソフトウェア47によって使用され得、メタファイル120の対応するレコード125をアドレスする。それぞれのレコードエントリ125が同じレコード長を有する場合、ファイル識別子130のフォーマットは、それが、メタファイル120における所望のレコードに対するインデックスとして、直接にかまたは間接的に使用され得るように、選択され得る。例えば、ファイル識別子130は、所望のディレクトリ/ファイル情報を有するメタファイルレコードの最初のバイトのメモリアドレスロケーションを計算するために、メタファイル120の最初のレコードのメモリアドレスロケーションと供に使用され得るオフセット値を構成し得る。
図3の例において、ファイル識別子130は、メタファイル120におけるレコード135(エントリ7)に向かう。レコード135は、メタファイル120に隣接し、拡張形式において、図3に示される。レコード135の拡張形式はまた、それぞれのレコードエントリ125に対して使用され得る基本的なレコードフォーマットを示す。この例において、レコード135は、レコードによって表されるファイルまたはディレクトリに関連する情報を含む、多数の異なるフィールドを含む。他のものの中でも、この情報は、ファイルシステムの構造内におけるファイルまたはディレクトリの論理的ロケーションに対応する。
ファイルシステムの逆階層構造は、それぞれのメタファイルレコードがその親ディレクトリを表すメタファイルレコードに対するポインタを含む、メタファイルレコードフォーマットを用いることによってインプリメントされ得る。図3は、それぞれのメタファイルレコードが、その親ディレクトリのファイル識別子を格納する親識別子フィールド140を含む、メタファイルレコードフォーマットを示す。この例において、メタファイルレコード135の親レコード識別子140は、レコード145(エントリ9)をアドレスするために使用されるファイル識別子に対応する。次に、レコード145は、レコード135によって表されるファイルまたはディレクトリを含むディレクトリに関連する情報を含む。
それぞれのメタファイルレコードはまた、そのレコードが表すディレクトリまたはファイルに関連する他の情報を含み得る。レコード135の例示的なレコードフォーマットにおいて、多くの異なる情報フィールドが用いられる。情報フィールドは、モードフィールド150、ユーザ識別フィールド155、グループ識別フィールド160、アクセス時間フィールド165、修正時間フィールド170、作成時間フィールド175、ファイルサイズフィールド180、および短い名前フィールド185を含む。モードフィールド150は、レコードによって表されるファイルまたはディレクトリが、システムファイル/ディレクトリ、隠しファイル/ディレクトリ、読み出し専用ファイル/ディレクトリなどであるかどうかを決定するために使用され得る。ユーザ識別フィールド155およびグループ識別フィールド160は、表されたファイルまたはディレクトリのユーザおよびグループ所有権(ownership)に関連する情報を含む。アクセス時間フィールド165、修正時間フィールド170、および作成時間フィールド175は、それぞれ、表されたファイルまたはディレクトリが最後にアクセスされた時間、表されたファイルまたはディレクトリが最後に修正された時間、および表されたファイルまたはディレクトリが作成された時間に関連する情報を含む。サイズフィールド180は、レコードによって表されたファイルのサイズに関する情報を含み、ディレクトリレコードに対してゼロである。最後に、短い名前フィールド185は、対応するファイルまたはディレクトリの短いテキスト名を表すASCII文字を含む。短い名前フィールド185の長さは、例えば、POSIX規格に適合するように選択され得る。付け加えて、それぞれのレコードは、短い名前に対応する、ハッシュ値および/または名前の要約(sum)を含み得る。そのようなハッシュ値および/または名前の要約は、特定のディレクトリおよび/またはファイルレコードを迅速に検索(search)するために、ファイルシステムソフトウェア47によって使用され得る。
メタファイル120におけるそれぞれのレコードはまた、拡張レコード識別子190に対するフィールドを含み得る。拡張レコード識別子190は、メタファイル120における拡張レコードに向かうファイル識別子として使用され得る。拡張レコードは、レコードによって表されるファイルまたはディレクトリに対するさらなる情報を含み得、特定のファイルまたはディレクトリに関連する情報の全てが、単一のメタファイルレコードに対して割り当てられるメモリスペース内に適合しない場合において、特に有用であり得る。
図3は、拡張レコード識別子190が使用され得る一方法を示す。この例において、レコード135の拡張レコード識別子190は、メタファイル120におけるレコード195(エントリ11)にアクセスするために使用されるファイル識別子(fid)に対応する。レコード195の開いた展開図が、図3におけるレコード135の開いた展開図に隣接して示される。この開いた展開図が、拡張レコードに対して使用され得る一つのレコードフォーマットを示す。示されるように、それぞれの拡張レコードは、それ自体の親識別子フィールド200を含み得る。拡張レコードの親識別子フィールド200は、しかしながら、拡張レコードに向かうレコードのファイル識別子に対応する。図3に示された例において、親識別子フィールド200のコンテンツが、レコード135(エントリ7)に戻るために使用され得る。
二つのレコードエントリに割り当てられたメモリスペースがファイルまたはディレクトリに関連する情報の全てを保持するには不十分であるような場合において、拡張レコード195は、レコード195のフィールド205に含まれるような、それ自体の拡張レコード識別子を使用するさらなる拡張レコードにまで向かい得る。拡張レコード識別子125によって向かわれた、さらなる拡張レコードのフォーマットはここでは示されないが、さらなる拡張レコードは、同様に、レコード195に戻る親レコード識別子を含み得る。
拡張レコードに含まれる情報のタイプは、ファイルシステム間で変化し得る。図3において、拡張レコード195は、レコード135によって表されるファイルまたはディレクトリの長い名前のテキストに対応するASCII文字を含む、長い名前フィールド210を含む。さらなるフィールドは、レコード195などのような、それぞれの拡張レコードの拡張領域215において、予約され得、対応するファイルまたはディレクトリに関連する追加的な情報を格納する。
前述の例において、ファイルシステムに使用される拡張レコードは、メタファイル120において格納される。しかしながら、拡張レコードおよび任意のさらなる拡張レコードは、代替的に、別個のメタファイル、多数のメタファイルなどに格納され得る。別個のメタファイルは、同様の記憶装置媒体を、メタファイル120とも、相互にも、共有する必要はない。むしろ、メタファイルは、プロセッサ15にアクセス可能である異なる記憶装置媒体に格納され得る。基本的なメタファイルレコード(対応する拡張レコードを有しないディレクトリおよびファイルレコード)でさえも、多数のファイルおよび/または多数の記憶装置媒体の中において分配され得る。従って、例示的なシステムのメタファイルレコードは単一のメタファイルに格納されるが、そのメタファイルは、代替的には、同一の、または異なる記憶装置媒体上の多くの個々のファイルという形式であり得る。
逆階層構造におけるコンピュータシステム10のファイルおよびディレクトリを編成することによって、一つ以上のファイルシステムの利点を実現することが可能になる。例えば、ファイルシステムは、通常のファイルおよびディレクトリトランザクション(すなわち、ファイル/ディレクトリの移動、ファイル/ディレクトリの消去、ファイル/ディレクトリの作成、ファイル/ディレクトリのコピー)が、自動的に、単一のメタファイルレコードの変化、追加、または消去として達成される任意の方法においてインプリメントされることが可能である。このインプリメンテーションにおいて、例えば、レコード135によって表されるファイル/ディレクトリは、単に親識別子140を変化させることによって、階層における別のディレクトリに移動し得、その結果、それは、新しい親ディレクトリに対するメタファイルレコードに向かう。これは、メタファイル120におけるレコード135に対する単一の書き込み動作を用いて達成され得る。
逆階層構造は、トランザクションまたはログベースのシステムを最適化するために用いられ得る。例示的なトランザクションまたはログベースシステムは、図1に示される構成要素から構成され得る。この例において、トランザクションファイル220は、固定記憶装置ユニット30に維持され得、それぞれのファイルシステムのファイルおよびディレクトリに関連するトランザクションのレコードを保持するために使用され得る。ファイルシステムの更新は、トランザクションファイル220に含まれるトランザクションレコードに基づいて、自動的になされる。最も単純な形式の一つにおいて、全てのトランザクションレコードは、固定記憶装置ユニット30の物理ブロックまたはセクターにマップされ得る単一の論理ページとして格納され得る。
トランザクションレコード225がコンピュータシステム10における使用のためにフォーマットされ得る一方法が、図4に示される。一般的に言えば、トランザクションファイル220のそれぞれのトランザクションレコード225は、ヘッダフィールド230および対応のデータフィールド235を含む。ヘッダフィールド230は多数の異なるサブフィールドを含み得る。図4に示されるサブフィールドは、トランザクションシーケンスフィールド240、ファイル識別フィールド245、トランザクション状態フィールド250、クラスタハイ(high)フィールド255、クラスタロー(low)フィールド260、クラスタ数フィールド265を含む。付け加えて、さらなるサブフィールドが、トランザクションの保全性を認証し、エラーを修正するために、ヘッダ230において含まれ得る。これらのさらなるサブフィールドは、クラスタ要約フィールド247、トランザクション要約フィールド、ヘッダ230をチェックおよび修正するエラー修正コードフィールド257、データ235をチェックおよび修正するエラー修正コードフィールド259、および、トランザクションレコードが格納され得るメモリロケーションの状態を示すさらなる状態フィールド262を含む。
ヘッダフィールド230のサブフィールドのそれぞれは、ファイルシステムソフトウェア47に対して意味を有する。この例において、トランザクションシーケンスフィールド240は、ファイルシステムソフトウェア47によって割り当てられ得る、単調に増加するトランザクション識別子であり得る。新しいトランザクションレコードがトランザクションファイル220に追加され得る場合、新しいレコードのトランザクションシーケンスフィールド240において格納される値は、時間的に先行するトランザクションレコードのトランザクションシーケンスフィールドの値を超えた、所定の量だけ増加され得る。従って、大きなトランザクション識別子の値を有するトランザクションレコードほど、小さなトランザクション識別子の値を有するトランザクションレコードよりも、時間的に後の、トランザクションファイル220に追加されると考えられる。トランザクションシーケンスフィールド240(および所定の状況においては、トランザクションファイル220のブロック内におけるトランザクションレコードの位置)の値によって表されるような、このトランザクションの時間順の順序によって、ファイルシステムソフトウェア47は、ファイルシステムのコンテンツの保全性を適切な順序に維持するために、トランザクションを適用する(すなわち、トランザクションをする)ことが可能である。トランザクションの時間的な順序の経過を追う他の方法もまた使用され得る。
ファイルシステムソフトウェア47は、トランザクションレコード225のトランザクションがなされるかどうかを決定するために、トランザクション状態フィールド250を使用する。いったんトランザクションがなされると、そのなされたトランザクションレコード225のさらなる変更が、ファイルシステムソフトウェア47によって禁止され得る。これはファイルシステムの整合性を保証し、ファイルシステムは、例えば、追記型メディア、フラッシュメディアなどにおいて、トランザクションファイル220を格納することができる。
ヘッダ230のファイル識別フィールド245は、トランザクションレコード225によって影響され得るファイルを識別する。ファイル識別フィールド245のフォーマットが、メタファイルレコードにおいて使用されるファイル識別子と同一であるように、選択され得る。クラスタハイフィールド255およびクラスタローフィールド260はファイルシステムソフトウェア47によって使用され得、データ235が、識別されたファイルに書き込まれ得る開始アドレス(またはオフセット)を決定し、その一方で、クラスタ数フィールド265は、識別されたファイルのクラスタがいくつデータ235によって上書きされるかを決定するために使用され得る。
上述したように、固定記憶装置ユニット30は、一つ以上のフラッシュメモリデバイスを含み得る。フラッシュメモリデバイスは、「メモリセル」と呼ばれる、論理ゲートにおける情報を格納し、それらのそれぞれは、通常、1ビットの情報を格納する。フラッシュメモリ技術におけるさらなる最近の発展によって、ときに、マルチレベルセルデバイスとも呼ばれるそのようなデバイスが、セル毎に1ビットよりも多くの以上を格納することが可能となっている。付け加えて、フラッシュメモリは不揮発性であり、それは、デバイスから電源が引き抜かれても、メモリセルのコンテンツは失われないことを意味する。
フラッシュメモリ技術が継続して進化しているが、優勢な技術としては、NANDフラッシュメモリおよびNORフラッシュメモリが挙げられる。NORフラッシュデバイスおよびNANDフラッシュデバイスは、一般に、それぞれの記憶装置セルに対して使用される論理ゲートのタイプにおいて異なる。NANDフラッシュメモリデバイス275のうちの一つのタイプの例示的な論理構成270が図5に示される。示されるように、デバイス275上の利用可能なメモリが、隣接する物理ブロック280に編成され得、それぞれが等しい数のメモリセルを有する(すなわち、16Kバイト)。NANDフラッシュメモリデバイス275は、さらに、隣接するブロック280のそれぞれを、特定数の物理セクターまたはページ290に分割する。次に、それぞれの物理ページ290は、さらに、データ領域295およびスペア領域300に分割され得る。データ領域295は、通常、データの格納のための予備であり、一方、スペア領域300は、通常、データ領域295に格納されたデータについてのメタ情報の維持のために予約される。メタ情報としては、例えば、セクターのコンテンツの確認および修正のために使用されるエラー修正コード、巡回冗長検査データなどが挙げられ得る。
NORフラッシュデバイスは、それぞれのページのスペア領域がデータ領域の反対側に位置する点を除いて、図5に示されるものと同様な構成を有する。NORフラッシュデバイスはまた、ランダムアクセス読み出しおよびプログラミング動作を提供し、個々のメモリロケーションが読み出されるか、読み出すことが可能である。しかしながら、いったんブロックにおけるメモリロケーションが書き込まれると、NORフラッシュデバイスは、そのブロックが、ブロックよりも小さい細分性にて再書き込みをされないようにする。同様に、NORフラッシュデバイスは、ブロックよりもより小さい細分性における動作を消去させないようにする。
データ領域295およびスペア領域300は、通常、NORおよびNANDフラッシュデバイスの両方における特定のサイズに設定される。例えば、図5の例示的なNANDフラッシュデバイス275のそれぞれのページ290は、ページサイズ全体で528バイトに対して、512バイトのデータ領域295、および16バイトのスペア領域300を含む。NANDフラッシュデバイス275はまた、ブロック280毎に32個のページ290を用いる。他のページサイズは、コンピュータシステム10において使用され得、商業的にも利用可能である。例えば、多くのNANDデバイスは、64個のページを含むブロックを含み、そこで、それぞれのページは2112バイトを格納し、その結果、ページ毎のトータルのデータ領域は、2048バイトであり、ページ毎のスペア領域は64バイトである。
NANDフラッシュデバイス275のようなフラッシュメモリデバイスは、通常、一度に、メモリのメモリブロック280全体上における消去動作を実行する。消去動作は、ブロック280内の全てのビットを、コンシステントな状態、通常はバイナリ「1」の値に設定する。フラッシュデバイス275の消去されたブロック280上におけるプログラミング動作は、ページ290全体のコンテンツを変更することができるのみである(NORフラッシュデバイスは、僅かに異なる方法においてプログラムされ得るけれども)。いったんNANDフラッシュデバイスのページ290がプログラムされると、その状態は、ブロック280全体が再び消去され得るまで、さらに変更され得ない。フラッシュデバイス275のコンテンツを読み出すことがまた、そのページレベルにおいて生じる。
図6は、トランザクションレコードがNANDフラッシュデバイス275などのフラッシュメモリデバイスにおいて編成され得る一方法を示す。この例において、それぞれのトランザクションレコード305は、二つ以上の隣接した論理ページ315からなり得る。次に、それぞれの論理ページ315は、デバイス275のブロック280の、二つ以上の隣接した物理ページ290からなり得る。トランザクションレコード310に対するメタデータ情報は、スペア領域300において格納され得、図4のヘッダ230と関連して記載されるフィールドの一部を含み得る。それぞれのページ290のスペア領域300のサイズに依存しつつ、メタデータ情報は、トランザクションレコード310の多数のスペア領域300において、分割され得る。二つの連続した物理ページ290のスペア領域300間のメタデータ情報の分割が図6において示される。図6において示されるトランザクションレコードはまた、それぞれのトランザクション310が、単一の論理ページ315に対応し、単一の論理ページ315が、例えば、二つの隣接した物理ページ290からなり得るように、編成され得る。
フラッシュデバイス275における、それぞれの論理ページ315と物理ページ290との間の一対一対応が存在し得る代替的な配置が図7において示される。この配置と図6において示されるものの間の差異は、メタデータ情報320の全てが、トランザクション310の最初の物理ページ290の単一のスペア領域300に格納され得る。このタイプの配置は、大容量のフラッシュデバイスが用いられる場合に、得に適切であり得る。しかしながら、メタデータ情報320はまた、トランザクションレコードの二つの隣接した物理ページ290のスペア領域300間に分割され得る。
同一のデバイスブロック290において格納されたトランザクションレコード310に対するシーケンス識別子は同一の値を有し得る。そのような場合において、シーケンス識別子は、異なるデバイスブロックのトランザクションレコード間における時間関係を比較するために用いられ得る時間順の情報を提供する。同一のブロックにおいて格納されたトランザクションレコード310に関する時間順の情報は、ブロック290内のトランザクションレコード310のオフセットロケーションから引き出され得、後に、より大きなオフセットにて生じるトランザクションレコード310を生じる。
コンピュータシステム10が開始されるか、電源をオンにされた後、ファイルシステムの保全性は、ランダムアクセスメモリ35におけるファイルシステムの再構成されたバージョンを生成することによって確認され得る。図1の参照番号330において通常示されるように、再構成されたファイルシステムは、トランザクションファイル220において格納された有効になされたトランザクションを用いて、および、メタファイル120に格納されたファイル/ディレクトリ情報から、生成され得る。図1において、再構成されたファイルシステム330は、再生成されたファイル階層335およびエクステントテーブル340を含む。
エクステントプール340を生成する一方法は、図8から図11において示される。図8は、エクステントプール340を生成するために使用され得る多数の相互に関連する処理ステップを示し、一方で、図9から図11は、これらの動作において生成され、使用される様々なテーブルおよびアレイの論理編成を示す。
エクステントテーブル340の生成は、トランザクションレコードの全てを見出すために、トランザクションファイル220のブロックをスキャンすることによって、図8のステップ345において開始する。ブロックは、なされたトランザクションレコードが見出される、最も低い順序のブロックから最も高い順序のブロックの順にスキャンされ得る。トランザクションがブロック内に見出される場合、トランザクションレコードを有するそれぞれのデバイスブロックを識別するブロックレコードのアレイが、ステップ350において生成され得る。
ファイルシステムソフトウェア47が、4つのトランザクションであるトランザクションファイル220のブロックをスキャンすると、ファイルシステムソフトウェアは、回収されたトランザクションの結果として消去されているブロックにあたり得る。これらのブロックは、ファイルシステムにおいて使用するために割り当てられていないからである。トランザクションヘッダは、通常バイナリ「1」である、消去された値に設定されたヘッダの全てのビットを有する有効なトランザクションが存在しないように、構成され得る。ファイルシステムソフトウェア47がトランザクションファイル220のブロックをスキャンする場合、ヘッダが消去されたブロックを示す任意のトランザクションがスキップされ得る。このヘッダの不変量は、トランザクションはそれが消去された値の逆である場合にファイルシステムによって使用中であることを示すフラグとして、単一のビットを使用することによって、実行され得る。トランザクションヘッダにおける消去のサイン値を見出した後、ブロックにおける残りのページをスキャンすることはスキップされ得、それによって、さもなければ消去されたページにアクセスするために使用される時間を節約し得る。システムのスタートアップ時間全体が、それに対応して減少され得る。
例示的なブロックアレイ355の編成は図9において示される。それぞれのブロックアレイレコード360は、シーケンスフィールド365、開始トランザクションフィールド370、およびトランザクション数フィールド375を含む。シーケンスフィールド365は、ブロックにおいて格納されたトランザクションレコードに対する、トランザクション識別値を格納するために使用され得る。開始トランザクションフィールド370は、ブロックにおける第1のトランザクションに対するするインデックスを格納するために使用され得、トランザクション数フィールド375は、ブロックにおいて見出されるトランザクション数を格納するために使用され得る。
図8のステップ380において、ファイルシステムソフトウェア47は、ブロックアレイ355におけるそれぞれのレコードエントリに対する、トランザクションリストテーブルを配置する。図9は、トランザクションリストテーブル385が編成され得る一方法を示す。この例において、ブロックアレイ355のそれぞれのレコード360は、トランザクションリストテーブル385の少なくとも一つのトランザクションリストレコード390に向かう。より詳細には、トランザクションリストレコード390は、所定のブロックアレイレコード360によって表されるブロックにおいて見出されるそれぞれのトランザクションに対して生成され得る。所与のブロックアレイレコード360のトランザクション数フィールド375に格納された値は、所与のブロックにおけるトランザクション数に対応し、所与のブロックに対するレコード390がいくつトランザクションリストテーブル385に追加されるかを指定する。
トランザクションリストテーブル385のそれぞれのトランザクションリストレコード390は、同一のレコード長を有し得、同一のレコードフィールドを含み得る。図9のレコード390において使用される例示的なフィールドは、ファイルクラスタオフセットフィールド395、デバイスクラスタインデックスフィールド400、クラスタ数フィールド405、およびファイル識別子/idxフィールド410を含む。ファイルクラスタオフセットフィールド395は、ブロック内でのトランザクションの物理ロケーションを識別するために使用され得る。デバイスクラスタインデックスフィールド400は、トランザクションのデータがどこで開始されるかを識別するために使用され得る。クラスタ数フィールド405は、どれくらいのデータのクラスタがそのトランザクション内に存在するかを識別するために使用され得る。最後に、以下で説明するように、ファイル識別子/idxフィールド410は多目的である。しかしながら、最初に、ファイル識別子/idxフィールド410において格納される値は、そのトランザクションが適用されるファイルを識別するために使用され得る。フィールド410において格納されるファイル識別子の値は、メタファイル120におけるレコードを基準にするために使用されるファイル識別子に直接に対応し得る。ステップ380が完了した後、ブロックアレイ355のレコード360は、例えば、ブロックの昇順において配置され、一方で、それぞれのブロックアレイレコード360に対するレコード390は、ページの昇順において配置される。
ステップ415において、ブロックアレイ355のレコード360は、シーケンスフィールド365において格納される値に基づいて、ソートされる。この動作は、時間順に(すなわち、対応するトランザクションがファイルシステムのファイルに適用される順)、トランザクションリストテーブル385のレコード390を配置するために実行され得る。
ファイルシステムのトランザクションレコードに対応するファイルノード情報を格納する一時ファイル440は、次いで、ブロックアレイ355のソートされたレコードおよびトランザクションリストテーブル385を用いて、RAM35において生成され得る。このため、ファイルシステムのルートディレクトリに対応する基本的なレコードは、最初に、一時ファイル440に追加され得る。一時ファイル440におけるルートディレクトリノードを生成するために使用される情報は、メタファイル120に格納されたルートディレクトリファイルに対応するレコードから得られ得る。
一時ファイル440においてファイルノードレコードを配置する一方法の論理表現は、全体が図10の参照番号445として、示される。この例において、それぞれのファイルノードレコード450は、ファイルノードフィールド455および開始フィールド460を含む。ファイルノードフィールド455のコンテンツは、トランザクションリストテーブル385の様々なトランザクションレコード390がリンクされ得るファイルノードを識別するために使用され得る。明瞭さのために、ファイルノードフィールド455のコンテンツは、メタファイル120の、対応するレコードエントリ125にアクセスするために使用されるファイル識別子と同じフォーマットを有し得る。開始フィールド460のコンテンツは、ファイルノードフィールド455において識別されたファイルに対応するトランザクションリストテーブル385における第1のトランザクションレコード390のロケーションを識別するために使用され得る。従って、それぞれのファイルノードレコード450は、ファイルシステム内のファイル、および識別されたファイルに関連する第1のトランザクションのロケーションを識別する。
ステップ420において、ブロックアレイ355およびトランザクションリストテーブル385のそれぞれのソートされたレコード360および390は、ファイル識別子/idxフィールド410に格納されたファイル識別子に対応するファイルノードレコード450を、一時ファイル440が含むかどうかを決定するために移動させる(traverse)。トランザクションレコード390と同じファイル識別子を有するファイルノードレコード450が一時ファイル440に見出されない場合、新しいファイルノードレコード450は、ステップ430において作成され得る。いったんトランザクションリストレコード390に対応するファイルノードレコード450が一時ファイル440において存在すると、トランザクションリストレコード390は、ファイルノードレコード450に対するトランザクションのリストにリンクされ得る。この例において、トランザクションリストレコード390は、図8のステップ435におけるファイルノードレコード450に対するトランザクションのリストにリンクされ得る。トランザクションリストレコード390がファイルノードに対するトランザクションのリストにリンクされ得る方法は、そのトランザクションリストレコード390が、ファイルノードの第1のトランザクションリストレコードであり得るか、または、ファイルノードに対する、その後のトランザクションリストレコードであり得るかに依存し得る。それがファイルノードの第1のトランザクションリストレコードである場合、ファイルノードレコード450の開始フィールド460は、この第1のトランザクションリストレコード390の開始ロケーションを識別するように更新され得る。従って、ファイルノードレコード450の開始フィールド460のコンテンツは、トランザクションリストテーブル385におけるロケーションに向かうために使用され得、トランザクションリストテーブル385は、そのファイルに適用された第1のトランザクションに対するエクステント情報を含む。ファイル識別子/idxフィールド410の機能は、トランザクションリストレコード390がファイルノードに対する現行のトランザクションリストレコードに追加され得る場合(すなわち、それがファイルノードに対する第1のトランザクションリストレコードではない場合)、変更される。より詳細には、フィールド410の値と機能は、それがファイルノードに関連する最後のトランザクションレコード390に向かうために、変更され得る。これは図10において例示され、そこで、ファイルノードレコード450の開始フィールド460は、トランザクションリストレコード390の開始に向かう。レコード390のファイル識別子/idx410は、次に、トランザクションリストレコード465の開始に向かい、トランザクションリストレコード465は、ファイルノードレコード450によって表されるファイルに対する第2のトランザクションのロケーション上の情報を含む。同様に、ファイルノードレコード470の開始フィールド460は、トランザクションリストレコード475の開始に向かう。トランザクションリストレコード475のファイル識別子/idxフィールド410は、トランザクションリストレコード480の開始に向かい、トランザクションリストレコード480は、ファイルノードレコード470によって表されるファイルに対する第2のトランザクションのロケーションに関する情報を含む。
いったん、トランザクションリストテーブル385のトランザクションリストレコードの全てが、対応するファイルノードレコードと適切な方法にてリンクされると、それぞれのファイルノードに対するトランザクションリストレコードがステップ485に移動し、未遂および/または誤ったファイルトランザクションを参照とする任意のトランザクションリストレコードを取り除く。そのようなトランザクションリストレコードの除外は、様々な異なる方法において達成され得る。例えば、ファイルシステムソフトウェア47は、それがなされたかどうかを決定するために、最後に生じたトランザクションの状態フィールドをチェックし得る。そのトランザクションがなされていた場合、トランザクションリストテーブル385における対応するレコードは、分配されないままであり得る。しかしながら、トランザクションが未遂である場合、トランザクションリストテーブル385における対応するレコードは、取り除かれ得るか、さもなければ、無視され得る。
トランザクション遂行の検査のこのタイプを促進するために、ファイルシステムソフトウェア47は、最後に生じたトランザクションがなされたことを確認する必要があるのみである。他の全てのレコードの遂行検査はスキップされ得る。というのも、最後に生じたトランザクションのみは、停電、不正なシステムのシャットダウンなどの影響を受けるからである。他の全てのレコードの遂行検査をスキップすることによって、システムのスタートアップに必要とされる時間は、大幅に低減され得る。
直線的なシーケンスの一部として示されているが、ステップ485は、それぞれのトランザクションリストレコードがその対応するファイルノードを組み入れるために処理され得るように、実行され得る。例えば、ファイルシステムソフトウェア47は、そのトランザクションがなされたかどうかを決定するために、それぞれのトランザクションレコードのヘッダに含まれる状態情報をチェックし得る。このチェックは、それぞれのトランザクションレコードが、対応するトランザクションリストレコードを配置するために使用され得る場合に、生じ得る。いったんファイルシステムソフトウェア47が未遂のトランザクションを見出す場合、図8のステップ420〜ステップ485におけるトランザクションリストテーブル385のさらなる処理は必要とされない。
ステップ490において、それぞれのファイルノードに対するエクステントプール340においてエントリが生成される。これが達成され得る一つの方法は、図11において示される。この例において、それぞれのファイルノードの開始フィールド460のコンテンツは、それがここでエクステントインデックスフィールド487として動作するように、変化され得る。エクステントインデックスフィールド487は、ファイルの第1のトランザクションに対するトランザクションデータのロケーションの情報を含むエクステントプール340における第1のロケーションに向かう。それぞれのエクステントレコード490は、クラスタ数フィールド495、開始クラスタフィールド500、および次のエクステントフィールド505を含み得る。開始クラスタフィールド500は、デバイス270における開始ロケーションを識別し、そこで、ファイルノードに対応するファイルの第1のファイルトランザクションが格納され得る。クラスタ数フィールド495は、どれくらい多くの隣接するデバイス270のクラスタがファイルトランザクションを格納するために使用されるかを識別する。次のエクステントフィールド505は、ファイルノードによって表されるファイルに対する次のエクステントレコードのエクステントインデックスを識別する。この例において、エクステントインデックス487はエクステントレコード510に向かい、その一方で、エクステントレコード510の次のエクステントフィールド505は、エクステントレコード515に向かう。
エクステントプール340のレコードを配置するために使用されるデータは、トランザクションリストテーブル385において格納されるデータから、少なくとも一部、引き出され得る。ここで示される例において、エクステントプール340は、トランザクションリストテーブル385のさらにコンパクトな形式であり得る。このため、ファイルシステムソフトウェア47は、トランザクションリストレコードが同一のファイルノードの一部である場合、隣接したデータを有するトランザクションリストレコードを単一のエクステントレコードエントリに組み合わせ得る。同様に、RAM35におけるブロックアレイ355を維持するさらなる必要は存在しない。それゆえ、ブロックアレイ355は、RAM35から取り除かれ得る。
トランザクションファイル220におけるトランザクションの保全性は、エクステントプール340を生成するために使用される様々なステップの実行の間、チェックされ得る。例えば、トランザクションレコードの保全性チェックは、図8のステップ350またはステップ380の間に実行され得る。通常のデータチェックは、CRCおよびECC技術を含む。
コンピュータシステム10のスタートアップ時間を低減するために、エラーチェック技術は、所定のトランザクションのヘッダに含まれる情報に制限され得る。トランザクションが図8において示されるスタートアッププロセスの間に見出される場合、ファイルシステムソフトウェア47は、トランザクションが、メタファイル120におけるディレクトリ構造情報などのファイルデータまたはメタデータに影響を与えるかどうかを識別し得る。この区別は、トランザクションに関連するファイル識別子に基づき得る。通常、メタデータは、よく知られるファイル識別子によって表され、ファイルシステムソフトウェア47にハードコードされる(例えば、それらは、メタファイル120を、トランザクションの主題(subject)であるファイルとして識別する)。メタデータのみが、ファイルシステムがスタートアップ後にコンシステントな状態にあることを確認するために要求されるゆえ、トランザクションのデータ部分のデータチェック技術は、トランザクションがそのようなメタデータに関連する場合のみ、実行される。トランザクションがメタデータの変化に関連しない場合、データチェック技術は、最初にヘッダ情報のチェックのみに限定され得る。図6に示されるトランザクションレコードフォーマットにおいて、システムスタートアップにおいて確認されなければならない主ヘッダ情報は、それぞれのトランザクションレコード310の第1のスペア領域300において格納され得る。これにより、ファイルシステムソフトウェア47は、それぞれのトランザクションレコード310の第2のスペア領域に含まれるヘッダ情報の認証をスキップすることができ、それによって、スタートアップシーケンスをさらに最適化することができる。以下でさらに詳細に説明するように、それぞれのトランザクションのデータ部分のエラーチェックは、対応するファイルが、スタートアップシーケンスの完了後に、ファイルシステムソフトウェア47によって最初にアクセスされ得るまで、延期され得る。
トランザクションレコードの任意のスタートアップ認証は、一連の順序だったトランザクションの第1のトランザクションヘッダのみに、エラーチェックを制限することによってさらに最適化され得る。トランザクションファイル220のスタートアップスキャンの間、トランザクションヘッダが見出され、同一のファイルに対する多数の順序だったトランザクションレコードが後に続く場合、その順序における後続のトランザクションのヘッダの認証は、いったんシーケンスの第1のトランザクションレコードに対するヘッダが承認されると、スキップされ得る。ヘッダ情報のスキャンおよび認証は、次いで、後続のトランザクションの最後に続く次のブロックを回復し得る。
RAM35において、再構成されるファイルシステム330を生成することにおける次の広いステップは、再生成されたファイル階層335の構成であり得る。この例において、再生成されたファイル階層335は、ファイルおよびディレクトリノードレコードの両方からなり得る。ディレクトリノードレコードに対する例示的なフォーマットは、全体が、図12の参照番号520に示され、一方、ファイルノードレコードに対する、対応する例示的なフォーマットは、全体が、図13の参照番号525に示される。
ディレクトリノードレコード520は、ファイルシステムソフトウェア47によって使用される多数の異なるフィールドを含む。より詳細には、ディレクトリノードレコード520は、兄弟フィールド530、ファイル識別子フィールド535、親識別子フィールド540、子フィールド545、およびディレクトリ名フィールド550を含み得る。同様に、図13のファイルノードレコードは、ファイルシステムソフトウェア47によって使用される多数の異なるフィールドを含む。ファイルノードレコードフィールドは、兄弟フィールド555、ファイル識別子フィールド560、エクステントインデックスフィールド565、および名前要約フィールド570を含み得る。
メタファイル120のレコードにおいて含まれるデータが、再生成されたファイル階層335の構成において使用され得るゆえ、メタファイルレコードがメタファイル120に配置される方法は、システムスタートアップの性能に影響を与える。このため、メタファイル120のレコードは、同じ長さを有する隣接したレコードとして、単一のメタファイルに配置され、同一の記憶装置媒体に全て格納される。この配置は、ファイルシステムソフトウェア47がメタファイルにアクセスし得るスピードを向上させ、そのアクセスに必要とされる処理の量を低減させる。
再生成されたファイル階層335のそれぞれのファイルノードレコード525およびディレクトリノードレコード520に対するフィールドを配置するために使用され得る一連のステップは、図14に示される。例示されたシーケンスは、メタファイル120においてそれぞれのレコードに対して実行され得、ステップ575において開始され得る。ステップ575において、ファイル識別子は、メタファイル120内における第1のレコードエントリのオフセットに基づいて、生成され得る。再生成されたファイル階層335のチェックは、ステップ580において、ファイル識別子に対応するファイルノードレコード525またはディレクトリノードレコード520が既に存在するかどうかを決定するために、なされ得る。対応するノードレコード520または525が存在しない場合、新しいレコードファイルが、再生成されたファイル階層335において作成され得る。新しく作成されたレコードのフォーマットは、ファイル識別子が、メタファイル120におけるファイルエントリまたはディレクトリエントリに対応するかどうかに依存する。ファイルシステムソフトウェア47は、この決定をし、適切なレコードフォーマット520または525を適用する。
ステップ585において、新しく作成されたレコードに対するフィールドが、メタファイル120において見出されるファイル/ディレクトリに対する属性を使用し、配置される。新しく作成されたレコードが、ディレクトリノードに対応する場合、親識別子フィールド540およびディレクトリ名フィールド550は、メタファイル120における対応するレコードの親ファイル識別子および短い名前フィールドにおけるデータを使用して、配置される。新しく作成されたレコードがファイルノードに対応する場合、名前要約フィールド570は、メタファイル120における対応するレコードのファイル名データに直接格納されるか、またはそこから引き出されるデータを使用して、配置され得る。エクステントインデックスフィールド565は、対応するファイルノードレコード450のエクステントインデックスフィールド487に見出されるデータを使用して、配置され得る(図11を参照)。
新しく作成されたファイルがディレクトリノードに対応する場合、再生成されたファイル階層335を介した検索が、親ノードが存在するかどうかを決定するために、ステップ590において試みられ得る。親ノードが存在しない場合、親ノードに対応するディレクトリレコードは、再生成されたファイル階層335に追加され得る。
ステップ595において、新しく生成されたファイル/ディレクトリレコードは、親ディレクトリノードに対する樹形構造にリンクされ得る。新しく生成されたファイル/ディレクトリレコードの子フィールド545が、親ディレクトリが子を有さないことを示す場合、親ディレクトリレコードの子フィールド545の値は、新しく生成されたファイル/ディレクトリレコードに向かうように設定され得、その新しく生成されたファイル/ディレクトリレコードの兄弟フィールド555または530は、新しく生成されたファイル/ディレクトリレコードが兄弟を有さないことを示すように設定され得る。親ノードレコードの子フィールド545が、親ディレクトリノードが子を有さないことを示す場合、新しく生成されたファイル/ディレクトリレコードの兄弟フィールド565または530は、親ディレクトリの現行の子に向かうように設定され得、親ディレクトリの子フィールド545は、新しく生成されたファイル/ディレクトリレコードに向かうように設定され得る。新しく生成されたファイル/ディレクトリレコードがディレクトリノードに対応する場合、新しく生成されたディレクトリレコードの親識別子フィールド540は、親ディレクトリノードに向かうように設定され得る。
ステップ600において、ファイルシステムソフトウェア47は、再帰的に、親ノードを上り、新しく生成されたファイル/ディレクトリレコードの親ディレクトリから開始され、ルートノードが到達されるまで、一連の処理ステップを実行する。この点において、新しく生成されたファイル/ディレクトリレコードの親ディレクトリノードは、カレントディレクトリノードとして呼ばれ得る。図14において示される例示的なプロセスにおいて、ファイルシステムソフトウェア47は、カレントディレクトリの親ノードに対応するディレクトリノードレコードが存在するかどうかを決定するために、再生成されたファイル階層335をチェックする。このプロセスは、ステップ605およびステップ610において実行され得る。そのようなディレクトリレコードが再生成されたファイル階層335に存在しない場合、新しいディレクトリレコードがステップ615において生成され得る。新しく生成されたディレクトリレコードの子フィールド545は、次いで、新しいディレクトリレコードの子のみとして、カレントディレクトリノードレコードに向かうように設定され得る。ステップ620において、カレントディレクトリノードレコードの親識別子フィールド540は、新しく生成されたディレクトリレコードに向かうように設定され得る。カレントディレクトリノードレコードの兄弟フィールド530は、ステップ625において、カレントディレクトリノードレコードに対する兄弟が存在しないことを示すように設定され得る。
ステップ605およびステップ610において実行されたチェックが、カレントディレクトリの親ノードに対応する、再生成されたファイル階層335におけるディレクトリレコードが存在することを示す場合、次いで、カレントディレクトリノードは、ステップ630において、親ディレクトリノードの生成された樹形構造にリンクされ得る。このため、カレントノードの親識別子フィールド540は、再生成されたファイル階層335における親ノードレコードのロケーションに向かうように設定され得る。カレントディレクトリノードの兄弟フィールド530は、親ノードレコードの子フィールド545によって向かわれるのと同じレコードに向かうように設定され得る。最後に、親ディレクトリノードの子フィールド545は、カレントディレクトリノードのロケーションに向かうように設定され得る。
ステップ635において、ファイルシステムソフトウェア47は、再帰的なディレクトリ処理が完了したかどうかを決定するためにチェックする。この例において、再帰的なディレクトリ処理は、その処理がルートノードを送信するときに、完了し、そのルートノードは、独自かつ認識可能なファイル識別子である。ルートノードがステップ635において到達される場合、メタファイル120における次のファイルレコードエントリは、ステップ640において開始され得、処理の制御はステップ575に戻る。ルートノードがステップ635において、到達しない場合、次いで、斜上型のファイル/ディレクトリ階層における次の親ノードの処理は、ステップ605において、始めから繰り返され得る。
図15は、再構成されたファイルシステム330の論理表示であり、図2において示されたファイル階層を有するファイルシステムに対して、図8および図14の処理ステップを適用することに対応する。この例示的な表示において、線665、670、675、および680は、それぞれ、ディレクトリ105、100、80、および85を表すディレクトリノードレコードに対する、親識別子フィールド540のコンテンツに対応するポインタを表す。線645、650、660、および652は、それぞれ、ディレクトリ110、100、105、80および85を表す、ディレクトリノードレコードに対する、子識別子フィールド545のコンテンツに対応するポインタを表す。線685、690、695、および705は、それぞれ、ディレクトリ100、105、および80に対応するディレクトリノードレコードに対する兄弟識別子フィールド530のコンテンツに対応するポインタを表す。線700、705、710、および715は、それぞれ、ファイル90、55、60、および70に対応するファイルノードレコードに対する兄弟識別子フィールド555のコンテンツに対応するポインタを表す。
再構成されたファイルシステム330を使用した固定記憶装置ユニット30のトランザクションファイル220におけるデータにアクセスする一方法はまた、図15に示される。示されるように、ファイルシステムソフトウェア47は、ソフトウェアがアクセスするファイルノードレコードに対して、ファイル識別子730を提供する。この例において、ファイル識別子730は、ファイル55を表すファイルノードレコードに向かう。ファイルシステムソフトウェア47は、次いで、トランザクションファイル220におけるファイルに対するデータを配置するために、エクステントプール340へのインデックスとして、ファイルノードレコードのエクステントインデックス565のコンテンツを使用する。しかしながら、ファイルシステムソフトウェア47は、図15において示されるものとは異なる様々な異なる方法において、再構成されたファイルシステム330のコンテンツを使用し得る、ということは理解される。
上記したように、ファイルの保全の完全な認証は、スタートアップ処理が促進され得るために、スタートアップの間は実行されない。その代わり、ファイルシステムソフトウェア47は、ファイルがアクセスされ得る最初の時間まで、ファイルの完全な認証を延期し得る。このため、ファイルシステムソフトウェア47は、それぞれのファイルの保全が完全に認証されているかどうかを示すテーブルを維持し得る。あるいは、ファイルシステムソフトウェア47は、ファイルの保全が完全に認証されたかどうかを示すために、再生成されたファイル階層335におけるそれぞれのファイルノードレコードの一つ以上のビットを使用し得る。このインジケータは、ファイルがスタートアップ後にアクセスされ得る、少なくとも最初の時間に、ファイルシステムソフトウェア47によってチェックされ得る。インジケータが、ファイルが完全に認証されていないことを表す場合、ファイルの完全な認証は、その時点において実行され得る。あるいは、ファイルのトランザクションのヘッダが既にチェックされているゆえ、ファイルシステムソフトウェアは、ファイルに対するそれぞれのトランザクションのデータ部分の保全を認証する必要があるのみである。認証プロセスは、一つ以上のCRCプロセス、一つ以上のECCプロセスなどを含み得る。
図5、図6、および図7に示されるように、それぞれのトランザクションレコードヘッダにおける多数の異なるフィールドが、トランザクションレコード全体の保全を認証することに専念され得る。保全性のチェックが失敗し、適切なエラー修正コードを使用するアプリケーションがエラーを修正できない場合、次いで、プログラムエラーは、ファイルコンテンツへのアクセスの要求をしたアプリケーションまたはシステムに報告され得る。
本発明の様々な実施形態が記載されているが、さらに多くの実施形態およびインプレメンテーションが本発明の範囲内にて可能であることは当業者にとって明らかである。従って、本発明は、添付された請求の範囲およびそれらの均等物の観点を除いて、限定されない。
フラッシュ様媒体を使用したトランザクションベースのファイルシステムをインプリメントし得るコンピュータシステムのブロック図である。 トランザクションベースのファイルシステムにおいてインプリメントされ得るファイルおよびディレクトリの配置の一例を示す樹形図である。 メタファイルのレコードが図2において示されるファイルシステム構造をインプリメントするように配置され得る一方法を示すブロック図である。 トランザクションベースのファイルシステムのトランザクションファイルにおいて、トランザクションレコードを論理的に配置する一方法を示す。 フラッシュメディアデバイスの一タイプにおけるメモリの物理的配置を示す。 トランザクションレコードが、トランザクションベースのファイルシステムにおいて使用されるフラッシュメディアデバイスに配置され得る方法を示す。 トランザクションレコードが、トランザクションベースのファイルシステムにおいて使用されるフラッシュメディアデバイスに配置され得る方法を示す。 スタートアップの間に、コンピュータシステムによって作成される再構成されたファイルシステムにおいて用いられる、エクステントプールを生成するために使用され得る、相互に関連した多数の処理ステップを示す。 図8において示された処理ステップにおいて使用される様々なレコードタイプに対する例示的なフォーマットに関する。 図8において示された処理ステップにおいて使用される様々なレコードタイプに対する例示的なフォーマットに関する。 図8において示された処理ステップにおいて使用される様々なレコードタイプに対する例示的なフォーマットに関する。 再構成されたファイルシステムにおいて使用される再生成されたファイル階層のディレクトリノードレコードに対する例示的なフォーマットに関する。 再構成されたファイルシステムにおいて使用される再生成されたファイル階層のファイルノードレコードに対する例示的なフォーマットに関する。 再構成されたファイルシステムにおいて使用される再生成されたファイル階層を構成するために使用され得る相互に関連した多数の処理ステップを示す。 図2に示される例示的なファイルおよびディレクトリ配置に適用されるように、図8〜図14に関連して説明される方法において生成される再構成されたファイルシステムの論理表示である。
符号の説明
10 コンピュータシステム
15 プロセッサ
30 固定記憶装置ユニット
35 ランダムアクセスメモリ
47 ファイルシステムソフトウェア
220 トランザクションファイル
225 トランザクションレコード
230 論理ヘッダセクション
235 論理データセクション
290 ページ
295 データ領域
300 スペア領域

Claims (29)

  1. プロセッサと、
    該プロセッサによってアクセス可能な固定データ記憶装置であって、該固定データ記憶装置はフラッシュ様記憶装置媒体を含み、該フラッシュ様記憶装置媒体は、複数の隣接するメモリブロックを含み、該複数の隣接するメモリブロックのそれぞれが複数の隣接するメモリページを含み、該複数の隣接するメモリページのそれぞれがデータメモリ領域およびスペアメモリ領域を含む、固定データ記憶装置と、
    該固定データ記憶装置上に格納されたファイルデータおよびファイルのファイルシステム構造を管理するための、該プロセッサによって実行可能であるファイルシステムソフトウェアと、
    該ファイルシステムソフトウェアによって、該フラッシュ様媒体において維持されるトランザクションファイルと
    を備える、コンピュータシステムであって、
    該トランザクションファイルは、複数のトランザクションレコードを含み、それぞれのトランザクションレコードは、論理ヘッダセクションおよび論理データセクションを含み、
    それぞれのトランザクションレコードの該論理ヘッダセクションは、同一のブロック内において、二つ以上の隣接するメモリページのスペアメモリ領域に対応し、それぞれのトランザクションレコードの該論理データセクションは、二つ以上の隣接するメモリページのデータメモリ領域に対応する、
    コンピュータシステム。
  2. プロセッサと、
    該プロセッサによってアクセス可能な固定データ記憶装置であって、該固定データ記憶装置はフラッシュ様記憶装置媒体を含み、該フラッシュ様記憶装置媒体は、複数の隣接するメモリブロックを含み、該複数の隣接するメモリブロックのそれぞれが複数の隣接するメモリページを含み、該複数の隣接するメモリページのそれぞれがデータメモリ領域およびスペアメモリ領域を含む、固定データ記憶装置と、
    該固定データ記憶装置上に格納されたファイルデータおよびファイルのファイルシステム構造を管理するための、該プロセッサによって実行可能であるファイルシステムソフトウェアと、
    該ファイルシステムソフトウェアによって、該フラッシュ様媒体において維持されるトランザクションファイルと
    を備える、コンピュータシステムであって、
    該トランザクションファイルは、複数のトランザクションレコードを含み、それぞれのトランザクションレコードは、論理ヘッダセクションおよび論理データセクションを含み、
    それぞれのトランザクションレコードの該論理ヘッダセクションは、第1のメモリページのスペアメモリ領域および第2のメモリページのスペアメモリ領域に対応し、該第1および第2のメモリページは、同一のメモリブロック内において隣接し、
    それぞれのトランザクションレコードの該論理データセクションは、該第1および第2のメモリページのデータメモリ領域に対応する、
    コンピュータシステム。
  3. それぞれのトランザクションレコードの前記論理ヘッダセクションが、トランザクション識別フィールドを含み、該トランザクション識別フィールドは、ファイルに関連する一つ以上のトランザクションレコードの時間順の順序を容易にする、請求項1に記載のコンピュータシステム。
  4. 前記トランザクション識別フィールドが、前記ファイルシステムソフトウェアによって割り当てられた、単調に増加するトランザクション識別子を含む、請求項3に記載のコンピュータシステム。
  5. 前記ファイルシステムソフトウェアが、ブロック内におけるトランザクションレコードのオフセットに基づいて、固定データ記憶装置の同一のブロック内に格納されたトランザクションレコードに対する時間順の情報を引き出す、請求項1に記載のコンピュータシステム。
  6. それぞれのトランザクションレコードの前記論理ヘッダセクションは、該個々のトランザクションレコードに対応する前記トランザクションがなされるかどうかを決定するために、前記ファイルシステムソフトウェアによってアクセス可能であるトランザクション状態フィールドを含む、請求項1に記載のコンピュータシステム。
  7. それぞれのトランザクションレコードの前記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックの状態を示すメモリ状態フィールドを含む、請求項1に記載のコンピュータシステム。
  8. それぞれのトランザクションレコードの前記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックが消去された状態にあるかどうかを示すメモリ状態フィールドを含む、請求項1に記載のコンピュータシステム。
  9. 前記ファイルシステムソフトウェアによってアクセス可能であるメタファイルをさらに含む、請求項1に記載のコンピュータシステム。
  10. 前記メタファイルが多数のメタファイルレコードを含み、該メタファイルレコードのそれぞれが、ファイル識別フィールドを含む、請求項9に記載のコンピュータシステム。
  11. それぞれのトランザクションレコードの前記論理ヘッダセクションが、ファイル識別フィールドを含む、請求項10に記載のコンピュータシステム。
  12. 前記論理ヘッダセクションの前記ファイル識別フィールドが、前記メタファイルの該ファイル識別フィールドに対応する、請求項11に記載のコンピュータシステム。
  13. 前記フラッシュ様媒体は、NORフラッシュメモリおよびNANDフラッシュメモリからなる群から選択されたフラッシュメモリを含む、請求項1に記載のコンピュータシステム。
  14. 前記プロセッサによってアクセス可能なランダムアクセスメモリに格納された、再構成されたファイルシステムをさらに含む、請求項1に記載のコンピュータシステム。
  15. 前記再構成されたファイルシステムが、逆階層方法において、ファイルおよびディレクトリを組織する、請求項14に記載のコンピュータシステム。
  16. それぞれのトランザクションレコードの前記論理ヘッダセクションが、トランザクション識別フィールドを含み、該トランザクション識別フィールドは、ファイルに関連する一つ以上のトランザクションレコードの時間順の順序を容易にする、請求項2に記載のコンピュータシステム。
  17. 前記トランザクション識別フィールドが、前記ファイルシステムソフトウェアによって割り当てられた、単調に増加するトランザクション識別子を含む、請求項16に記載のコンピュータシステム。
  18. 前記ファイルシステムソフトウェアが、ブロック内におけるトランザクションレコードのオフセットに基づいて、固定データ記憶装置の同一のブロック内に格納されたトランザクションレコードに対する時間順の情報を引き出す、請求項2に記載のコンピュータシステム。
  19. それぞれのトランザクションレコードの前記論理ヘッダセクションは、該個々のトランザクションレコードに対応する前記トランザクションがなされるかどうかを決定するために、前記ファイルシステムソフトウェアによってアクセス可能であるトランザクション状態フィールドを含む、請求項2に記載のコンピュータシステム。
  20. それぞれのトランザクションレコードの前記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックの状態を示すメモリ状態フィールドを含む、請求項2に記載のコンピュータシステム。
  21. それぞれのトランザクションレコードの前記論理ヘッダセクションは、該個々のトランザクションレコードが格納されるメモリブロックが消去された状態にあるかどうかを示すメモリ状態フィールドを含む、請求項2に記載のコンピュータシステム。
  22. 前記ファイルシステムソフトウェアによってアクセス可能であるメタファイルをさらに含む、請求項2に記載のコンピュータシステム。
  23. 前記メタファイルが多数のメタファイルレコードを含み、該メタファイルレコードのそれぞれが、ファイル識別フィールドを含む、請求項22に記載のコンピュータシステム。
  24. それぞれのトランザクションレコードの前記論理ヘッダセクションが、ファイル識別フィールドを含む、請求項23に記載のコンピュータシステム。
  25. 前記論理ヘッダセクションの前記ファイル識別フィールドが、前記メタファイルの該ファイル識別フィールドに対応する、請求項24に記載のコンピュータシステム。
  26. 前記ファイルのファイルシステム構造が、ファイルおよびディレクトリの階層構造を含む、請求項2に記載のコンピュータシステム。
  27. 前記フラッシュ様媒体は、NORフラッシュメモリおよびNANDフラッシュメモリからなる群から選択されたフラッシュメモリを含む、請求項2に記載のコンピュータシステム。
  28. 前記プロセッサによってアクセス可能なランダムアクセスメモリに格納された、再構成されたファイルシステムをさらに含む、請求項2に記載のコンピュータシステム。
  29. 前記再構成されたファイルシステムが、逆階層方法において、ファイルおよびディレクトリを組織する、請求項28に記載のコンピュータシステム。
JP2006173213A 2005-07-01 2006-06-22 フラッシュ様媒体におけるトランザクションレコードを格納するファイルシステム Withdrawn JP2007012058A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/173,994 US20070005874A1 (en) 2005-07-01 2005-07-01 File system storing transaction records in flash-like media

Publications (1)

Publication Number Publication Date
JP2007012058A true JP2007012058A (ja) 2007-01-18

Family

ID=37074952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006173213A Withdrawn JP2007012058A (ja) 2005-07-01 2006-06-22 フラッシュ様媒体におけるトランザクションレコードを格納するファイルシステム

Country Status (6)

Country Link
US (1) US20070005874A1 (ja)
EP (1) EP1739535B1 (ja)
JP (1) JP2007012058A (ja)
KR (1) KR20070003579A (ja)
CN (1) CN1983266B (ja)
CA (1) CA2549917C (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1712985A1 (en) * 2005-04-15 2006-10-18 Deutsche Thomson-Brandt Gmbh Method and system for storing logical data blocks into flash-blocks in multiple non-volatile memories which are connected to at least one common data I/O bus
US8959125B2 (en) * 2005-07-01 2015-02-17 226008 Ontario Inc. File system having inverted hierarchical structure
US7698495B2 (en) 2005-07-01 2010-04-13 QNZ Software Systems GmbH & Co. KG Computer system having logically ordered cache management
US7707480B2 (en) 2005-07-01 2010-04-27 Qnx Software Systems Gmbh & Co. Kg System employing data verification operations of differing computational costs
US7809777B2 (en) * 2005-07-01 2010-10-05 Qnx Software Systems Gmbh & Co. Kg File system having deferred verification of data integrity
US7970803B2 (en) * 2005-07-01 2011-06-28 Qnx Software Systems Gmbh & Co. Kg Optimized startup verification of file system integrity
US7873683B2 (en) * 2005-07-01 2011-01-18 Qnx Software Systems Gmbh & Co. Kg File system having transaction record coalescing
US8286159B2 (en) * 2005-12-22 2012-10-09 Alan Joshua Shapiro Method and apparatus for gryphing a data storage medium
US7908276B2 (en) 2006-08-25 2011-03-15 Qnx Software Systems Gmbh & Co. Kg Filesystem having a filename cache
US20080059510A1 (en) * 2006-08-31 2008-03-06 Daniel Cardamore Multimedia system framework having layer consolidating access to multiple media devices
US7599972B2 (en) 2006-08-25 2009-10-06 Qnx Software Systems Gmbh & Co. Kg File system having variable logical storage block size
US20080147747A1 (en) * 2006-12-14 2008-06-19 Dan Cardamore Media system having synchronization with preemptive prioritization of synchronization order
KR101433859B1 (ko) * 2007-10-12 2014-08-27 삼성전자주식회사 불휘발성 메모리 시스템 및 그것의 파일 데이터 관리 방법
US9542431B2 (en) * 2008-10-24 2017-01-10 Microsoft Technology Licensing, Llc Cyclic commit transaction protocol
US8386731B2 (en) * 2009-09-14 2013-02-26 Vmware, Inc. Method and system for optimizing live migration of persistent data of virtual machine using disk I/O heuristics
JP2011203977A (ja) * 2010-03-25 2011-10-13 Hitachi-Lg Data Storage Inc ストレージ装置、及びストレージ装置におけるファイルシステムの生成方法
US9053032B2 (en) 2010-05-05 2015-06-09 Microsoft Technology Licensing, Llc Fast and low-RAM-footprint indexing for data deduplication
US20110276744A1 (en) 2010-05-05 2011-11-10 Microsoft Corporation Flash memory cache including for use with persistent key-value store
US8935487B2 (en) 2010-05-05 2015-01-13 Microsoft Corporation Fast and low-RAM-footprint indexing for data deduplication
CN103124959A (zh) * 2010-05-19 2013-05-29 凯姆莱西·甘地 数据对象的组合
US9208472B2 (en) 2010-12-11 2015-12-08 Microsoft Technology Licensing, Llc Addition of plan-generation models and expertise by crowd contributors
US9110936B2 (en) 2010-12-28 2015-08-18 Microsoft Technology Licensing, Llc Using index partitioning and reconciliation for data deduplication
EP2804368A4 (en) * 2012-01-10 2015-09-23 Kyocera Document Solutions Inc IMAGE PROCESSING APPARATUS AND IMAGE FORMING APPARATUS
CN103309899A (zh) * 2012-03-15 2013-09-18 苏州市国贸电子系统工程有限公司 一种数据保护系统文件索引结构、更新及定位方法
US9858408B2 (en) 2015-02-13 2018-01-02 Yoti Holding Limited Digital identity system
US10853592B2 (en) 2015-02-13 2020-12-01 Yoti Holding Limited Digital identity system
US10594484B2 (en) 2015-02-13 2020-03-17 Yoti Holding Limited Digital identity system
US9785764B2 (en) 2015-02-13 2017-10-10 Yoti Ltd Digital identity
US9852285B2 (en) * 2015-02-13 2017-12-26 Yoti Holding Limited Digital identity
US10692085B2 (en) 2015-02-13 2020-06-23 Yoti Holding Limited Secure electronic payment
US9648496B2 (en) 2015-02-13 2017-05-09 Yoti Ltd Authentication of web content
US9740603B2 (en) 2015-08-06 2017-08-22 International Business Machines Corporation Managing content in persistent memory modules when organization of the persistent memory modules changes
CN105607960B (zh) 2015-10-26 2018-12-07 成都华为技术有限公司 文件系统目录树修复方法和装置
US11977456B2 (en) * 2016-11-23 2024-05-07 2236008 Ontario Inc. File system framework
KR102624466B1 (ko) * 2017-01-12 2024-01-15 삼성전자주식회사 다중 대역 안테나를 구비한 전자 장치 및 다중 대역 안테나를 구비한 전자 장치에서 스위칭 방법
CN110019016A (zh) * 2017-12-29 2019-07-16 北京忆恒创源科技有限公司 提供逻辑键的kv存储设备及其方法
CN109685190B (zh) * 2018-12-28 2022-04-12 江苏恒宝智能系统技术有限公司 一种ic卡掉电保护方法及装置
US11068181B2 (en) * 2019-10-17 2021-07-20 EMC IP Holding Company LLC Generating and storing monotonically-increasing generation identifiers
CN111752909B (zh) * 2020-06-11 2023-05-16 厦门网宿有限公司 一种多版本文件的操作方法、系统及装置
US11875062B1 (en) * 2022-06-23 2024-01-16 Western Digital Technologies, Inc. Proactive hardening of data storage system

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5201044A (en) * 1990-04-16 1993-04-06 International Business Machines Corporation Data processing method for file status recovery includes providing a log file of atomic transactions that may span both volatile and non volatile memory
US5369757A (en) * 1991-06-18 1994-11-29 Digital Equipment Corporation Recovery logging in the presence of snapshot files by ordering of buffer pool flushing
US5455944A (en) * 1993-03-16 1995-10-03 International Business Machines Corporation Method for managing logging and locking of page free space information in a transaction processing system
US5974425A (en) * 1996-12-17 1999-10-26 Oracle Corporation Method and apparatus for reapplying changes to a database
US6058400A (en) * 1998-04-28 2000-05-02 Sun Microsystems, Inc. Highly available cluster coherent filesystem
JP2001101044A (ja) * 1999-09-29 2001-04-13 Toshiba Corp トランザクショナルファイル管理方法、トランザクショナルファイルシステム及び複合トランザクショナルファイルシステム
US6606628B1 (en) * 2000-02-14 2003-08-12 Cisco Technology, Inc. File system for nonvolatile memory
US6856993B1 (en) * 2000-03-30 2005-02-15 Microsoft Corporation Transactional file system
JP4164994B2 (ja) * 2000-07-14 2008-10-15 ソニー株式会社 データ記録再生装置及び方法
US6571259B1 (en) * 2000-09-26 2003-05-27 Emc Corporation Preallocation of file system cache blocks in a data storage system
US6775792B2 (en) * 2001-01-29 2004-08-10 Snap Appliance, Inc. Discrete mapping of parity blocks
US7047257B2 (en) * 2001-04-03 2006-05-16 Qnx Software Systems Computer file management system
US7191185B2 (en) * 2001-10-30 2007-03-13 Goldman Sachs & Co. Systems and methods for facilitating access to documents via an entitlement rule
US7533214B2 (en) * 2002-02-27 2009-05-12 Microsoft Corporation Open architecture flash driver
US7139752B2 (en) * 2003-05-30 2006-11-21 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis, and providing multiple document views derived from different document tokenizations
CN100377119C (zh) * 2003-06-20 2008-03-26 深圳市朗科科技有限公司 闪存介质中数据保护方法
US7181463B2 (en) * 2003-10-24 2007-02-20 Microsoft Corporation System and method for managing data using static lists
CN100468367C (zh) * 2003-10-29 2009-03-11 鸿富锦精密工业(深圳)有限公司 固态存储器的安全存储系统及方法
US7707480B2 (en) * 2005-07-01 2010-04-27 Qnx Software Systems Gmbh & Co. Kg System employing data verification operations of differing computational costs
US7873683B2 (en) * 2005-07-01 2011-01-18 Qnx Software Systems Gmbh & Co. Kg File system having transaction record coalescing
US7698495B2 (en) * 2005-07-01 2010-04-13 QNZ Software Systems GmbH & Co. KG Computer system having logically ordered cache management
US7970803B2 (en) * 2005-07-01 2011-06-28 Qnx Software Systems Gmbh & Co. Kg Optimized startup verification of file system integrity
US8959125B2 (en) * 2005-07-01 2015-02-17 226008 Ontario Inc. File system having inverted hierarchical structure
US7809777B2 (en) * 2005-07-01 2010-10-05 Qnx Software Systems Gmbh & Co. Kg File system having deferred verification of data integrity

Also Published As

Publication number Publication date
EP1739535B1 (en) 2013-01-23
CN1983266A (zh) 2007-06-20
CA2549917A1 (en) 2007-01-01
CN1983266B (zh) 2011-05-11
EP1739535A3 (en) 2009-06-03
EP1739535A2 (en) 2007-01-03
US20070005874A1 (en) 2007-01-04
KR20070003579A (ko) 2007-01-05
CA2549917C (en) 2013-08-20

Similar Documents

Publication Publication Date Title
EP1739535B1 (en) File system storing transaction records in flash-like media
US7809777B2 (en) File system having deferred verification of data integrity
US7873683B2 (en) File system having transaction record coalescing
US8667029B2 (en) Optimized startup verification of file system integrity
US8959125B2 (en) File system having inverted hierarchical structure
US8024507B2 (en) Transaction-safe FAT file system improvements
US8156165B2 (en) Transaction-safe FAT files system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090901