JP2005234919A - クラスタメモリファイルシステム - Google Patents
クラスタメモリファイルシステム Download PDFInfo
- Publication number
- JP2005234919A JP2005234919A JP2004043832A JP2004043832A JP2005234919A JP 2005234919 A JP2005234919 A JP 2005234919A JP 2004043832 A JP2004043832 A JP 2004043832A JP 2004043832 A JP2004043832 A JP 2004043832A JP 2005234919 A JP2005234919 A JP 2005234919A
- Authority
- JP
- Japan
- Prior art keywords
- node
- memory
- memory storage
- file
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Memory System (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
クラスタシステムで共有可能な高速で大容量のメモリファイルシステムを提供し、特に大容量の入出力データを扱うアプリケーションプログラムのスループットを向上し、さらに高可用性メモリファイルシステムを提供することでメモリファイルシステムの適用分野を拡大することを目的とする。
【解決手段】
クラスタシステムの複数ノードの主記憶から各々メモリ領域を確保し、それらを連結して一つのグローバルなメモリストレージを構成することで大容量メモリファイルシステムを実現する。また、複数ノードのメモリ領域を利用してミラーリングすることにより、ノード障害やノード間通信の経路障害が発生した場合にアプリケーションを中断することなく続行可能な高可用性を実現する。
【選択図】 図1
Description
上記特許文献2の技術は、物理的な装置を仮想化する点で、磁気ディスクではなくあるノード上のメモリ領域を仮想装置として同様にトランスペアレントなアクセスを実現することはできるが、この場合も前述の特許文献1の技術と同様に1つのノードの物理メモリ容量の制限を受けるものである。
アプリケーションプログラム実行ノード12Dでは、アプリケーションプログラム14Dの入出力要求を受けるクラスタメモリファイルシステム17Dとクライアントドライバであってクラスタメモリファイルシステム17Dからの入出力要求を受けるGMSドライバクライアント15Dが動作する。同様に、アプリケーションプログラム実行ノード12Eでは、アプリケーションプログラム14Eの入出力要求を受けるクラスタメモリファイルシステム17Eとクラスタメモリファイルシステム17Eからの入出力要求を受けるGMSドライバクライアント15Eが動作する。
図2から図6にデータベース19の構造の一実施例を示し、以下に説明する。
12A,12B,12C,12D,12E,12F … ノード、
13A,13B,13C … GMS領域、
14D,14E … アプリケーションプログラム、
15D,15E … GMSドライバクライアント、
16A,16B,16C … GMSドライバサーバ、
17D,17E … クラスタメモリファイルシステム(CMFS)、
18 … 管理デーモン、
19 … データベース、
21 … グローバルメモリストレージ定義データベース、
22 … グローバルメモリストレージ名、
23 … ステータス、
24 … 構成ノード群、
25 … グローバルメモリストレージ容量、
26 … ミラー属性、
27 … 閉塞パス、
31 … クライアント定義データベース、
32 … グローバルメモリストレージ名、
33 … クライアントノード群
41 … ファイル定義データベース、
42 … ファイル名、
43 … グローバルメモリストレージ名、
44 … 所有者ユーザID、
45 … 所有者グループID、
46 … ファイルアクセス権限、
47 … ファイルサイズ、
48 … ファイル終端オフセット、
49 … 増分単位、
4A … オープンモード、
4B … オープンカウンタ、
51 … GMSスペース管理データベース、
52 … グローバルメモリストレージ名、
53 … 開始オフセット、
54 … サイズ、
55 … ノード識別子、
56 … ノード内開始アドレス、
61 … CMFSスペース管理データベース、
62 … ファイル名
63 … エクステント番号、
64 … ファイル内開始オフセット、
65 … エクステントサイズ、
66 … グローバルメモリストレージ内開始オフセット
Claims (11)
- 少なくとも一つのプロセッサおよび主記憶とそれらを制御するオペレーティングシステムが動作するコンピュータをノードとし、複数のノードを高速ネットワークで接続した疎結合型のクラスタメモリファイルシステムは、
少なくとも一つのノードの主記憶からそれぞれ独立してメモリ割り当てる手段と、
複数ノードにまたがるメモリ領域を連結して連続した一つのストレージとして使用可能とするグローバルメモリストレージと、
アプリケーションプログラムに対してファイルシステムインタフェースを介して、グローバルメモリストレージ上にクラスタシステム内の任意のノードからアクセスする手段を有することを特徴とするクラスタメモリファイルシステム。 - 請求項1記載のグローバルメモリストレージは、アプリケーション実行ノードで入出力要求を受け付けるクライアントドライバと、物理的にメモリ領域を保有するノードで実際のメモリ領域に対して入出力データを処理するサーバドライバによってアクセス手段を有し、
クライアントドライバは、アクセス要求のあったグローバルメモリストレージ内のオフセットを物理的なノード位置とノード内のアドレスに変換し、該当ノードのサーバドライバに入出力要求を発行することで、上位のアプリケーションに対して物理的なメモリ位置を仮想化する下位のグローバルメモリストレージドライバを有することを特徴とするクラスタメモリファイルシステム。 - 請求項2記載のグローバルメモリストレージを二つ以上のノードにまたがる主記憶から構成し、個々のノードのメモリ領域をボリュームと見なしてノード間でミラーボリュームを構成し、前記グローバルメモリストレージに対してデータを書き込む場合にクライアントドライバによって前記グローバルメモリストレージを構成する他ノードのメモリ領域に同じデータのコピーを書き込み、前記グローバルメモリストレージを構成するノード及びノード間通信経路の少なくとも一方で障害が発生した場合には、データのコピーを保持するノードに通信経路を切り替えることを特徴とするクラスタメモリファイルシステム。
- 請求項1記載のクラスタメモリファイルシステムにおいて、前記グローバルメモリストレージが少なくともひとつのノード群、各ノードの主記憶から確保するメモリ量、グローバルメモリストレージの属性を含む項目を定義する手段を有し、グローバルメモリストレージを構成するノード、各ノード上に確保された前記グローバルメモリストレージ用メモリ領域アドレス、メモリ領域サイズを含むグローバルメモリストレージの属性情報、およびグローバルメモリストレージ上のクラスタメモリファイルシステムに作成されたファイルのメモリアドレス、ファイルのアクセス権限を含むファイル属性情報を格納するデータベースを外部記憶装置に有することを特徴とするクラスタメモリファイルシステム。
- 請求項4記載のクラスタメモリファイルシステムは、前記データベースを用いて、クラスタシステム内に分散して存在するグローバルメモリストレージおよびクラスタメモリファイルシステム上のファイルを一元管理し、アクセスの整合性を維持し、システム運用管理を支援するための、クラスタシステム内の任意の1つのノードで実行する管理デーモンを有することを特徴とするメモリファイルシステム。
- 請求項5記載のクラスタメモリファイルシステムは、クラスタメモリファイルシステム上のファイルをアプリケーションがオープンしたときに、前記管理デーモンにオープン要求を発行し、オープン要求を受けた管理デーモンは前記データベースからオープン要求を受けたファイルおよびそのファイルが存在するグローバルメモリストレージの管理情報を読み出し、アプリケーション実行ノードに管理情報を送信し、クラスタメモリファイルシステムはグローバルメモリストレージの管理情報をクライアントドライバに登録し、ファイルへの入出力要求時には前記管理情報に基づいて、クライアントドライバが直接ファイルが存在するノードに入出力要求を発行することを特徴とするクラスタメモリファイルシステム。
- 請求項1のクラスタメモリファイルシステムは、さらに、グローバルメモリストレージへのアクセスを許可するクライアントノード群を定義する手段を有し、定義されたノードにのみ前記グローバルメモリストレージへのアクセスを許可することを特徴とするクラスタメモリファイルシステム。
- 少なくとも一つのプロセッサおよび主記憶とそれらを制御するオペレーティングシステムが動作するコンピュータをノードとし、複数のノードを高速ネットワークで接続した疎結合型のクラスタシステムにおいて、
少なくとも一つのノードの主記憶からそれぞれ独立してメモリ割り当て、
複数ノードにまたがるメモリ領域を連結して連続した一つのストレージとして使用可能とするグローバルメモリストレージを構成し、
アプリケーションプログラムに対してファイルシステムインタフェースを介して、グローバルメモリストレージ上にクラスタシステム内の任意のノードからアクセスすることを特徴とするメモリ構成方法。 - 前記グローバルメモリストレージへのアクセスの際に、アクセス要求のあったグローバルメモリストレージ内のオフセットを物理的なノード位置とノード内のアドレスに変換し、該当ノードのサーバドライバに入出力要求を発行することを特徴とする請求項8記載のメモリ構成方法。
- 前記グローバルメモリストレージを二つ以上のノードにまたがる主記憶から構成し、個々のノードのメモリ領域をボリュームと見なしてノード間でミラーボリュームを構成し、前記グローバルメモリストレージに対してデータを書き込む場合にクライアントドライバによって前記グローバルメモリストレージを構成する他ノードのメモリ領域に同じデータのコピーを書き込み、前記グローバルメモリストレージを構成するノード及びノード間通信経路の少なくとも一方で障害が発生した場合には、データのコピーを保持するノードに通信経路を切り替えることを特徴とする請求項9記載のメモリ構成方法。
- アプリケーションを実行するための少なくとも1つの第1のノードと、データの入出力を行なうための少なくとも1つの第2のノードとからなる計算機システムにおいて、
前記第2のノードのメモリを連結してグローバルメモリストレージを構成し、
前記グローバルメモリストレージへの前記第1のノードからアクセス要求を、前記第2のノードを特定し、前記特定された第2のノードのメモリ内のアドレスに変換し、
前記変換された情報に基づいて前記グローバルメモリストレージにアクセスすることを特徴とするメモリ構成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004043832A JP4300133B2 (ja) | 2004-02-20 | 2004-02-20 | クラスタメモリファイルシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004043832A JP4300133B2 (ja) | 2004-02-20 | 2004-02-20 | クラスタメモリファイルシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005234919A true JP2005234919A (ja) | 2005-09-02 |
JP4300133B2 JP4300133B2 (ja) | 2009-07-22 |
Family
ID=35017814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004043832A Expired - Fee Related JP4300133B2 (ja) | 2004-02-20 | 2004-02-20 | クラスタメモリファイルシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4300133B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100766561B1 (ko) | 2006-04-27 | 2007-10-11 | 텔코웨어 주식회사 | 분산 네트워크 환경에서의 이중화 메모리 파일시스템 구현방법 및 시스템 |
JP2009054100A (ja) * | 2007-08-29 | 2009-03-12 | Toshiba Corp | 情報処理装置、および情報処理装置の制御方法 |
EP2621143A1 (en) | 2012-01-27 | 2013-07-31 | Fujitsu Limited | Information processing apparatus, distributed processing system, and distributed processing method |
-
2004
- 2004-02-20 JP JP2004043832A patent/JP4300133B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100766561B1 (ko) | 2006-04-27 | 2007-10-11 | 텔코웨어 주식회사 | 분산 네트워크 환경에서의 이중화 메모리 파일시스템 구현방법 및 시스템 |
JP2009054100A (ja) * | 2007-08-29 | 2009-03-12 | Toshiba Corp | 情報処理装置、および情報処理装置の制御方法 |
EP2621143A1 (en) | 2012-01-27 | 2013-07-31 | Fujitsu Limited | Information processing apparatus, distributed processing system, and distributed processing method |
US9483523B2 (en) | 2012-01-27 | 2016-11-01 | Fujitsu Limited | Information processing apparatus, distributed processing system, and distributed processing method |
Also Published As
Publication number | Publication date |
---|---|
JP4300133B2 (ja) | 2009-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11675746B2 (en) | Virtualized server systems and methods including domain joining techniques | |
US9971823B2 (en) | Dynamic replica failure detection and healing | |
JP5514903B2 (ja) | ファイルレベル階層ストレージ管理システム、方法、及び装置 | |
US10838829B2 (en) | Method and apparatus for loading data from a mirror server and a non-transitory computer readable storage medium | |
JP5007350B2 (ja) | ハードウェアベースのファイルシステムのための装置および方法 | |
US11936731B2 (en) | Traffic priority based creation of a storage volume within a cluster of storage nodes | |
US7627699B1 (en) | System and method for managing I/O access policies in a storage environment employing asymmetric distributed block virtualization | |
WO2014007249A1 (ja) | I/oノード及び複数の計算ノードに備えられたキャッシュメモリの制御方法 | |
WO2021057956A1 (zh) | 镜像文件管理方法、装置及系统、计算机设备、存储介质 | |
WO2018054079A1 (zh) | 一种存储文件的方法、第一虚拟机及名称节点 | |
WO2019148841A1 (zh) | 一种分布式存储系统、数据处理方法和存储节点 | |
JP4748950B2 (ja) | 記憶領域管理方法及びシステム | |
JP4285058B2 (ja) | ネットワーク管理プログラム、管理計算機及び管理方法 | |
JP5504165B2 (ja) | データファイルオブジェクトへのアクセス方法、クライアント装置、プログラム、およびシステム | |
CN107832097B (zh) | 数据加载方法及装置 | |
JP2011232840A (ja) | アクセス制御情報管理方法、計算機システム及びプログラム | |
JP2015114913A (ja) | ストレージ装置、ストレージシステム及びデータ管理プログラム | |
CN106293994A (zh) | 网络文件系统中的虚拟机克隆方法和网络文件系统 | |
JP4300133B2 (ja) | クラスタメモリファイルシステム | |
KR20120063946A (ko) | 대용량 통합 메모리를 위한 메모리 장치 및 이의 메타데이터 관리 방법 | |
JPH07244642A (ja) | 並列処理計算機 | |
US6834281B1 (en) | Method and apparatus to support multi-node direct access to file system data | |
US8850132B1 (en) | Method and system for providing a shared data resource coordinator within a storage virtualizing data processing system | |
US20230026179A1 (en) | Identity-based Access to Volume Objects | |
US20230359383A1 (en) | Fault tolerant reservation state distribution for multi-partition logical volumes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060306 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090414 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090420 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120424 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120424 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140424 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |