JP6501916B2 - ファイルストレージにおけるインデックス付け実施方法及びシステム - Google Patents

ファイルストレージにおけるインデックス付け実施方法及びシステム Download PDF

Info

Publication number
JP6501916B2
JP6501916B2 JP2017562725A JP2017562725A JP6501916B2 JP 6501916 B2 JP6501916 B2 JP 6501916B2 JP 2017562725 A JP2017562725 A JP 2017562725A JP 2017562725 A JP2017562725 A JP 2017562725A JP 6501916 B2 JP6501916 B2 JP 6501916B2
Authority
JP
Japan
Prior art keywords
metadata
file
incremental
index
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017562725A
Other languages
English (en)
Other versions
JP2018516409A (ja
Inventor
ジアン,ウェンハン
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2018516409A publication Critical patent/JP2018516409A/ja
Application granted granted Critical
Publication of JP6501916B2 publication Critical patent/JP6501916B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/134Distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、中国特許出願第201510741056.7、2015年11月4日出願、名称「An indexing implementing method and system in file storage」の利益及び優先権を主張する。前記の出願の全開示は、参照により本願明細書に組み込まれる。
開示は、コンピュータアプリケーション技術分野に関し、より具体的には、ファイルストレージにおけるインデックス付け実施方法及びシステムに関する。
大容量ファイルの記憶は、分散型ストレージクラスタにより実施されることがあり、関連するデータセンタは、この分散型ストレージクラスタにためにインデックスを格納するよう設定され得る。該インデックスは、データセンタにおいて、ファイル読み出し及び書き込みサービスを実施するために使用されることがある。
分散型ストレージクラスタの中の各ファイルの記憶場所は、データセンタ及びインデックス設定により維持され得る。現在、最も一般的なモードは、各ファイルの記憶場所を維持し及びファイル読み出し及び書き込み要求に対する応答を生成するために、データセンタにおいて、ファイル識別(ID)及びその記憶場所を格納することによりインデックスを管理することである。
具体的に、ファイルIDがキーであり、キーと記憶場所との間のマッピング関係がインデックスを用いてセグメントに格納され得ることを前提とする。しかしながら、大容量記憶の要件を階層化するために、セグメントは、比較的大きなキー空間を有し、その結果、単一セグメントが非常に多くのインデックスを格納する場合があり、インデックスに対応する動作性能が有意に低下する場合がある。
本開示の一実施形態は、大容量記憶の要件を満たし、インデックスの操作性能を有意に向上し得る、ファイルストレージにおけるインデックス付け実施方法を提供し得る。
本開示の一実施形態は、大容量記憶の要件を満たし、インデックスの操作性能を有意に向上し得る、ファイルストレージにおけるインデックス付け実施システムを提供し得る
ファイルストレージにおけるインデックス付け実施方法であって、ファイルのインデックス操作要求を得るステップと、増分区間を検索して、前記増分区間が前記ファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定するステップと、前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納するとき、前記増分区間の中のメタデータの前記少なくとも1つのピースに従い、前記インデックス操作要求に対する応答を生成するステップと、前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納しないとき、前記増分区間に対応する全量区間に従い、前記インデックス操作要求を処理するステップと、を有し、メタデータの各々のピースは、前記ファイルに対応するインデックスを有する、方法。
ファイルストレージにおけるインデックス付け実施システムであって、ファイルのインデックス操作要求を得る要求取得モジュールと、増分検索モジュールであって、増分区間を検索し、前記増分区間が前記ファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定し、前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納するとき、増分応答モジュールに通知し、前記増分区間が前記ファイルに対応するメタデータを格納しないとき、全量応答モジュールに通知する、増分検索モジュールと、を有し、前記増分応答モジュールは、前記増分区間の中のメタデータの前記少なくとも1つのピースに従い、前記インデックス操作要求に対する応答を生成し、前記全量応答モジュールは、前記増分区間に対応する全量区間に従い、前記インデックス操作要求を処理し、メタデータの各ピースは、前記ファイルに対応するインデックスを有する、システム。
上述の技術的方式から、任意のファイルのインデックス操作要求に関して、増分区間がファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定するために、増分区間が検索されて良いことが分かる。ファイルに対応するメタデータの少なくとも1つのピースが増分区間から見付かるとき、メタデータは、ファイルに対応するインデックスを含み、インデックス操作要求に対する応答が、増分区間内のメタデータに従い生成されて良い。ファイルに対応するメタデータが増分区間から見付からないとき、インデックス操作要求は、対応する全量区間に従い処理されて良い。大量のファイルの記憶は、増分区間及び対応する全量区間の共同により実施されて良く、データ記憶区間の読み出し及び書き込み性能は向上され、インデックスの操作性能は更に向上され得る。
本開示の種々の実施形態によるサーバの構造を示す図である。 本開示の種々の実施形態によるファイルストレージにおけるインデックス付け実施方法を示すフローチャートである。 本開示の種々の実施形態による増分区間に対応する全量区間について開始されたインデックス操作要求を処理する方法を示すフローチャートである。 本開示の種々の実施形態によるファイルストレージにおけるインデックス付け実施方法を示すフローチャートである。 本開示の種々の実施形態によるインデックス生成要求に従い記憶場所を割り当てる方法を示すフローチャートである。 本開示の種々の実施形態によるファイルストレージにおけるインデックス付け実施方法を示すフローチャートである。 本開示の種々の実施形態によるマージタスクを開始することにより増分区間及び全量区間のマージをトリガする方法を示すフローチャートである。 本開示の種々の実施形態によるメタデータ記憶サービスを示す図である。 本開示の種々の実施形態によるインデックス生成のシーケンス図である。 本開示の種々の実施形態によるインデックス取得を示すシーケンス図である。 本開示の種々の実施形態によるインデックス削除を示すシーケンス図である。 本開示の種々の実施形態によるファイルストレージにおけるインデックス付け実施システムの構造を示す図である。 本開示の種々の実施形態による全量応答モジュールの構造を示す図である。 本開示の種々の実施形態によるファイルストレージにおけるインデックス付け実施システムの構造を示す図である。 本開示の種々の実施形態による位置割り当てモジュールの構造を示す図である。 本開示の種々の実施形態によるファイルストレージにおけるインデックス付け実施システムの構造を示す図である。 本開示の種々の実施形態によるマージモジュールの構造を示す図である。
本開示の特徴及び利点を具現化する実施形態は、以下の説明に詳細に記載される。これは、包括的であること又は本開示を制限することを意図しない。本開示の実施形態は、本開示の範囲から逸脱することなく、多くの方法で変更されて良い。説明及び図面は、本開示を記載するために使用され、本開示を制限するために使用されない。
分散型記憶は、2つのインデックス管理モードを含み得る。第1の種類は、データセンタの代わりに、一貫ハッシュ法を用いてインデックスを管理することであって良い。他の種類は、ファイルID及びその記憶場所を格納するために、データセンタを用いてインデックスを管理することであって良い。
どのモードが採用されるかに拘わらず、大容量ファイルの記憶に関して、膨大な益々拡大するインデックスが適時維持される必要がある。
しかしながら、既存の大量インデックスにより、動作性能は、インデックスクエリの遅延により決定される場合がある。既存のインデックス管理モードでは、大量のデータが検索されるので、動作性能は向上できない。したがって、ファイルストレージにおけるインデックス付けの実施は最適化されるべきである。
本開示の実施形態は、ファイルストレージにおけるインデックス付けの実施方法を提供し、種々のインデックス操作の処理性能を向上できる。
ファイルストレージにおけるインデックス付け実施方法は、コンピュータプログラムにより実施されて良い。したがって、構造化ファイルストレージにおけるインデックス付け実施システムは、種々のインデックス操作を実施するプロセスを走らせるため及びインデックスの追加、削除、検索、及び偏光操作を実施するために、サーバ又はサーバクラスタに格納されて良い。
図1は、本開示の種々の実施形態によるサーバの構造を示す図である。サーバ100は、異なる構成及び性能により大きく異なって良く、(1以上のプロセッサのような)1以上のCPU(Central Processing Unit)110、記憶装置120、1以上の記憶プログラム131、又はデータ133の(1以上の大容量記憶装置のような)記憶媒体130を有して良い。記憶装置120及び記憶媒体130は、一時的又は永久的にデータを格納して良い。記憶媒体130に格納されたプログラムは、1以上のモジュール(図示しない)を有して良い。各モジュールは、サーバの一連の命令動作を有して良い。さらに、CPU110は、記憶媒体130と通信し、記憶媒体130内の一連の命令動作を実行するよう構成されて良い。サーバは、1以上の電源150、1以上の有線/無線ネットワークインタフェース170、1以上の入力/出力インタフェース180、及び/又はWindowsServer(商標)、MacOS X(商標)、Unix(商標)、Linux(商標)、FreeBSD(商標)、等のような1以上のオペレーティングシステム(OS)135、を更に有して良い。サーバにより実行される以下のブロックは、図1に示すサーバの構造に基づいて良い。
上述の観点から、本開示の実施形態に適用され得るサーバ100は、格納されたファイルをインデックス付けするために、プログラム命令のフォーマットで、ファイルのインデクス操作要求に対する応答を生成して良い。
さらに、本開示の実施形態は、回路又はソフトウェア命令と結合される回路により実施されても良い。したがって、本開示の実施形態は、特定の回路、ソフトウェア、又はそれらの組合せに限定されない。
一実施形態では、具体的に、ファイルストレージにおけるインデックス付け実施方法は、図2に示すことができ、以下のブロックを有して良い。
ブロック210で、ファイルにインデックスを付けることを要求する、ファイルのインデックス操作要求が得られて良い。
このファイルは、格納されるべきファイル、つまり、分散型記憶システムに格納されるべきファイル、又は分散型記憶システムに格納されている任意のファイルであって良い。ファイルのインデックス付け操作は、分散型記憶システム内のファイルの操作に対応して良く、インデックス付け操作は、必要なファイル操作に従いトリガされて良い。
例えば、分散型記憶システム内のファイルのファイル操作は、ファイルを書き込み、読み出し、又は削除するための、書き込み操作、読み出し操作、削除操作、等を有して良い。したがって、ファイルのインデックス操作は、ファイルを生成し、取得し、及び削除することを有して良い。
大量のファイルが格納され、新しいファイルが書き込まれているので、ファイルに対してファイル操作を実行し得る大量のクライアント装置が存在し、クライアント装置からのファイルインデックス操作要求が絶えず受信され得る。
ブロック230で、ファイルに対応するメタデータが増分区間に格納されるか否かを決定するために、検索操作が実行されて良い。ファイルに対応するメタデータが増分区間に格納されるとき、ブロック250が実行されて良い。その他の場合、ブロック270が実行されて良い。
一実施形態では、メタデータ及びメタデータを格納する増分区間は、メタデータクラスタ又は他の装置内に実装されて良い。メタデータクラスタは、メタデータを格納し及びメタデータ記憶サービスを提供するために使用されて良い。任意のメタデータは以下を含んで良い。ファイルに対応するインデックス、及び関連する属性。メタデータは、ファイルID、つまりキー、により区別できる。メタデータ記憶サービスは、プログラムであって良い。該プログラムは、メタデータに基づきサービスを提供して良く、インデックス操作要求に対する応答を生成するときに呼び出され得るデータ追加、削除、検索、又は変更インタフェースを提供して良い。
メタデータクラスタでは、キー区間は、増分区間と全量区間とに分割されて良い。増分区間及び全量区間は、メタデータの複数のピースを格納して良い。一実施形態では、増分区間に格納されたデータは、全量区間に格納されたデータより少なくて良い。
格納されたファイルに関し、格納されたファイルが取得されるか又は削除されるかに関わらず、クライアント装置は、ファイルのインデックス操作要求を開始して良い。インデックス操作要求は、インデックス取得要求又はインデックス削除要求であって良い。
インデックス操作要求が取得された後、検索要求が、メタデータが格納され得る増分区間の中で実行されて良い。増分区間が対応するメタデータを格納するとき、メタデータを用いてインデックス操作要求に対する応答が生成されて良い。
増分区間は比較的少ないデータを格納し得るので、増分区間において実行される検索操作の性能は高く、検索操作により引き起こされる遅延を削減できる。
ブロック250で、増分区間の中のメタデータを用いてインデックス操作要求に対する応答が生成されて良い。
インデックス操作要求に対応するメタデータが、増分区間について実行された検索操作により取得された後、インデックス操作がメタデータに対して実行されて良く、処理結果がクライアント装置に返されて良く、インデックス操作要求に対する応答を終了する。つまり、増分区間の中のメタデータの少なくとも1つのピースに従いインデックス操作要求に対する応答を生成する方法は、増分区間の中のメタデータの少なくとも1つのピースに対してインデックス操作を実行することを有して良い。
ブロック270で、インデックス操作要求は、増分区間に対応する全量区間により処理されて良い。
インデックス操作要求に対応するメタデータが増分区間内に見付からないとき、これは、メタデータが全量区間内に格納されている場合があることを示し得る。したがって、インデックス操作要求の処理は、全量区間において実行されて良い。つまり、増分区間に対応する全量区間に従いインデックス操作要求を処理する方法は、増分区間に対応する全量区間の中のメタデータの少なくとも1つのピースに対してインデックス操作を実行することを有して良い。
つまり、分散型記憶システムのデータセンタのようなメタデータクラスタは、インデックスを格納し及び管理して良い。ストレージサービスのアーキテクチャは、以下の通りであって良い。
メタデータクラスタでは、キー区間は、増分区間と全量区間とに分割されて良い。ファイルのインデックス操作要求を取得した後に、ファイルIDに従いキー区間が決定されて良い。決定されたキー区間内で、先ず、増分区間内で検索操作が実行されて良い。対応するメタデータが増分区間から見付からないとき、検索操作は、全量区間内で実行されて良い。メタデータが増分区間から見付かるとき、多くのコンピュータリソースが節約でき、大容量データの記憶の高い信頼性が保証できる。
一実施形態では、上述のインデックス操作要求は、インデックス取得要求を有して良く、ブロック250は以下の処理を含んで良い。
メタデータは、書き込みタイムスタンプ、つまりメタデータが増分区間に書き込まれたタイムスタンプ、に従い増分区間から見付かったファイルに対応するメタデータから抽出されて良く、抽出されたメタデータは発行されて良い。
メタデータは、ファイルに対応するインデックス、及び関連する属性を有して良い。属性は、メタデータが増分区間に書き込まれるときの書き込みタイムスタンプのような、インデックスについて実行される操作に対応するタイムスタンプを有して良い。
書き込みタイムスタンプに従い、メタデータは、ファイルIDにより区別されるだけでなく、タイムスタンプによっても区別できる。したがって、同じファイルがメタデータの複数のピースに対応して良く、増分区間又は全量区間に格納されて良く、又は増分区間及び全量区間に格納されて良い。メタデータは、同じファイルIDを有して良く、メタデータの書き込みタイムスタンプは異なって良い。
一実施形態では、増分区間から見付かったファイルに対応するメタデータの複数のピースの中の各メタデータの書き込みスタンプは、メタデータを抽出するために、最新のタイムスタンプと比較されて良く、最新のタイムスタンプを有するメタデータが発行されて良い。
さらに、本実施形態では、図3に示すように、ブロック270は以下のブロックを有して良い。
ブロック271で、ファイルに対応するメタデータが増分区間に対応する全量区間に格納されるか否かを決定するために、検索操作が実行されて良い。ファイルに対応するメタデータが増分区間に対応する全量区間に格納されるとき、ブロック273が実行されて良い。その他の場合、ブロック275が実行されて良い。
メタデータが増分区間内に見つからないとき、メタデータは増分区間に対応する全量区間内で検索されて良い。
具体的に、全量区間は、インデックス操作要求内のファイルIDに従い、ファイルIDを含むメタデータを見付けるために、検索されて良い。見付かったメタデータは、ファイルに対応するものであって良い。
ブロック273で、メタデータは、書き込みタイムスタンプに従い全量区間から見付かったファイルに対応するメタデータから抽出されて良く、発行されて良い。
各メタデータは、対応するタイムスタンプを有して良い。したがって、最新のタイムスタンプに対応するメタデータは、書き込みタイムスタンプに従い抽出されて良い。
ブロック275で、ファイルに対応するインデックスレコードが存在しないことを示す結果情報が返されて良い。
全量区間からメタデータが見付からないとき、結果情報が、インデックス操作要求を開始したクライアント装置に返されて良い。
一実施形態では、上述のインデックス操作要求は、インデックス削除要求を有して良く、ブロック250は以下の処理を含んで良い。
インデックス削除操作は、ファイルのインデックス削除要求に従い増分区間に格納されたメタデータ内にマーク付けされて良く、インデックス削除操作に対応する削除タイムスタンプが追加されて良い。
削除操作が格納されたファイルに対して実行される前に、インデックスの削除操作が先ず実行されて良い。したがって、クライアント装置は、先ず、メタデータクラスタに対しインデックス削除要求を開始して良い。
メタデータクラスタに関し、インデックス削除要求が取得されて良く、対応するメタデータが増分区間から見付かって良い。メタデータは、ファイルのインデックス削除要求に従い削除としてマーク付けされて良い。つまり、メタデータを削除する代わりに、インデックスをマーク付けする操作。そして、削除タイムスタンプが、メタデータの属性に追加されて良い。
上述の削除処理により、現在バージョンのメタデータは、現在バージョンのメタデータの損失を回避するために、履歴データとして格納されて良い。したがって、格納されたファイルが削除された後に、ユーザは、後のフォールバック操作において削除したファイルを依然として取得できる。
一実施形態では、上述のインデックス操作要求は、インデックス生成要求を含んで良い。ブロック210で、上述の方法は、以下のブロックを更に有して良い。
ブロック310で、インデックス生成要求に従い、記憶位置の割り当てがトリガされて良い。
インデックス生成要求は、ファイルIDを含んで良く、ファイルIDは、現在書き込まれるべきファイルに対応して良い。任意のクライアント装置が分散型記憶システムにファイルを書き込むとき、先ず、ファイルのためにインデックスが生成される必要があって良い。
具体的に、クライアント装置は、メタデータクラスタへのインデックス生成要求を開始して良い。したがって、クライアント装置により開始されたインデックス生成要求を受信した後に、サーバは、記憶位置に書き込まれるべきファイルの記憶位置を割り当てる操作をトリガして良い。記憶位置は、ファイルが格納され得る物理的位置であって良い。
記憶位置が割り当てられると、現在書き込まれるべきファイルは、記憶位置に従い格納されて良い。さらに、本実施形態では、図5に示すように、ブロック310は以下のブロックを有して良い。
ブロック311で、インデックス生成要求の中のファイルIDが抽出されて良い。
ブロック313で、記憶位置にファイルを書き込むために、ファイルの記憶位置を割り当てる操作がトリガされて良い。
ブロック330で、ファイルのインデックスが、割り当てられた記憶位置に従い生成されて良く、ファイルのメタデータが、インデックスを用いて生成されて良い。
メタデータ内のインデックスは、ファイルIDと記憶位置との間のマッピング関係であって良い。上述のように、メタデータの任意のピースは、ファイルに対応するインデックス、及び関連する属性を有して良い。したがって、書き込まれるファイルのインデックスを生成する処理において、メタデータのインデックスは、ファイルID及び記憶位置を用いて生成されて良く、メタデータの属性はタイムスタンプを追加することにより生成されて良い。
具体的に、記憶位置を用いてファイルのメタデータを生成する処理は、ファイルIDと割り当てられた記憶位置との間のマッピング関係を生成し、マッピング関係をインデックスとして取り入れてファイルのメタデータを生成することを有して良い。
複数の記憶位置を用いてファイルをバックアップするために、1又は複数の記憶位置が割り当てられて良い。
ブロック350で、書き込みタイムスタンプがメタデータに追加されて良い。
ブロック370で、増分区間が位置決めされて良く、メタデータは、新規データ追加モードで位置決めされた増分区間に書き込まれて良い。
増分区間を位置決めする特定の処理は、インデックス生成要求の中のファイルIDに従い、メタデータクラスタに対応するキー区間を取得することを有して良い。キー区間の中の増分区間は、現在インデックスのために生成されてものであって良い。
新規データを書き込むフォーマットは、履歴データを保持するために、上書きフォーマットではなく、付加フォーマットであって良く、同じファイルの異なるバージョンが追跡できる。
別の実施形態は、図6に示すように、上述の方法は以下のブロックを更に有して良い。
ブロック410で、マージタスクが開始されて良い。
マージタスクは、増分区間及び対応する全量区間内のメタデータをマージすることを表して良い。マージ操作がトリガされると、マージタスクが開始されて良い。既存の増分区間及び対応する全量区間の動作は、マージタスクを実施するためにマージ操作によりマージされて良い。マージ操作は、オフライン操作であって良い。
ブロック430で、増分区間及び対応する全量区間のマージが、マージタスクを開始することによりトリガされて良い。
新しいメタデータは、新規データ追加モードで、増分区間に書き込まれて良い。データクラスタ内のメタデータの削除に関し、対応するマークが増分区間に追加されて良い。したがって、全量区間内のメタデータは、変更されなくて良く、増分区間のメタデータのみが変更されて良い。
全量区間は、メタデータの履歴データを記録するために使用されて良く、増分区間は、新しいメタデータを格納するために使用されて良く、メタデータは増分区間から削除されて良い。全量区間及び増分区間は、履歴データ及び新しいメタデータをそれぞれ見付けるために検索されて良い。
新しいファイルの書き込みにより、増分区間内のメタデータは増加し続ける。したがって、増分区間内のデータが全量区間内のデータより少ないことを保証するため、及び増分区間内のインデックスの読み出し及び書き込み性能を保証するために、区間が動的に調整される必要があって良い。
区間を動的に調整する処理は、既存の増分区間及び全量区間をマージし、新しい増分区間を生成することを有して良い。
ブロック450で、マージされた区間は、複数の全量区間に分割されて良い。
既存の増分区間及び対応する全量区間をマージすることにより得られたセグメントは、大量のメタデータを含み得る。データ量は非常に大きく、複数の全量区間を得るため及び全量区間のメタデータの効率的記憶及び効率的インデックス付け操作を保証するために、セグメントは分割される必要があって良い。
ブロック470で、ファイルのインデックス操作要求のために書き込みサービスを提供するために、複数の全量区間に対応する増分区間が生成されて良い。
各全量区間は、対応する増分区間を有して良い。したがって、全量区間に対してパーティショニング操作が実行され、増分区間は、パーティショニング操作により得られた各セグメントについて生成される必要があって良い。
後のファイル書き込み操作において、インデックスが生成され、新たに生成された増分区間に書き込まれて良い。つまり、新しい増分区間が生成され、対応するメタデータは新しい増分区間に書き込まれて良い。
上述の処理により、セグメントの動的調整が、マージタスクにより実施され得る。したがって、メタデータクラスタ内で設定された増分区間及び全量区間は、メタデータの量に適応され得る。これは、メタデータの記憶、インデックスの追加、削除、検索、及び偏光のような関連記憶サービスの信頼性を向上できる。
さらに、本実施形態では、図7に示すように、ブロック430は以下のブロックを有して良い。
ブロック431で、増分区間及び対応する全量区間内のメタデータをエクスポートする操作が、開始されたマージタスクによりトリガされて良い。
マージタスクが開始されると、この時点の前に書き込まれていたメタデータはマージされて良く、この時点の後に書き込まれる得るメタデータは新しい増分区間に書き込まれて良い。したがって、増分区間及び対応する全量区間内のメタデータをエクスポートする操作が、開始されたマージタスクによりトリガされて良い。エクスポート処理及びマージ処理は、分散型モードで、つまり非同期モードで、実行されて良い。
ブロック433で、増分区間及び対応する全量区間は、1区間にマージされて良い。
ブロック435で、メタデータは、所定のマージ方針に従いエクスポートされて良い。
所定のマージ方針は、(1)削除としてマーク付けされているメタデータを削除すべきか否か、(2)同じファイルID及び異なるタイムスタンプを有するメタデータをマージすべきか否か、(3)マージ操作により得られたセグメントをパーティショニングすることにより得られる各セグメントのサイズ、を有して良い。メタデータをマージするために使用され得るマージ方針は、上述の方針のうちのいずれか、又は幾つかの方針の組合せであって良い。これは、必要に応じて決定されて良く、又は柔軟であって良い。
さらに、ブロック435は、以下を有して良い:削除としてマーク付けされたメタデータを削除するマージ方針を実施するために、削除としてマーク付けされたメタデータが、エクスポートされたメタデータから削除されて良い。
ブロック437で、マージされたメタデータは、区間内に書き込まれて良い。
上述のファイルストレージにおけるインデックス付け実施方法は、特定の実施形態を伴い詳細に記載される。本実施形態では、図8に示すように、実際に、メタデータのストレージサービスは、増分区間(デルタと称す)及び増分区間に対応する全量区間(スナップショットと称す)により実施されて良い。
メタデータのアクセスは、2種類に分類できる。つまり、デルタのアクセスとスナップショットのアクセスである。つまり、メタデータのアクセスは、図8に示すデルタ読み出し処理であって良い。
図8に示すブロックは、デルタ内のデータがスナップショット内のデータより遙かに少ないことを明確に示す。新規データの書き込み、つまりインデックスの生成は、デルタに対して実行されて良い。
図9を参照すると、クライアント装置がデータノードセレクタへのインデックス生成要求を開始すると、データノードセレクタは、記憶位置を割り当てる操作をトリガして良い。ブロック610で、クライアント装置は、インデックスを生成する要求を、データノードセレクタへ送信して良い。ブロック620で、データノードセレクタは、記憶位置を割り当てて良い。つまり、ブロック620が実行されて、クライアントへ割り当て結果を返して良い、つまりブロック630。
クライアント装置は、ブロック650を実行するために、ブロック640で記憶位置に対応するデータノードにファイルをアップロードして良い。ブロック650で、このデータノードにおいて、ファイルはディスクに格納されて良い。
ブロック670で、クライアント装置は、データノードにより返されたアップロード結果を受信して、ファイルがアップロードに成功したか否かを得て良い。ファイルがアップロードに成功すると、ファイルID及び割り当てられた記憶位置に従いメタデータが生成されて良く、メタデータのアップロード操作は、ブロック680において更に実行されて、デルタにメタデータを書き込み、ファイルに対応するインデックスを生成して良い。ブロック690で、デルタは、アップロード結果をクライアント装置に返して良い。
留意すべきことに、本実施形態におけるデータノードセレクタは、サービスを提供するために使用され得る、メタデータクラスタ内のプログラムであって良く、一方で、データノードは、記憶媒体を提供するために使用され得る、分散型記憶システム内のコンピュータであって良い。
インデックスの生成が終了した後、図10を参照し、クライアント装置は、クライアント装置とデータセレクタとの間の相互作用により、インデックスを取得して良い。
具体的に、クライアント装置は、ブロック710を実行し、インデックスを要求するために、データノードセレクタに対するインデックス取得要求を開始して良い。ブロック720で、データノードセレクタは、インデックス取得要求の中のファイルIDに従い、インデックスが配置され得るキー区間を決定して良い。ブロック730で、データノードセレクタは、クライアント装置に結果を返して良い。
クライアント装置は、ブロック740で、先ず、キー区間のデルタからインデックスをダウンロードして良く、インデックスを含むメタデータがデルタ内に格納されるか否かを決定するためにデルタを検索し、対応する検索結果を返す。
検索結果に従い、インデックスを含むメタデータがデルタから見付かると、ブロック750で、クライアント装置は、デルタからインデックスを直接ダウンロードして良い。インデックスを含むメタデータがデルタから見付からないとき、ブロック750で、クライアント装置は、デルタから「見付からない(Not Found)」を受信して良い。ブロック760で、クライアント装置は、インデックス付け操作を再び実行して良い。
インデックスを含むメタデータがデルタから見付からないとき、インデックスは、対応するスナップショットからダウンロードされて良い。つまり、ブロック770からブロック790が実行されて良く、データノードからメタデータをダウンロードし、データノードから結果を受信し、ダウンロード結果を返す
他方で、生成され格納されたインデックスに関し、ファイルが削除されると、インデックスは相応して削除されて良い。
図11に示すように、ファイルの削除処理中、ブロック810で、クライアント装置は、データノードセレクタに対し、インデックスを削除することを要求するインデックス削除要求を開始して良い。データノードセレクタは、ブロック820を実行して良く、インデックスを含むメタデータがデルタに格納され得るかを決定し、つまり、インデックス区間を決定し、ブロック830でクライアント装置へ結果を返す。ブロック840で、デルタは、クライアント装置から、インデックスを削除する要求を受信し、メタデータ内のインデックスを削除して良い。つまりブロック850が実行される。そして、ブロック870で、データセレクタは、インデックスが成功裏に削除できることをクライアント装置に通知して良い。ブロック880で、クライアント装置は、削除が成功したことを示す結果を返して良い。
メタデータがデルタに書き込まれ、デルタ内のメタデータが削除として注記されるとき、図8に示すマージ処理を参照して、デルタ及びスナップショットは、新しいスナップショットとしてマージされて、新しいスナップショットに対応する新しいデルタを生成し、セグメントの動的調整を実施する。
本開示の一実施形態は、ファイルストレージにおけるインデックス付け実施システムであって、要求取得モジュール910と、増分検索モジュール930と、増分応答モジュール950と、全量応答モジュール970と、を有するシステムを更に提供し得る。
要求取得モジュール910は、ファイルのインデックス操作要求を取得して良い。
増分検索モジュール930は、増分区間を検索して、増分区間がファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定し、増分区間がファイルに対応するメタデータの少なくとも1つのピースを格納するとき、増分応答モジュール950に通知し、増分区間がファイルに対応するメタデータを格納しないとき、全量応答モジュール970に通知して良い。
増分応答モジュール950は、増分区間内のメタデータの少なくとも1つのピースに従い、インデックス操作要求に対する応答を生成して良い。
全量応答モジュール970は、増分区間に対応する全量区間に従いインデックス操作要求を処理して良い。
メタデータの各ピースは、ファイルに対応するインデックスを有して良い。
一実施形態では、インデックス操作要求は、インデックス取得要求を有し、増分応答モジュール950は、さらに、増分区間から見付かる、ファイルに対応するメタデータの少なくとも1つのピースの各々の書き込みタイムスタンプに従い、メタデータを抽出し、メタデータを発行して良い。
一実施形態では、増分応答モジュール950は、さらに、増分区間から見付かる、ファイルに対応するメタデータの少なくとも1つのピースの各々の書き込みタイムスタンプに従い、最新の書き込みタイムスタンプを有するメタデータを抽出し、メタデータを発行して良い。
一実施形態は、図13に示すように、全量応答モジュール970は、検索ユニット971と、抽出ユニット973と、結果返信ユニット975と、を有して良い。
検索ユニット971は、増分区間に対応する全量区間を検索して、全量区間がファイルに対応するメタデータの少なくとも1つのピースを有するか否かを決定し、全量区間がファイルに対応するメタデータの少なくとも1つのピースを有するとき、抽出ユニット973に通知し、全量区間がファイルに対応するメタデータのピースを有しないとき、結果返信ユニット975に通知して良い。
抽出ユニット973は、全量区間から見付かるファイルに対応するメタデータの少なくとも1つのピースの各々の書き込みタイムスタンプに従い、メタデータを抽出し、メタデータを発行して良い。
一実施形態では、抽出ユニット973は、さらに、全量区間から見付かる、ファイルに対応するメタデータの少なくとも1つのピースの各々の書き込みタイムスタンプに従い、最新の書き込みタイムスタンプを有するメタデータを抽出して良い。
結果返信ユニット975は、ファイルに対応するインデックスレコードが存在しないことを示す結果情報を返して良い。
一実施形態では、インデックス操作要求は、インデックス削除要求を有し、増分応答モジュール950は、さらに、インデックス削除要求に従い、増分区間の中のメタデータの少なくとも1つのピースの中のインデックスを削除でマーク付けするインデックス削除操作を実行し、インデックス削除操作に対応する削除タイムスタンプを追加して良い。
一実施形態では、インデックス操作要求は、インデックス生成要求を有して良く、図14に示すように、システムは、位置割り当てモジュール1010と、メタデータ生成モジュール1030と、タイムスタンプ追加モジュール1050と、書き込みモジュール1070と、を有して良い。
位置割り当てモジュール1010は、インデックス生成要求に従い記憶位置の割り当てをトリガして良い。
メタデータ生成モジュール1030は、記憶位置に従いファイルのインデックスを生成し、インデックスを用いてメタデータを生成して良い。
タイムスタンプ追加モジュール1050は、メタデータに書き込みタイムスタンプを追加して良い。
書き込みモジュールは、増分区間を位置決めし、新規データ追加モードで、位置決めした増分区間にメタデータを書き込んで良い。
さらに、一実施形態では、図15に示すように、位置割り当てモジュール1010は、インデックス生成要求からファイルIDを抽出するID抽出ユニットと、ファイルが記憶位置に書き込まれるように、ファイルの記憶位置の割り当ての操作をトリガする書き込みユニット1013と、を有して良い。
さらに、メタデータ生成モジュール1030は、さらに、ファイルIDと記憶位置との間のマッピング関係を生成し、マッピング関係をインデックスとして取り入れてファイルのメタデータを生成して良い。
一実施形態では、図16に示すように、上述のシステムは、さらに、タスク開始モジュール1110と、マージモジュール1130と、分割モジュール1150と、増分区間生成モジュール1170と、を有して良い。
タスク開始モジュールは、マージタスクを開始して良い。
マージモジュール1130は、マージタスクにより、増分区間及び全量区間のマージをトリガして良い。
分割モジュール1150は、マージタスクを複数の全量区間に分割して良い。
増分区間生成モジュール1170は、ファイルのインデックス操作要求のために書き込みサービスを提供するために、複数の全量区間にそれぞれ対応する複数の増分区間を生成して良い。
一実施形態では、図17に示すように、マージモジュール1130は、データエクスポートユニット1131と、区間マージユニット1133と、データマージユニット1135と、データ書き込みユニット1137と、を有して良い。
データエクスポートユニット1131は、マージタスクにより、増分区間及び対応する全量区間内のメタデータをエクスポートする操作をトリガして良い。
区間マージユニット1133は、増分区間及び対応する全量区間を1つのマージ区間にマージして良い。
データマージユニット1135は、所定のマージ方針に従い、エクスポートされたメタデータをマージして良い。
一実施形態では、データマージユニット1135は、さらに、エクスポートされたメタデータから、インデックスが削除でマーク付けされたメタデータを削除して良い。
データ書き込みユニット1137は、区間にマージしたメタデータを書き込んで良い。
当業者は、前述の実施形態のステップの全部又は一部が、ハードウェアを使用することにより実装されて良く、又は関連するハードウェアに指示するプログラムにより実装されて良いことを理解する。プログラムは、コンピュータ可読記憶媒体に格納されて良い。記憶媒体は、リードオンリーメモリ、磁気ディスク、光ディスク、等であって良い。
上述の説明は、本発明の単なる好適な実施形態であり、本開示を制限することを意図しない。本開示の精神及び原理の範囲内で行われる変更、等価置換、及び改良は、本開示の保護範囲に含まれるべきである。

Claims (20)

  1. ファイルストレージにおけるインデックス付け実施方法であって、
    ファイルのインデックス操作要求を得るステップと、
    増分区間を検索して、前記増分区間が前記ファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定するステップと、
    前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納するとき、前記増分区間の中のメタデータの前記少なくとも1つのピースに従い、前記インデックス操作要求に対する応答を生成するステップと、
    前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納しないとき、前記増分区間に対応する全量区間に従い、前記インデックス操作要求を処理するステップと、
    を有し、
    メタデータの各々のピースは、前記ファイルに対応するインデックスを有する、方法。
  2. 前記インデックス操作要求は、インデックス取得要求を有し、前記増分区間の中のメタデータの前記少なくとも1つのピースに従い前記インデックス操作要求に対する応答を生成するステップは、
    前記増分区間から見付かる、前記ファイルに対応するメタデータの各ピースの書き込みタイムスタンプに従い、最新の書き込みタイムスタンプを有するメタデータを抽出し、抽出したメタデータを発行するステップ、を有する、
    請求項1に記載の方法。
  3. 前記増分区間に対応する前記全量区間に従い前記インデックス操作要求を処理するステップは、
    前記増分区間に対応する前記全量区間を検索して、前記全量区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを有するか否かを決定するステップと、
    前記全量区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを有するとき、
    前記全量区間から見付かる、前記ファイルに対応するメタデータの各ピースの書き込みタイムスタンプに従い、最新の書き込みタイムスタンプを有するメタデータを抽出し、抽出したメタデータを発行するステップと、
    を有する、請求項2に記載の方法。
  4. 前記インデックス操作要求は、インデックス削除要求を有し、
    前記増分区間の中のメタデータの前記少なくとも1つのピースに従い前記インデックス操作要求に対する応答を生成するステップは、
    前記インデックス削除要求に従い、前記増分区間の中のメタデータの少なくとも1つのピースの中のインデックスを削除でマーク付けするインデックス削除操作を実行し、前記インデックス削除操作に対応する削除タイムスタンプを追加するステップ、
    を有する、請求項1に記載の方法。
  5. 前記インデックス操作要求は、インデックス生成要求を有し、
    前記インデックス操作要求を得るステップの後に、前記方法は、
    前記インデックス生成要求に従い記憶位置の割り当てをトリガするステップと、
    前記割り当てられた記憶位置に従い前記ファイルのインデックスを生成し、前記インデックスを用いて前記ファイルの前記メタデータを生成するステップと、
    前記メタデータに書き込みタイムスタンプを追加するステップと、
    前記増分区間を位置決めし、新規データ追加モードで、前記メタデータを前記位置決めした増分区間に書き込むステップと、
    を更に有する請求項1に記載の方法。
  6. 前記インデックス生成要求に従い前記記憶位置の前記割り当てをトリガするステップは、
    前記インデックス生成要求からファイル識別(ID)を抽出するステップと、
    前記ファイルが前記記憶位置に書き込まれるように、前記ファイルの前記記憶位置の割り当ての操作をトリガするステップと、
    を有する、請求項5に記載の方法。
  7. 前記割り当てられた記憶位置を用いて前記ファイルの前記メタデータを生成するステップは、
    前記ファイルIDと前記割り当てられた記憶位置との間のマッピング関係を生成し、前記マッピング関係を前記インデックスとして取り入れて前記ファイルの前記メタデータを生成するステップ、
    を有する、請求項6に記載の方法。
  8. マージタスクを開始するステップと、
    前記マージタスクにより前記増分区間と全量区間のマージをトリガして、マージ区間を生成するステップと、
    前記マージ区間を複数の全量区間に分割するステップと、
    前記複数の全量区間にそれぞれ対応する複数の増分区間を生成して、前記ファイルの前記インデックス操作要求に対して書き込みサービスを提供するステップと、
    を更に有する請求項1に記載の方法。
  9. 前記マージタスクにより前記増分区間と全量区間のマージをトリガするステップは、
    前記マージタスクにより前記増分区間及び前記対応する全量区間の中のメタデータのエクスポート操作をトリガするステップと、
    前記増分区間及び前記対応する全量区間を前記マージ区間にマージするステップと、
    所定のマージ方針に従い、前記エクスポートされたメタデータをマージするステップと、
    前記マー区間にマージしたメタデータを書き込むステップと、
    を有する、請求項8に記載の方法。
  10. 前記所定のマージ方針に従い、前記エクスポートしたメタデータをマージするステップは、
    前記エクスポートしたメタデータから、インデックスが削除でマーク付けされたメタデータを削除するステップ、
    を有する、請求項9に記載の方法。
  11. ファイルストレージにおけるインデックス付け実施システムであって、
    ファイルのインデックス操作要求を得る要求取得モジュールと、
    増分検索モジュールであって、増分区間を検索し、前記増分区間が前記ファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定し、前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納するとき、増分応答モジュールに通知し、前記増分区間が前記ファイルに対応するメタデータを格納しないとき、全量応答モジュールに通知する、増分検索モジュールと、
    を有し、
    前記増分応答モジュールは、前記増分区間の中のメタデータの前記少なくとも1つのピースに従い、前記インデックス操作要求に対する応答を生成し、
    前記全量応答モジュールは、前記増分区間に対応する全量区間に従い、前記インデックス操作要求を処理し、
    メタデータの各ピースは、前記ファイルに対応するインデックスを有する、
    システム。
  12. 前記インデックス操作要求は、インデックス取得要求を有し、
    前記増分応答モジュールは、前記増分区間から見付かる、前記ファイルに対応するメタデータの前記少なくとも1つのピースの各々の書き込みタイムスタンプに従い、最新の書き込みタイムスタンプを有するメタデータを抽出し、前記メタデータを発行する、
    請求項11に記載のシステム。
  13. 前記全量応答モジュールは、
    検索ユニットであって、前記増分区間に対応する前記全量区間を検索して、前記全量区間が前記ファイルに対応するメタデータの少なくとも1つのピースを有するか否かを決定し、前記全量区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを有するとき、抽出ユニットに通知する、検索ユニット、
    を有し、
    前記抽出ユニットは、前記全量区間から見付かる、前記ファイルに対応するメタデータの前記少なくとも1つのピースの各々の書き込みタイムスタンプに従い、最新の書き込みタイムスタンプを有するメタデータを抽出し、前記メタデータを発行する、
    請求項12に記載のシステム。
  14. 前記インデックス操作要求は、インデックス削除要求を有し、
    前記増分応答モジュールは、さらに、前記インデックス削除要求に従い、前記増分区間の中のメタデータの少なくとも1つのピースの中のインデックスを削除でマーク付けするインデックス削除操作を実行し、前記インデックス削除操作に対応する削除タイムスタンプを追加する、
    請求項11に記載のシステム。
  15. 前記インデックス操作要求は、インデックス生成要求を有し、
    前記システムは、
    前記インデックス生成要求に従い記憶位置の割り当てをトリガする位置割り当てモジュールと、
    記憶位置に従い前記ファイルのインデックスを生成し、前記インデックスを用いて前記メタデータを生成するメタデータ生成モジュールと、
    前記メタデータに書き込みタイムスタンプを追加するタイムスタンプ追加モジュールと、
    前記増分区間を位置決めし、新規データ追加モードで、前記メタデータを前記位置決めした増分区間に書き込む書き込みモジュールと、
    を更に有する請求項11に記載のシステム。
  16. 前記位置割り当てモジュールは、
    前記インデックス生成要求からファイル識別(ID)を抽出する識別(ID)抽出ユニットと、
    前記ファイルが前記記憶位置に書き込まれるように、前記ファイルの前記記憶位置の割り当ての操作をトリガする書き込みユニットと、
    を有する、請求項15に記載のシステム。
  17. 前記メタデータ生成モジュールは、さらに、前記ファイルIDと前記記憶位置との間のマッピング関係を生成し、前記マッピング関係を前記インデックスとして取り入れて前記ファイルの前記メタデータを生成する、
    請求項16に記載のシステム。
  18. マージタスクを開始するタスク開始モジュールと、
    前記マージタスクにより前記増分区間と全量区間のマージをトリガして、マージ区間を生成するマージモジュールと、
    前記マージ区間を複数の全量区間に分割する分割モジュールと、
    前記複数の全量区間にそれぞれ対応する複数の増分区間を生成して、前記ファイルの前記インデックス操作要求に対して書き込みサービスを提供する増分区間生成モジュールと、
    を更に有する請求項11に記載のシステム。
  19. 前記マージモジュールは、
    前記マージタスクにより、前記増分区間及び前記対応する全量区間の中のメタデータのエクスポート操作をトリガするデータエクスポートユニットと、
    前記増分区間及び前記対応する全量区間を1つのマージ区間にマージする区間マージユニットと、
    所定のマージ方針に従い、前記エクスポートされたメタデータをマージするデータマージユニットと、
    を有する、請求項18に記載のシステム。
  20. 命令を格納する非一時的コンピュータ可読媒体であって、前記命令は、1又は複数のプロセッサにより実行されると、
    ファイルのインデックス操作要求を取得し、
    増分区間を検索して、前記増分区間が前記ファイルに対応するメタデータの少なくとも1つのピースを格納するか否かを決定し、
    前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納するとき、前記増分区間の中のメタデータの前記少なくとも1つのピースに従い、前記インデックス操作要求に対する応答を生成し、
    前記増分区間が前記ファイルに対応するメタデータの前記少なくとも1つのピースを格納しないとき、前記増分区間に対応する全量区間に従い、前記インデックス操作要求を処理し、
    メタデータの各々のピースは、前記ファイルに対応するインデックスを有する、非一時的コンピュータ可読媒体。
JP2017562725A 2015-11-04 2016-10-28 ファイルストレージにおけるインデックス付け実施方法及びシステム Active JP6501916B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510741056.7 2015-11-04
CN201510741056.7A CN106649403B (zh) 2015-11-04 2015-11-04 文件存储中的索引实现方法和系统
PCT/CN2016/103699 WO2017076223A1 (zh) 2015-11-04 2016-10-28 文件存储中的索引实现方法和系统

Publications (2)

Publication Number Publication Date
JP2018516409A JP2018516409A (ja) 2018-06-21
JP6501916B2 true JP6501916B2 (ja) 2019-04-17

Family

ID=58661660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017562725A Active JP6501916B2 (ja) 2015-11-04 2016-10-28 ファイルストレージにおけるインデックス付け実施方法及びシステム

Country Status (5)

Country Link
US (1) US11157445B2 (ja)
JP (1) JP6501916B2 (ja)
KR (1) KR102031588B1 (ja)
CN (1) CN106649403B (ja)
WO (1) WO2017076223A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108376169A (zh) * 2018-02-26 2018-08-07 众安信息技术服务有限公司 一种用于联机分析处理的数据处理方法和装置
CN110427340B (zh) * 2018-04-28 2023-08-04 伊姆西Ip控股有限责任公司 用于文件存储的方法、装置和计算机存储介质
CN109086307B (zh) * 2018-06-22 2020-04-14 阿里巴巴集团控股有限公司 文件处理的方法及装置
KR102177489B1 (ko) 2018-08-17 2020-11-11 주식회사 마크베이스 센서 태그 데이터를 위한 색인 검색 방법 및 장치
CN111177077B (zh) * 2018-11-09 2023-05-26 杭州海康威视数字技术股份有限公司 数据存储及数据查询方法、装置、设备、介质
CN109815060A (zh) * 2019-01-30 2019-05-28 北京百度网讯科技有限公司 用于备份信息的方法及装置
CN112748866A (zh) * 2019-10-31 2021-05-04 北京沃东天骏信息技术有限公司 一种增量索引数据的处理方法和装置
US11636110B1 (en) * 2021-10-29 2023-04-25 Snowflake Inc. Metadata search via N-Gram index
CN114036107B (zh) * 2021-11-08 2023-03-14 上海柯林布瑞信息技术有限公司 基于hudi快照的医疗数据查询方法及装置
CN115981875B (zh) * 2023-03-21 2023-08-25 人工智能与数字经济广东省实验室(广州) 内存存储系统的增量更新方法、装置、设备、介质和产品

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0198020A (ja) * 1987-10-09 1989-04-17 Nec Corp 索引管理方式
CN100456298C (zh) * 2006-07-12 2009-01-28 百度在线网络技术(北京)有限公司 广告信息检索系统及广告信息检索方法
CN101655858B (zh) * 2009-08-26 2011-05-18 华中科技大学 一种基于分块组织的密文索引结构及其管理方法
JP5592747B2 (ja) * 2010-10-12 2014-09-17 株式会社日立ソリューションズ ファイル検索装置およびファイル検索プログラム
JP5655538B2 (ja) * 2010-12-15 2015-01-21 三菱電機株式会社 データ管理装置及びデータ管理方法
CN102693308B (zh) * 2012-05-24 2014-02-12 北京迅奥科技有限公司 一种面向实时搜索的缓存方法
US9710475B1 (en) * 2012-07-16 2017-07-18 Tintri Inc. Synchronization of data
CN103177117B (zh) * 2013-04-08 2016-06-01 北京奇虎科技有限公司 信息索引系统及信息索引的更新方法
CN103678520B (zh) * 2013-11-29 2017-03-29 中国科学院计算技术研究所 一种基于云计算的多维区间查询方法及其系统
US10255286B2 (en) * 2013-12-18 2019-04-09 Software Ag File metadata handler for storage and parallel processing of files in a distributed file system, and associated systems and methods
CN103744960A (zh) * 2014-01-06 2014-04-23 河海大学 一种基于云平台的元数据索引模型及方法

Also Published As

Publication number Publication date
KR102031588B1 (ko) 2019-10-14
WO2017076223A1 (zh) 2017-05-11
US20180075050A1 (en) 2018-03-15
CN106649403A (zh) 2017-05-10
US11157445B2 (en) 2021-10-26
JP2018516409A (ja) 2018-06-21
CN106649403B (zh) 2020-07-28
KR20180008774A (ko) 2018-01-24

Similar Documents

Publication Publication Date Title
JP6501916B2 (ja) ファイルストレージにおけるインデックス付け実施方法及びシステム
US11799959B2 (en) Data processing method, apparatus, and system
US8751763B1 (en) Low-overhead deduplication within a block-based data storage
AU2013409624B2 (en) Data processing method and device in distributed file storage system
JP6664218B2 (ja) 効率的なデータオブジェクトストレージ及び検索
WO2019062574A1 (zh) 一种元数据查询方法及装置
CN110321301B (zh) 一种数据处理的方法及装置
WO2017113213A1 (zh) 访问请求处理方法、装置及计算机系统
KR20200122994A (ko) 키 값 첨부
EP3570182B1 (en) Sparse infrastructure for tracking ad-hoc operation timestamps
CN106709014B (zh) 一种文件系统转换方法及装置
CN114528255A (zh) 元数据管理方法、电子设备及计算机程序产品
US20220342888A1 (en) Object tagging
CN112306957A (zh) 获取索引节点号的方法、装置、计算设备和存储介质
US10877881B2 (en) In-place garbage collection of a sharded, replicated distributed state machine based on mergeable operations
US9063656B2 (en) System and methods for digest-based storage
US11789908B2 (en) Offloading memory maintenance for a log-structured file system
CN108376104B (zh) 节点调度方法及装置、计算机可读存储介质
CN111782588A (zh) 一种文件读取方法、装置、设备和介质
US10936543B1 (en) Metadata protected sparse block set for SSD cache space management
WO2016018447A1 (en) File creation
CN118035260A (zh) 数据更新方法、装置、计算机可读存储介质和电子设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190319

R150 Certificate of patent or registration of utility model

Ref document number: 6501916

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250