TW201423425A - 資料分塊儲存至分散式伺服器的系統及方法 - Google Patents

資料分塊儲存至分散式伺服器的系統及方法 Download PDF

Info

Publication number
TW201423425A
TW201423425A TW101148554A TW101148554A TW201423425A TW 201423425 A TW201423425 A TW 201423425A TW 101148554 A TW101148554 A TW 101148554A TW 101148554 A TW101148554 A TW 101148554A TW 201423425 A TW201423425 A TW 201423425A
Authority
TW
Taiwan
Prior art keywords
data block
storage
hash
server
document
Prior art date
Application number
TW101148554A
Other languages
English (en)
Inventor
Zhi-Quan Chai
Da-Peng Li
Hai-Hong Lin
Chung-I Lee
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201423425A publication Critical patent/TW201423425A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • H04L67/5651Reducing the amount or size of exchanged application data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一種資料分塊儲存至分散式伺服器的系統及方法,該方法包括:將用戶端上傳的文檔資訊和文檔的哈希列表存至哈希資料庫,哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;計算所有儲存伺服器的傳輸進程佔用率及各儲存伺服器中每個儲存區的儲存空間;確定傳輸進程佔用率低於預設值的儲存伺服器為空閒儲存伺服器,及確定有剩餘儲存空間的儲存區;當哈希資料庫中有哈希值與儲存伺服器中已儲存資料塊的哈希值相同時,確定該哈希值對應的資料塊為重復資料塊;為各資料塊分配儲存區。

Description

資料分塊儲存至分散式伺服器的系統及方法
本發明涉及一種雲端技術,尤其涉及一種透過雲端技術將資料分塊儲存至分散式伺服器的系統及方法。
在雲端技術中,當有文檔上傳及儲存時,會經常遇到伺服器的儲存空間不足、儲存進程長期被佔用,及文檔重複傳輸等缺陷,從而導致伺服器無法及時回應用戶的儲存請求及無法使用戶及時上傳文檔。
鑒於以上內容,有必要提供一種資料分塊儲存至分散式伺服器的系統及方法,其可有效地節省伺服器的儲存空間,使得伺服器的傳輸進程不會被一個用戶長期佔用,且加快了用戶上傳文檔的速度。
所述資料分塊儲存至分散式伺服器的系統,運行於一台分配伺服器中,該分配伺服器透過網路連接多個用戶端和多台儲存伺服器。該系統包括:接收模組,用於接收用戶端上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,該哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;計算模組,用於計算所述多台儲存伺服器的傳輸進程佔用率,及各儲存伺服器中每個儲存區的儲存空間;確定模組,用於根據上述計算得到的數值,確定傳輸進程佔用率低於預設值的儲存伺服器為空閒儲存伺服器,及確定該儲存伺服器中有剩餘儲存空間的儲存區;去重模組,用於當哈希資料庫中有哈希值與所述儲存伺服器中已儲存的資料塊的哈希值相同時,確定該哈希資料庫中該哈希值對應的資料塊為重復資料塊,通知相應用戶端所述儲存伺服器中已儲存該資料塊而無需再上傳該資料塊,並返回該重復資料塊的儲存指針給相應用戶端;及分配模組,用於將空閒儲存伺服器中有剩餘儲存空間的儲存區分配給去重後的各資料塊。
所述資料分塊儲存至分散式伺服器的方法,應用於一台分配伺服器中,該分配伺服器透過網路連接多個用戶端和多台儲存伺服器。該方法包括:接收步驟,接收用戶端上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,該哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;計算步驟,計算所述多台儲存伺服器的傳輸進程佔用率,及各儲存伺服器中每個儲存區的儲存空間;確定步驟,根據上述計算得到的數值,確定傳輸進程佔用率低於預設值的儲存伺服器為空閒儲存伺服器,及確定該空閒儲存伺服器中有剩餘儲存空間的儲存區;去重步驟,當哈希資料庫中有哈希值與所述儲存伺服器中已儲存的資料塊的哈希值相同時,確定哈希資料庫中該哈希值對應的資料塊為重復資料塊,通知相應用戶端無需再上傳該資料塊,並返回該重復資料塊的儲存指針給相應用戶端;及分配步驟,將空閒儲存伺服器中有剩餘儲存空間的儲存區分配給去重後的各資料塊。
相較於習知技術,所述資料分塊儲存至分散式伺服器的系統及方法,透過在伺服器集群中加入一個分配伺服器,使得各資料塊可以被合理地分配到一個儲存區,有效地節省了伺服器的儲存空間,使得伺服器的傳輸進程不會被一個用戶長期佔用,並加快了用戶上傳文檔的速度。
如圖1所示,是本發明資料分塊儲存至分散式伺服器的系統較佳實施例的運行環境示意圖。該資料分塊儲存至分散式伺服器的系統200運行於一台分配伺服器2中,該分配伺服器2透過網路連接多個用戶端1和一個分散式伺服器集群。該分散式伺服器集群中有多台儲存伺服器3。
該用戶端1透過網路連接一個分散式伺服器集群,即用戶端1透過網路與多台儲存伺服器3連接。該資料分塊儲存至分散式伺服器的系統200利用一個分配伺服器2,可以使得文檔中的資料塊被合理地分配到相應的儲存伺服器3內。
其中,所述分配伺服器2內置或外連接一個哈希資料庫4。本實施例以哈希資料庫4內置於分配伺服器2為例進行說明。
如圖2所示,是圖1中分配伺服器2的主要組成示意圖。該分配伺服器2主要包括儲存設備20和至少一台處理設備22。
所述儲存設備20用於儲存資料分塊儲存至分散式伺服器的系統200的電腦程式化代碼。該儲存設備20可以為用戶端1內置的記憶體,也可以為用戶端1外接的記憶體。
處理設備22用於執行所述資料分塊儲存至分散式伺服器的系統200的電腦程式代碼,實現資料塊的合理分配。
所述資料分塊儲存至分散式伺服器的系統200包括接收模組2000、計算模組2002、確定模組2004、去重模組2006和分配模組2008。本發明所稱的模組是完成一特定功能的電腦程式段,比程式更適合於描述軟體在電腦中的執行過程,因此在本發明以下對軟體描述都以模組描述。
所述接收模組2000用於接收用戶端1上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫4中。其中,所述文檔資訊包括文檔的名稱和文檔的屬性。每個文檔對應一個哈希列表,及每個文檔對應一個哈希值。
在接收哈希列表前,需要生成哈希列表。本實施例中的哈希列表透過以下步驟生成:首先,用戶端1將需要上傳至儲存伺服器3的文檔分割成多個資料塊;然後,按照分割順序將該多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中,並上傳該哈希列表至分配伺服器2,該分配伺服器2將該哈希列表存至哈希資料庫4中。本實施例中,所述資料塊的名稱可依據資料塊的哈希值來命名。
所述計算模組2002用於計算所述多台儲存伺服器3的傳輸進程佔用率,及各儲存伺服器3中每個儲存區的儲存空間。本實施例中,每台儲存伺服器3中有一個或多個儲存區。按照儲存伺服器3的容量及該儲存伺服器3內的儲存區數量,計算模組2002可以計算出每個儲存區的儲存空間。
所述確定模組2004用於根據上述計算得到的數值,確定傳輸進程佔用率低於預設值的儲存伺服器3為空閒儲存伺服器,及確定該儲存伺服器3中有剩餘儲存空間的儲存區。
所述去重模組2006用於將哈希資料庫4中的每個哈希值與各儲存伺服器3中已儲存的資料塊的哈希值進行比對。當該哈希資料庫4中有哈希值與所述儲存伺服器3中已儲存的資料塊的哈希值相同時,所述去重模組2006確定該哈希資料庫4中該哈希值對應的資料塊為重復資料塊,通知相應用戶端1所述儲存伺服器3中已儲存該資料塊而無需再上傳該資料塊,以免重複儲存,佔用儲存空間,及將該重復資料塊的儲存指針回饋給相應的用戶端1。該儲存指針是指資料塊具體儲存的儲存伺服器3及儲存區。
在用戶端1接收到資料塊的儲存指針後,會將去重後各資料塊上傳至相應的儲存伺服器3。例如,分配模組2008為資料塊b分配的儲存區為儲存伺服器3中的儲存區A,則用戶端1接收到該儲存指針時,將資料塊b上傳至儲存伺服器3。儲存伺服器3會對該資料塊進行校驗,通過校驗的資料塊才會被儲存到儲存伺服器3的儲存區內。
具體地,儲存伺服器3按照分配模組2008所分配的儲存區將去重後各資料塊存入相應的儲存區中,計算各資料塊的哈希值,然後將計算出的哈希值與哈希資料庫4中儲存於哈希列表中的相應資料塊的哈希值進行比對。例如,將計算出的資料塊a的哈希值與哈希列表中該資料塊a的哈希值進行比對。此處計算資料塊的哈希值所運用的方法可以為習知技術中的任意一種計算方法。因哈希值的計算方法為習知技術,在此不再贅述。當比對結果為相同時,儲存伺服器3返回各資料塊的儲存指針給用戶端1。當比對結果為不相同時,儲存伺服器3通知用戶端1重新上傳文檔,以更新該未通過校驗的資料塊。當校驗次數達到預設次數且校驗結果仍為不相同時,儲存伺服器3通知用戶端1文檔儲存失敗。導致文檔儲存的原因可能為網路延遲、木馬程式導致文檔被更改等。
如圖3所示,是本發明資料分塊儲存至分散式伺服器的方法較佳實施例的作業流程圖。
步驟S100,用戶端1將需要上傳至儲存伺服器3的文檔(如文檔A)分割成多個資料塊,並按照分割順序將該多個資料塊的名稱及各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中。其中,每個文檔對應一張哈希列表,及每個文檔對應一個哈希值。
在本實施例中,所述分割文檔的方法包括固定大小分塊、滑動塊分塊、可變分塊和全文檔分塊。本實施例中以固定大小分塊為例進行說明,即按照預設大小將文檔分割成多個資料塊。例如,將所述文檔A分割成資料塊a、b、c、d、e、f、g、h、i和j。
在此需要說明的是,每個文檔各對應一個哈希值。所述預設大小可以根據用戶的需求進行設定。例如,為了節省儲存空間,用戶可以將該預設大小設置成16K、32K、64K等,而為了提高儲存效率,用戶也可以將該預設大小設置成128K、256K。本實施例中,優選32K。
步驟S102,用戶端1上傳文檔資訊和哈希列表至分配伺服器2,接收模組2000接收該文檔資訊和哈希列表,並將該文檔資訊和哈希列表存至哈希資料庫4中。所述文檔的相關資訊包括文檔的名稱、文檔的屬性及資料塊的分割順序。
步驟S104,計算模組2002計算所述多台儲存伺服器3的傳輸進程佔用率,及各儲存伺服器3中每個儲存區的儲存空間。本實施例中,每台儲存伺服器3中有一個或多個儲存區。按照儲存伺服器3的容量及該儲存伺服器3內的儲存區數量,計算模組2002可以計算出每個儲存區的儲存空間。
步驟S106,所述確定模組2004根據上述計算得到的數值,確定傳輸進程佔用率低於預設值的儲存伺服器3為空閒儲存伺服器,及確定該儲存伺服器3中有剩餘儲存空間的儲存區。
步驟S108,當哈希資料庫4中有哈希值與所述儲存伺服器3中已儲存的資料塊的哈希值相同時,所述去重模組2006確定該哈希資料庫4中該哈希值對應的資料塊為重復資料塊,通知相應用戶端1所述儲存伺服器3中已儲存該資料塊而無需再上傳該資料塊。在此步驟S108中,去重模組2006還會將所述重復資料塊的儲存指針直接回饋給相應的用戶端1。
具體地,去重模組2006將哈希資料庫4中的每個哈希值與儲存伺服器3中已儲存的資料塊的哈希值進行比對,若比對結果為哈希資料庫4和儲存伺服器3中有相同哈希值時,確定哈希資料庫4中的該哈希值對應的資料塊與儲存伺服器3中的資料塊重複。用戶端1的用戶無需再上傳該資料塊。此處,比對、確定及通知過程即為去重。
步驟S110,所述分配模組2008將空閒儲存伺服器中有剩餘儲存空間的儲存區分配給去重後的各資料塊。
步驟S112,用戶端1將去重後各資料塊(即除了所述重復資料塊外的所有資料塊)傳輸給分配伺服器2,相應的儲存伺服器3接收用戶端1透過分配伺服器2傳輸的資料塊。例如,分配模組2008為資料塊b分配的儲存區為儲存伺服器3中的儲存區A,則用戶端1將資料塊b傳輸至儲存伺服器3。
步驟S114,儲存伺服器3按照分配模組2008所分配的儲存區將該通過校驗的資料塊寫入相應的儲存區內,計算各資料塊的哈希值,並將計算出的哈希值與哈希資料庫4中存於哈希列表內的相應資料塊的哈希值進行比對,以對資料塊進行校驗。例如,將計算出的資料塊a的哈希值與哈希列表中該資料塊a的哈希值進行比對。
當校驗結果為計算出的哈希值與哈希列表中相應資料塊的哈希值相同時,於步驟S116,儲存伺服器3返回通過校驗的各資料塊的儲存指針給用戶端1。
當校驗結果為計算出的哈希值與哈希列表中相應資料塊的哈希值不相同時,於步驟S118,儲存伺服器3通知用戶端1重新上傳文檔,以更新該未通過校驗的資料塊。具體地,儲存伺服器3利用重新上傳的文檔中通過校驗的相應資料塊覆蓋掉該未通過校驗的資料塊,或者,儲存伺服器3先將該未通過校驗的資料塊從儲存區中刪除掉,然後將重新上傳的文檔中通過過校驗的相應資料塊存入該儲存區中。
如圖4所示,是本發明用戶於用戶端1下載儲存伺服器3中文檔的作業流程圖。
步驟S200,用戶端1根據要下載的文檔的相關資訊(即圖2和圖3中所述的文檔資訊)從哈希資料庫4中該文檔對應哈希列表內獲取各資料塊的哈希值。
步驟S202,根據該文檔各資料塊的儲存指針從相應的儲存區下載資料塊。
步驟S204,校驗各資料塊的哈希值與從哈希資料庫4的哈希列表中獲取的相應資料塊的哈希值是否相同。
當校驗結果為不同時,流程返回至步驟S200,重新獲取哈希值及重新下載資料塊。
當校驗結果為相同時,步驟S206,用戶端1將通過校驗的資料塊寫入臨時儲存區中。
步驟S208,按照所述資料塊的分割順序將上述通過校驗的資料塊進行排序組合,生成文檔。
步驟S210,校驗組合後文檔的哈希值與圖3步驟S100中文檔的哈希值是否相同。
當校驗結果為相同時,於步驟S212,將通過校驗的文檔返回給用戶端1的用戶。當校驗結果為不同時,流程返回至步驟S200。
最後所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制,儘管參照以上較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或等同替換,而不脫離本發明技術方案的精神和範圍。
1...用戶端
2...分配伺服器
20...儲存設備
22...處理設備
3...儲存伺服器
4...哈希資料庫
200...資料分塊儲存至分散式伺服器的系統
2000...接收模組
2002...計算模組
2004...確定模組
2006...去重模組
2008...分配模組
圖1是本發明資料分塊儲存至分散式伺服器的系統較佳實施例的運行環境示意圖。
圖2是圖1中分配伺服器的主要組成示意圖。
圖3是本發明資料分塊儲存至分散式伺服器的方法較佳實施例的作業流程圖。
圖4是本發明用戶於用戶端下載儲存伺服器中文檔的作業流程圖。
2...分配伺服器
20...儲存設備
22...處理設備
200...資料分塊儲存至分散式伺服器的系統
2000...接收模組
2002...計算模組
2004...確定模組
2006...去重模組
2008...分配模組

Claims (10)

  1. 一種資料分塊儲存至分散式伺服器的方法,應用於一台分配伺服器中,該分配伺服器透過網路連接多個用戶端和多台儲存伺服器,該方法包括:
    接收步驟,接收用戶端上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,該哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;
    計算步驟,計算所述多台儲存伺服器的傳輸進程佔用率,及各儲存伺服器中每個儲存區的儲存空間;
    確定步驟,根據上述計算得到的數值,確定傳輸進程佔用率低於預設值的儲存伺服器為空閒儲存伺服器,及確定該空閒儲存伺服器中有剩餘儲存空間的儲存區;
    去重步驟,當哈希資料庫中有哈希值與所述儲存伺服器中已儲存的資料塊的哈希值相同時,確定哈希資料庫中該哈希值對應的資料塊為重復資料塊,通知相應用戶端無需再上傳該資料塊,並返回該重復資料塊的儲存指針給相應用戶端;及
    分配步驟,將空閒儲存伺服器中有剩餘儲存空間的儲存區分配給去重後的各資料塊。
  2. 如申請專利範圍第1項所述之資料分塊儲存至分散式伺服器的方法,該方法還包括:
    所述用戶端將需要上傳至儲存伺服器的文檔分割成多個資料塊,並按照分割順序將該多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中;及
    上傳該哈希列表至分配伺服器。
  3. 如申請專利範圍第1項所述之資料分塊儲存至分散式伺服器的方法,還包括:
    儲存伺服器接收用戶端透過分配伺服器上傳的資料塊;
    將各資料塊寫入相應的儲存區;
    校驗各資料塊的哈希值與哈希資料庫中相應資料塊的哈希值是否相同;
    當校驗結果為相同時,返回通過校驗的各資料塊的儲存指針給相應用戶端;
    當校驗結果為不相同時,通知用戶端重新上傳文檔,以更新該未通過校驗的資料塊;及
    當校驗次數達到預設次數且校驗結果仍為不相同時,通知用戶端儲存失敗。
  4. 如申請專利範圍第1項所述之資料分塊儲存至分散式伺服器的方法,其中所述文檔資訊包括文檔的名稱、文檔的屬性。
  5. 如申請專利範圍第1項所述之資料分塊儲存至分散式伺服器的方法,當用戶需要透過用戶端從儲存伺服器下載文檔時,所述用戶端執行以下步驟:
    從哈希資料庫中獲取各資料塊的哈希值;
    根據各資料塊的儲存指針從相應的儲存區下載各資料塊;
    校驗各資料塊的哈希值與從哈希資料庫中獲取的相應資料塊的哈希值是否相同;
    當校驗結果為相同時,將通過校驗的資料塊寫入臨時儲存區中;
    按照所述資料塊的分割順序將上述通過校驗的資料塊進行排序組合,生成文檔;及
    校驗組合後文檔的哈希值與用戶端上傳的文檔的哈希值是否相同,當校驗結果為相同時,將通過校驗的文檔返回給用戶端的用戶。
  6. 一種資料分塊儲存至分散式伺服器的系統,運行於一台分配伺服器中,該分配伺服器透過網路連接多個用戶端和多台儲存伺服器,該系統包括:
    接收模組,用於接收用戶端上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,該哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;
    計算模組,用於計算所述多台儲存伺服器的傳輸進程佔用率,及各儲存伺服器中每個儲存區的儲存空間;
    確定模組,用於根據上述計算得到的數值,確定傳輸進程佔用率低於預設值的儲存伺服器為空閒儲存伺服器,及確定該儲存伺服器中有剩餘儲存空間的儲存區;
    去重模組,用於當哈希資料庫中有哈希值與所述儲存伺服器中已儲存的資料塊的哈希值相同時,確定該哈希資料庫中該哈希值對應的資料塊為重復資料塊,通知相應用戶端所述儲存伺服器中已儲存該資料塊而無需再上傳該資料塊,並返回該重復資料塊的儲存指針給相應用戶端;及
    分配模組,用於將空閒儲存伺服器中有剩餘儲存空間的儲存區分配給去重後的各資料塊。
  7. 如申請專利範圍第6項所述之資料分塊儲存至分散式伺服器的系統,其中所述用戶端用於:
    將需要上傳至儲存伺服器的文檔分割成多個資料塊,並按照分割順序將該多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中;及
    上傳該哈希列表至分配伺服器。
  8. 如申請專利範圍第6項所述之資料分塊儲存至分散式伺服器的系統,其中所述儲存伺服器在接收到用戶端透過分配伺服器上傳的資料塊時,用於:
    將各資料塊寫入相應的儲存區;
    校驗各資料塊的哈希值與哈希資料庫中相應資料塊的哈希值是否相同;
    當校驗結果為相同時,返回通過校驗的各資料塊的儲存指針給相應用戶端;
    當校驗結果為不相同時,通知用戶端重新上傳文檔,以更新該未通過校驗的資料塊;及
    當校驗次數達到預設次數且校驗結果仍為不相同時,通知用戶端儲存失敗。
  9. 如申請專利範圍第6項所述之資料分塊儲存至分散式伺服器的系統,其中所述文檔資訊包括文檔的名稱、文檔的屬性。
  10. 如申請專利範圍第6項所述之資料分塊儲存至分散式伺服器的系統,當用戶需要透過用戶端從儲存伺服器下載文檔時,所述用戶端還用於:
    從哈希資料庫中獲取各資料塊的哈希值;
    根據各資料塊的儲存指針從相應的儲存區下載各資料塊;
    校驗各資料塊的哈希值與從哈希資料庫中獲取的相應資料塊的哈希值是否相同;
    當校驗結果為相同時,將通過校驗的資料塊寫入臨時儲存區中;
    按照所述資料塊的分割順序將上述通過校驗的資料塊進行排序組合,生成文檔;及
    校驗組合後文檔的哈希值與用戶端上傳的文檔的哈希值是否相同,當校驗結果為相同時,將通過校驗的文檔返回給用戶端的用戶。
TW101148554A 2012-12-12 2012-12-20 資料分塊儲存至分散式伺服器的系統及方法 TW201423425A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210533979.XA CN103873504A (zh) 2012-12-12 2012-12-12 数据分块存储至分布式服务器的系统及方法

Publications (1)

Publication Number Publication Date
TW201423425A true TW201423425A (zh) 2014-06-16

Family

ID=50882191

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101148554A TW201423425A (zh) 2012-12-12 2012-12-20 資料分塊儲存至分散式伺服器的系統及方法

Country Status (3)

Country Link
US (1) US20140164487A1 (zh)
CN (1) CN103873504A (zh)
TW (1) TW201423425A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709609B2 (en) 2020-03-27 2023-07-25 Via Technologies, Inc. Data storage system and global deduplication method thereof
TWI815086B (zh) * 2020-03-27 2023-09-11 威盛電子股份有限公司 資料儲存系統及其全域去重複方法

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326252B (zh) * 2015-06-24 2020-05-22 中兴通讯股份有限公司 数据库的数据处理方法及装置
CN105335463B (zh) * 2015-09-23 2018-09-25 广州市中崎商业机器股份有限公司 一种用于收款机的数据存储方法和快速读取方法
CN105183399A (zh) * 2015-09-30 2015-12-23 北京奇艺世纪科技有限公司 一种基于弹性块存储的数据写、读方法及装置
EP3384406A4 (en) * 2015-12-04 2018-11-14 Hewlett-Packard Enterprise Development LP Combining hashes of data blocks
CN106874272B (zh) * 2015-12-10 2020-02-14 华为技术有限公司 一种分布式连接方法及系统
CN107133227A (zh) * 2016-02-26 2017-09-05 宏碁股份有限公司 为上传文件推荐云端存储装置的方法及使用该方法的装置
CN106101257B (zh) * 2016-07-07 2019-07-02 广东工业大学 一种基于布隆过滤器的云存储数据管理方法及装置
CN106446077A (zh) * 2016-09-07 2017-02-22 乐视控股(北京)有限公司 一种对象上传方法和电子设备
CN108241640B (zh) * 2016-12-23 2022-04-08 中科星图股份有限公司 一种分布式的文件存储方法
CN107135264B (zh) * 2017-05-12 2020-09-08 成都优孚达信息技术有限公司 用于嵌入式设备的数据编码方法
CN107707600B (zh) * 2017-05-26 2018-09-18 贵州白山云科技有限公司 一种数据存储方法及装置
CN108563396B (zh) * 2017-12-11 2020-12-25 上海高顿教育科技有限公司 一种安全的云端对象存储方法
CN108563649B (zh) * 2017-12-12 2021-12-07 南京富士通南大软件技术有限公司 基于GlusterFS分布式文件系统的离线去重方法
CN109324897A (zh) * 2018-08-24 2019-02-12 平安科技(深圳)有限公司 数据上传方法及系统、终端和计算机可读存储介质
CN109324998A (zh) * 2018-09-18 2019-02-12 郑州云海信息技术有限公司 一种文件处理方法、装置及系统
CN109376122A (zh) * 2018-09-25 2019-02-22 深圳市元征科技股份有限公司 一种文件管理方法、系统及区块链节点设备和存储介质
CN111857534A (zh) * 2019-04-24 2020-10-30 北京嘀嘀无限科技发展有限公司 一种数据传输方法、数据存储服务器及数据存储系统
CN110209656B (zh) * 2019-04-26 2022-05-17 北京互金新融科技有限公司 数据处理方法及装置
CN110263060B (zh) * 2019-06-06 2021-04-23 零搜科技(深圳)有限公司 一种erp电子附件管理方法及计算机设备
CN112099728B (zh) * 2019-06-18 2022-09-16 华为技术有限公司 一种执行写操作、读操作的方法及装置
CN110224841A (zh) * 2019-06-26 2019-09-10 北京小米移动软件有限公司 应用包的下载方法、装置、设备及可读存储介质
CN110618974A (zh) * 2019-09-06 2019-12-27 苏州浪潮智能科技有限公司 一种数据存储方法、装置、设备及存储介质
CN110674116B (zh) * 2019-09-25 2022-05-03 四川长虹电器股份有限公司 一种基于swoole的校验插入数据库数据重复的系统及方法
CN112685219A (zh) * 2019-10-17 2021-04-20 伊姆西Ip控股有限责任公司 用于备份数据的方法、设备和计算机程序产品
CN110909187B (zh) * 2019-11-07 2023-01-10 苏州浪潮智能科技有限公司 图像存储方法、图像读取方法、图像存储器及存储介质
CN111241195B (zh) * 2020-01-02 2023-03-21 腾讯云计算(北京)有限责任公司 分布式系统的数据库处理方法、装置、设备及存储介质
CN113273163A (zh) * 2020-05-26 2021-08-17 深圳元戎启行科技有限公司 文件上传方法、文件下载方法和文件管理装置
CN111897492B (zh) * 2020-07-15 2023-02-28 杭州海康威视系统技术有限公司 一种基于块设备驱动的数据处理方法、装置及电子设备
CN114138756B (zh) * 2020-09-03 2023-03-24 金篆信科有限责任公司 数据去重方法、节点及计算机可读存储介质
CN112667620A (zh) * 2020-12-31 2021-04-16 广州方硅信息技术有限公司 数据处理方法、装置、计算机设备及存储介质
CN112968958A (zh) * 2021-02-19 2021-06-15 携程计算机技术(上海)有限公司 Ota网站中附件的处理方法、系统、设备及介质
CN113111043B (zh) * 2021-04-21 2023-05-23 北京大学 一种中台源数据文件的处理方法、装置、系统及存储介质
CN113741818A (zh) * 2021-09-09 2021-12-03 海南安迈云网络技术有限公司 一种数据分离及分散存储的方法
CN114785795A (zh) * 2022-04-02 2022-07-22 北京蓝海在线科技有限公司 分布式存储方法、系统、设备、存储介质及信息处理终端
CN115002103B (zh) * 2022-08-04 2022-11-29 正链科技(深圳)有限公司 一种分布式网络中数据极速传输的方法及系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2878673B1 (fr) * 2004-11-26 2007-02-09 Univ Picardie Jules Verne Etab Systeme et procede de sauvegarde distribuee perenne
US8504775B2 (en) * 2007-03-12 2013-08-06 Citrix Systems, Inc Systems and methods of prefreshening cached objects based on user's current web page
CN101163046A (zh) * 2007-11-22 2008-04-16 北京金山软件有限公司 一种分布式网站日志数据采集方法和分布式网站系统
US8019882B2 (en) * 2008-06-27 2011-09-13 Microsoft Corporation Content identification for peer-to-peer content retrieval
US8805953B2 (en) * 2009-04-03 2014-08-12 Microsoft Corporation Differential file and system restores from peers and the cloud
CN101539950A (zh) * 2009-05-08 2009-09-23 成都市华为赛门铁克科技有限公司 数据存取方法和装置
CN102347969B (zh) * 2010-08-03 2014-07-09 李祥宇 云端资料储存系统
CN102446250A (zh) * 2010-10-13 2012-05-09 索尼公司 数据完整性的保护和验证方法、设备和系统
CN101976322B (zh) * 2010-11-11 2012-05-23 清华大学 基于一种完整性校验的安全元数据管理方法
CN102130939A (zh) * 2010-12-10 2011-07-20 创新科存储技术有限公司 一种远程复制方法及装置
TW201224805A (en) * 2010-12-15 2012-06-16 Inventec Corp A method of building the index of the data blocks
CN102325167A (zh) * 2011-07-21 2012-01-18 杭州微元科技有限公司 一种网络文件传输的校验方法
CN102801784B (zh) * 2012-07-03 2015-11-25 华为技术有限公司 一种分布式数据存储方法及设备
CN103873438A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 压缩包上传去重系统及方法
CN103873507A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 数据分块上传与存储系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709609B2 (en) 2020-03-27 2023-07-25 Via Technologies, Inc. Data storage system and global deduplication method thereof
TWI815086B (zh) * 2020-03-27 2023-09-11 威盛電子股份有限公司 資料儲存系統及其全域去重複方法

Also Published As

Publication number Publication date
US20140164487A1 (en) 2014-06-12
CN103873504A (zh) 2014-06-18

Similar Documents

Publication Publication Date Title
TW201423425A (zh) 資料分塊儲存至分散式伺服器的系統及方法
US11734125B2 (en) Tiered cloud storage for different availability and performance requirements
TWI594138B (zh) 壓縮包上傳去重系統及方法
US9110603B2 (en) Identifying modified chunks in a data set for storage
US10019459B1 (en) Distributed deduplication in a distributed system of hybrid storage and compute nodes
KR101885688B1 (ko) 낮은 지연속도 데이터 액세스를 위한 데이터 스트림의 분할
TWI528191B (zh) File Handling Method Based on Cloud Storage, System and Server Cluster System
TW201423426A (zh) 資料分塊上傳與儲存系統及方法
TWI477981B (zh) 儲存集群中的資料塊去重系統及方法
US9305005B2 (en) Merging entries in a deduplication index
US9400792B1 (en) File system inline fine grained tiering
CN110347651B (zh) 基于云存储的数据同步方法、装置、设备及存储介质
US20140052952A1 (en) Managing dereferenced chunks in a deduplication system
CA3068345C (en) Witness blocks in blockchain applications
EP3610392B1 (en) Micro-service based deduplication
US10541936B1 (en) Method and system for distributed analysis
US10795860B1 (en) WAN optimized micro-service based deduplication
US11442927B1 (en) Storage performance-based distribution of deduplicated data to nodes within a clustered storage environment
CN111966649A (zh) 一种高效去重的轻量级在线文件存储方法及装置
CN114730307A (zh) 智能数据池
CN103744882A (zh) 一种基于键值对的目录片段表示方法及装置
US11003629B2 (en) Dual layer deduplication for application specific file types in an information processing system
US10083121B2 (en) Storage system and storage method
US11019146B2 (en) Segmenting and merging data in a dispersed storage network
US11170000B2 (en) Parallel map and reduce on hash chains