TW201423426A - 資料分塊上傳與儲存系統及方法 - Google Patents

資料分塊上傳與儲存系統及方法 Download PDF

Info

Publication number
TW201423426A
TW201423426A TW101148555A TW101148555A TW201423426A TW 201423426 A TW201423426 A TW 201423426A TW 101148555 A TW101148555 A TW 101148555A TW 101148555 A TW101148555 A TW 101148555A TW 201423426 A TW201423426 A TW 201423426A
Authority
TW
Taiwan
Prior art keywords
data block
hash
data
hash value
document
Prior art date
Application number
TW101148555A
Other languages
English (en)
Inventor
Zhi-Quan Chai
Da-Peng Li
Hai-Hong Lin
Chung-I Lee
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201423426A publication Critical patent/TW201423426A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一種資料分塊上傳與儲存系統及方法,該方法包括:將多個用戶端同時上傳的文檔資訊和文檔的哈希列表存至哈希資料庫中;設置各用戶端中資料塊的上傳順序;判斷所述哈希資料庫中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢;當有相同哈希值的資料塊正在傳輸或已經傳輸完畢時,判定該資料塊為重復資料塊,跳過該重復資料塊,確定上傳順序中的下一個資料塊為該用戶端的待傳輸資料塊。

Description

資料分塊上傳與儲存系統及方法
本發明涉及一種雲端技術,尤其涉及一種透過雲端技術將資料分塊上傳與儲存的系統及方法。
在雲儲存過程中,經常會遇到多個用戶同時上傳完全相同或者部份相同的文檔,這會佔用多餘的伺服器與用戶的傳輸帶寬,消耗伺服器過多的傳輸資源,並且使用戶佔用伺服器傳輸進程時間過長。
鑒於以上內容,有必要提供一種資料分塊上傳與儲存系統及方法,其可有效地減少伺服器與用戶的傳輸帶寬消耗,使資料傳輸更有效率,節約了網路資源。
所述資料分塊上傳與儲存系統,運行於一台塊傳輸分配器中,該塊傳輸分配器透過網路連接多個用戶端和一台儲存伺服器。該系統包括:接收模組,用於接收所述多個用戶端同時上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,每個文檔對應一張哈希列表,所述哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;設置模組,用於設置各用戶端中資料塊的上傳順序;判斷模組,用於判斷所述哈希資料庫中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢;去重模組,用於當有哈希值相同的資料塊正在傳輸或已經傳輸完畢時,判定該資料塊為重復資料塊,跳過該重復資料塊,確定上傳順序中的下一個資料塊為該用戶端的待傳輸資料塊;及上傳模組,用於當哈希資料庫中沒有與待傳輸資料塊的哈希值相同的哈希值,或者該哈希資料庫中有與待傳輸資料塊的哈希值相同的哈希值但該相同的哈希值對應的資料塊未正在傳輸或未已經傳輸完畢時,通知用戶將該待傳輸資料塊上傳至所述儲存伺服器的儲存區中,該儲存區內有多個資料區域。
所述資料分塊上傳與儲存方法,應用於一台塊傳輸分配器中,該塊傳輸分配器透過網路連接多個用戶端和一台儲存伺服器。所述方法包括:接收步驟,接收所述多個用戶端同時上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,每個文檔對應一張哈希列表,所述哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;設置步驟,設置各用戶端中資料塊的上傳順序;判斷步驟,判斷所述哈希資料庫中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢;去重步驟,當有哈希值相同的資料塊正在傳輸或已經傳輸完畢時,判定該資料塊為重復資料塊,跳過該重復資料塊,確定上傳順序中的下一個資料塊為該用戶端的待傳輸資料塊,流程返回至判斷步驟;及上傳步驟,當哈希資料庫中沒有與待傳輸資料塊的哈希值相同的哈希值,或者該哈希資料庫中有與待傳輸資料塊的哈希值相同的哈希值但該相同的哈希值對應的資料塊未正在傳輸或未已經傳輸完畢時,通知用戶將該待傳輸資料塊上傳至所述儲存伺服器的儲存區中,該儲存區內有多個資料區域。
相較於習知技術,所述資料分塊上傳與儲存系統及方法,透過在伺服器集群中加入一個分配器,使伺服器在併發傳輸中可以擇優計算各用戶文檔的分塊資訊,以使得多個用戶在文檔的傳輸過程中分別上傳不同的文檔塊,伺服器從而不會接收重復資料塊。
如圖1所示,是本發明資料分塊上傳與儲存系統較佳實施例的運行環境示意圖。該資料分塊上傳與儲存系統200運行於一台塊傳輸分配器2中,該塊傳輸分配器2透過網路連接多個用戶端1和一台儲存伺服器3。
該塊傳輸分配器2可以避免多個用戶同時上傳文檔時儲存伺服器3接收到重復資料塊的情況發生。
其中,所述塊傳輸分配器2內置或外連接一個哈希資料庫4。本實施例以哈希資料庫4內置於塊傳輸分配器2為例進行說明。
如圖2所示,是圖1中塊傳輸分配器2的主要組成示意圖。該塊傳輸分配器2主要包括儲存設備20和至少一台處理設備22。
所述儲存設備20用於儲存資料分塊上傳與儲存系統200的電腦程式化代碼。該儲存設備20可以為用戶端1內置的記憶體,也可以為用戶端1外接的記憶體。
處理設備22用於執行所述資料分塊上傳與儲存系統200的電腦程式代碼,合理調整資料塊的傳輸,避免相同資料塊被多次上傳及儲存。
所述資料分塊上傳與儲存系統200包括接收模組2000、設置模組2002、判斷模組2004、去重模組2006和上傳模組2008。本發明所稱的模組是完成一特定功能的電腦程式段,比程式更適合於描述軟體在電腦中的執行過程,因此在本發明以下對軟體描述都以模組描述。
所述接收模組2000用於接收所述多個用戶端1同時上傳的文檔資訊和文檔的哈希列表,並將其儲存到哈希資料庫4中。其中,所述文檔資訊包括文檔的名稱和文檔的屬性。每個文檔對應一個哈希列表,及每個文檔對應一個哈希值(hash)。
在接收哈希列表前,需要先生成哈希列表。本實施例中的哈希列表透過以下步驟生成:首先,各用戶端1將需要上傳至儲存伺服器3的文檔分割成多個資料塊;然後,按照分割順序將該多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中,並上傳該哈希列表至塊傳輸分配器2,該塊傳輸分配器2將各文件的哈希列表存至哈希資料庫4中。
所述設置模組2002用於設置各用戶端1中資料塊的上傳順序。該上傳順序可以被設置為所述資料塊的分割順序,或者該分割順序的逆向順序。本實施例以將上傳順序設置成資料塊的分割順序為例進行說明。
所述判斷模組2004用於判斷所述哈希資料庫4中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢。例如,資料塊f為B用戶端的待傳輸資料塊,判斷模組2004從哈希資料庫4中尋找是否有與該資料塊f的哈希值相同的哈希值(不包括B用戶端待傳輸的資料塊f的哈希值本身),如找到C用戶端傳輸的資料塊f的哈希值,且C客戶端正在傳輸該資料塊f或者該資料塊f已經被傳輸完畢。
當有哈希值相同的資料塊正在傳輸或傳輸完畢時,所述去重模組2006用於判定該資料塊為重復資料塊,跳過該重復資料塊,確定分割順序中的下一個資料塊為待傳輸資料塊。
需要說明的是,哈希值相同的兩個資料塊實質為有相同內容的資料塊。跳過該哈希值相同的資料塊,可以避免相同資料塊被重複上傳與儲存。
當哈希資料庫4中沒有與所述待傳輸資料塊的哈希值相同的哈希值,或者該哈希資料庫4中有與所述待傳輸資料塊的哈希值相同的哈希值但該相同的哈希值對應的資料塊未正在傳輸或已經傳輸時,所述上傳模組2008用於通知用戶將該待傳輸資料塊上傳至所述儲存伺服器3的儲存區30中。其中,所述儲存區30內有多個資料區域,每個資料區域可以預先設定一個編號,如data 1,data 2,data 3等。
所述回饋模組2010用於返回各資料塊的儲存指針給相應的用戶端1,該儲存指針是指資料塊儲存在所述儲存區內的資料區域的編號。
另外,所述各資料塊的儲存指針的編號還會被儲存到哈希資料庫4內的相應哈希列表中。所有文檔的哈希列表組合在一起,可以生成一個文檔索引表。
需要說明的是,所述上傳至儲存伺服器3中的資料塊會被隨機儲存到儲存區30的資料區域內,記錄各資料塊所儲存的資料區域,可以方便用戶在讀取文檔時快速地從儲存區30中下載到所需要的文檔。
在儲存伺服器3接收到所述資料塊後,會校驗各資料塊,未通過校驗的資料塊將從儲存區30內被刪除掉,或者利用用戶重新上傳的資料塊來覆蓋掉。具體地,儲存伺服器3計算各資料塊的哈希值,將計算出的哈希值與哈希資料庫4中儲存於哈希列表中的相應資料塊的哈希值進行比對。例如,將計算出的資料塊a的哈希值與哈希列表中該資料塊a的哈希值進行比對。此處計算資料塊的哈希值所運用的方法可以為現有技術中的任意一種計算方法。因哈希值的計算方法為現有技術,在此不再贅述。當比對結果為不相同時,儲存伺服器3通知用戶端1重新上傳資料塊。當校驗次數達到預設次數且校驗結果仍為不相同時,儲存伺服器3通知用戶端1儲存失敗。導致儲存失敗的原因可能為網路延遲、木馬程式導致文檔被更改等。
如圖3所示,是本發明資料分塊上傳與儲存方法較佳實施例的作業流程圖。
步驟S100,當有多個用戶端1同時上傳文檔至儲存伺服器3中時,各用戶端1將文檔(如文檔A)分割成多個資料塊,並按照分割順序將該多個資料塊的名稱及各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中。其中,每個文檔對應一張哈希列表,及每個文檔對應一個哈希值。
在本實施例中,所述分割文檔的方法包括固定大小分塊、滑動塊分塊、可變分塊和全文件分塊。本實施例中以固定大小分塊為例進行說明,即按照預設大小將文檔分割成多個資料塊。如圖4所示,將所述文檔A分割成資料塊a、b、c、d、e、f、g、h、i和j。
所述預設大小可以根據用戶的需求進行設定。例如,為了節省儲存空間,用戶可以將該預設大小設置成16K、32K、64K等,而為了提高儲存效率,用戶也可以將該預設大小設置成128K、256K。本實施例中,優選32K。
步驟S102,各用戶端1同時上傳文檔資訊和哈希列表至塊傳輸分配器2,接收模組2000接收該多個用戶端1同時上傳的文檔資訊和哈希列表,並將該文檔資訊和哈希列表存至哈希資料庫4中。所述文檔的相關資訊包括文檔的名稱、文檔的屬性及資料塊的分割順序。
步驟S104,所述設置模組2002設置各用戶端1中資料塊的上傳順序。本實施例以將上傳順序設置成資料塊的分割順序為例進行說明。
步驟S106,當有資料塊待傳輸時,判斷模組2004判斷所述哈希資料庫4中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢。此處,哈希值相同的資料塊實質為內容相同的資料塊。
當步驟S106中的判斷結果為有哈希值相同的資料塊正在傳輸或已經傳輸完畢時,步驟S108,去重模組2006判定該資料塊為重復資料塊,跳過該重復資料塊,確定上傳順序中的下一個資料塊為待傳輸資料塊。
例如,圖4所示的A用戶端和B用戶端上傳的文檔相同,均為文檔A,分割後的資料塊也相同,均包括:資料塊a、b、c、d、e、f、g、h、i和j。假設A用戶端和B用戶端的資料塊上傳順序都被設置為資料塊的分割順序,由於A用戶端和B用戶端的傳輸速率不同,因此,當同時上傳文檔時,傳輸速率較高的用戶端(如A用戶端)會優先上傳資料塊a,而在B用戶端檢測到資料塊a被A客戶端正在傳輸或已經傳輸完畢時,去重模組2006跳過該資料塊a,將資料塊b確定為B用戶端的待傳輸資料塊,以此類推。
再比如,圖4所示的C用戶端上傳的文件為文件B,與B用戶端上傳的文檔A部分相同,如B用戶端的文檔A和C用戶端的文件B有重復資料塊f、g、h、i和j。假設B用戶端和C用戶端的資料塊上傳順序都被設置為資料塊的分割順序,由於B用戶端的傳輸速率高於C用戶端,因此,當同時上傳文檔時,當B用戶端傳輸完資料塊a、b、c、d和e時,確定資料塊f為待傳輸資料塊,此時,若B用戶端檢測到與該資料塊f的哈希值相同的文檔B中的資料塊f正在被傳輸或已經傳輸完畢,則去重模組2006會跳過該資料塊f,確定下一個資料塊g為B用戶端的待傳輸資料塊,以此類推。
當哈希資料庫4中沒有與待傳輸資料塊的哈希值相同的哈希值,或者該哈希資料庫4中有與待傳輸資料塊的哈希值相同的哈希值但該相同的哈希值對應的資料塊未正在傳輸或未已經被傳輸完畢時,步驟S110,上傳模組2008通知用戶將所述待傳輸資料塊上傳至所述儲存伺服器3的儲存區30中。其中,所述儲存區30內有多個資料區域,每個資料區域可以預先設定一個編號,如data 1,data 2,data 3等。上傳至儲存區30內的資料塊會被隨機儲存到一個資料區域中。
步驟S112,儲存伺服器3計算各資料塊的哈希值,將計算出的哈希值與哈希資料庫4中儲存於哈希列表中的相應資料塊的哈希值進行比對,以對各資料塊進行校驗。當校驗結果為相同時,流程進入步驟S114。當校驗結果為不相同時,流程進入步驟S116。
步驟S114,儲存伺服器3將通過校驗的各資料塊的儲存指針返回給相應的用戶端1,該儲存指針是指資料塊儲存在所述儲存區內的資料區域的編號。
步驟S116,儲存伺服器3通知用戶端1重新上傳該資料塊,並利用重新上傳的該資料塊更新所述未通過校驗的資料塊。
具體地,儲存伺服器3利用重新上傳的資料塊覆蓋掉所述未通過校驗的資料塊,或者,儲存伺服器3先將所述未通過校驗的資料塊從儲存區中刪除掉,然後將重新上傳的資料塊存入該儲存區中。
需要說明的是,當經過步驟S112的資料塊的校驗次數達到預設次數且校驗結果仍為不相同時,儲存伺服器3通知用戶端1儲存失敗。導致儲存失敗的原因可能為網路延遲、木馬程式導致文檔被更改等。
如圖5所示,是本發明用戶於用戶端1讀取儲存伺服器3中文檔的作業流程圖。
步驟S200,用戶端1根據要下載的文檔的相關資訊(即圖2和圖3中所述的文檔資訊)從哈希資料庫4中該文檔對應哈希列表內獲取各資料塊的哈希值。
步驟S202,根據該文檔各資料塊的儲存指針從儲存區30內的相應資料區域下載資料塊。
步驟S204,校驗各資料塊的哈希值與從哈希資料庫4的哈希列表中獲取的相應資料塊的哈希值是否相同。
當校驗結果為不同時,流程返回至步驟S200,重新獲取哈希值及重新下載資料塊。
當校驗結果為相同時,步驟S206,用戶端1按照所述資料塊的分割順序將上述通過校驗的資料塊進行排序組合,生成文檔。
步驟S208,校驗組合後文檔的哈希值與圖3步驟S100中文檔的哈希值是否相同。
當校驗結果為相同時,於步驟S210,將通過校驗的文檔返回給用戶端1的用戶。當校驗結果為不同時,流程返回至步驟S200。
最後所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制,儘管參照以上較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或等同替換,而不脫離本發明技術方案的精神和範圍。
1...用戶端
2...塊傳輸分配器
20...儲存設備
22...處理設備
3...儲存伺服器
30...儲存區
4...哈希資料庫
200...資料分塊上傳與儲存系統
2000...接收模組
2002...設置模組
2004...判斷模組
2006...去重模組
2008...上傳模組
圖1是本發明資料分塊上傳與儲存系統較佳實施例的運行環境示意圖。
圖2是圖1中塊傳輸分配器的主要組成示意圖。
圖3是本發明資料分塊上傳與儲存方法較佳實施例的作業流程圖。
圖4舉例說明多個用戶端向儲存伺服器上傳重復資料塊的示意圖。
圖5是本發明用戶於用戶端讀取儲存伺服器中文檔的作業流程圖。
2...塊傳輸分配器
20...儲存設備
22...處理設備
200...資料分塊上傳與儲存系統
2000...接收模組
2002...設置模組
2004...判斷模組
2006...去重模組
2008...上傳模組

Claims (10)

  1. 一種資料分塊上傳與儲存方法,應用於一台塊傳輸分配器中,該塊傳輸分配器透過網路連接多個用戶端和一台儲存伺服器,該方法包括:
    接收步驟,接收所述多個用戶端同時上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,每個文檔對應一張哈希列表,所述哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;
    設置步驟,設置各用戶端中資料塊的上傳順序;
    判斷步驟,判斷所述哈希資料庫中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢;
    去重步驟,當有哈希值相同的資料塊正在傳輸或已經傳輸完畢時,判定該資料塊為重復資料塊,跳過該重復資料塊,確定上傳順序中的下一個資料塊為該用戶端的待傳輸資料塊,流程返回至判斷步驟;及
    上傳步驟,當哈希資料庫中沒有與待傳輸資料塊的哈希值相同的哈希值,或者該哈希資料庫中有與待傳輸資料塊的哈希值相同的哈希值但該相同的哈希值對應的資料塊未正在傳輸或未已經傳輸完畢時,通知用戶將該待傳輸資料塊上傳至所述儲存伺服器的儲存區中,該儲存區內有多個資料區域。
  2. 如申請專利範圍第1項所述之資料分塊上傳與儲存方法,還包括:
    所述用戶端將需要上傳至儲存伺服器的文檔分割成多個資料塊,並按照分割順序將該多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中;及
    上傳該哈希列表至所述塊傳輸分配器。
  3. 如申請專利範圍第1項所述之資料分塊上傳與儲存方法,還包括:
    儲存伺服器接收用戶端透過塊傳輸分配器上傳的資料塊;
    將該通過校驗的資料塊寫入儲存區中;
    校驗各資料塊的哈希值與哈希資料庫中所儲存的哈希列表內的相應資料塊的哈希值是否相同;
    當校驗結果為相同時,將通過校驗的各資料塊的儲存指針返回給相應的用戶端,該儲存指針是指資料塊儲存在所述儲存區內的資料區域的編號;
    當校驗結果為不相同時,通知用戶端重新上傳資料塊;及
    當校驗次數達到預設次數且校驗結果仍為不相同時,通知用戶端儲存失敗。
  4. 如申請專利範圍第1項所述之資料分塊上傳與儲存方法,其中所述文檔資訊包括文檔的名稱、文檔的屬性。
  5. 如申請專利範圍第1項所述之資料分塊上傳與儲存方法,當用戶於用戶端讀取所述儲存伺服器中文檔時,所述用戶端執行以下步驟:
    從哈希資料庫中獲取各資料塊的哈希值;
    根據各資料塊的儲存指針從儲存區的相應資料區域內讀取各資料塊;
    計算所讀取的各資料塊的哈希值,校驗該各資料塊的哈希值與從哈希資料庫中獲取的相應資料塊的哈希值是否相同;
    當校驗結果為相同時,將通過校驗的資料塊按照分割順序排列組合成文檔;及
    校驗組合後文檔的哈希值與用戶端上傳的文檔的哈希值是否相同,當校驗結果為相同時,將通過校驗的文檔返回給用戶端的用戶。
  6. 一種資料分塊上傳與儲存系統,運行於一台塊傳輸分配器中,該塊傳輸分配器透過網路連接多個用戶端和一台儲存伺服器,該系統包括:
    接收模組,用於接收所述多個用戶端同時上傳的文檔資訊和文檔的哈希列表,儲存到哈希資料庫中,每個文檔對應一張哈希列表,所述哈希列表中記錄了文檔的多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序;
    設置模組,用於設置各用戶端中資料塊的上傳順序;
    判斷模組,用於判斷所述哈希資料庫中是否有與待傳輸資料塊的哈希值相同的哈希值,且該相同的哈希值對應的資料塊正在傳輸或已經傳輸完畢;
    去重模組,用於當有哈希值相同的資料塊正在傳輸或已經傳輸完畢時,判定該資料塊為重復資料塊,跳過該重復資料塊,確定上傳順序中的下一個資料塊為該用戶端的待傳輸資料塊;及
    上傳模組,用於當哈希資料庫中沒有與待傳輸資料塊的哈希值相同的哈希值,或者該哈希資料庫中有與待傳輸資料塊的哈希值相同的哈希值但該相同的哈希值對應的資料塊未正在傳輸或未已經傳輸完畢時,通知用戶將該待傳輸資料塊上傳至所述儲存伺服器的儲存區中,該儲存區內有多個資料區域。
  7. 如申請專利範圍第6項所述之資料分塊上傳與儲存系統,其中所述用戶端用於:
    在上傳文檔資訊和哈希列表前,將需要上傳至儲存伺服器的文檔分割成多個資料塊,並按照分割順序將該多個資料塊的名稱、各資料塊的哈希值及資料塊的分割順序存入一張哈希列表中;及
    上傳該哈希列表至所述塊傳輸分配器。
  8. 如申請專利範圍第6項所述之資料分塊上傳與儲存系統,在儲存伺服器接收到用戶端透過塊傳輸分配器上傳的資料塊後,執行以下步驟:
    將該通過校驗的資料塊寫入儲存區中;
    校驗各資料塊的哈希值與哈希資料庫中所儲存的哈希列表內的相應資料塊的哈希值是否相同;
    當校驗結果為相同時,將通過校驗的各資料塊的儲存指針返回給相應的用戶端,該儲存指針是指資料塊儲存在所述儲存區內的資料區域的編號;
    當校驗結果為不相同時,通知用戶端重新上傳資料塊;及
    當校驗次數達到預設次數且校驗結果仍為不相同時,通知用戶端儲存失敗。
  9. 如申請專利範圍第6項所述之資料分塊上傳與儲存系統,其中所述文檔資訊包括文檔的名稱、文檔的屬性。
  10. 如申請專利範圍第6項所述之資料分塊上傳與儲存系統,其中所述用戶端還用於:
    當用戶需要透過用戶端從儲存伺服器讀取文檔時,從哈希資料庫中獲取各資料塊的哈希值;
    根據各資料塊的儲存指針從儲存區的相應資料區域內讀取各資料塊;
    計算所讀取的各資料塊的哈希值,校驗該各資料塊的哈希值與從哈希資料庫中獲取的相應資料塊的哈希值是否相同;
    當校驗結果為相同時,將通過校驗的資料塊按照分割順序排列組合成文檔;及
    校驗組合後文檔的哈希值與用戶端上傳的文檔的哈希值是否相同,當校驗結果為相同時,將通過校驗的文檔返回給用戶端的用戶。
TW101148555A 2012-12-12 2012-12-20 資料分塊上傳與儲存系統及方法 TW201423426A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210534098.XA CN103873507A (zh) 2012-12-12 2012-12-12 数据分块上传与存储系统及方法

Publications (1)

Publication Number Publication Date
TW201423426A true TW201423426A (zh) 2014-06-16

Family

ID=50882141

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101148555A TW201423426A (zh) 2012-12-12 2012-12-20 資料分塊上傳與儲存系統及方法

Country Status (3)

Country Link
US (1) US20140164391A1 (zh)
CN (1) CN103873507A (zh)
TW (1) TW201423426A (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873504A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 数据分块存储至分布式服务器的系统及方法
CN103873507A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 数据分块上传与存储系统及方法
CN104967640A (zh) * 2014-07-31 2015-10-07 腾讯科技(深圳)有限公司 一种数据存储方法、装置和系统
CN104182487A (zh) * 2014-08-11 2014-12-03 浪潮软件股份有限公司 一种支持多种存储方式的统一存储方法
WO2016065550A1 (zh) * 2014-10-29 2016-05-06 柳峰 云计算的可信存储、读取方法及装置
CN104580457A (zh) * 2014-12-31 2015-04-29 广州华多网络科技有限公司 有序图片集多线程并发上传的方法及系统
CN104796493A (zh) * 2015-05-08 2015-07-22 成都博元科技有限公司 一种基于云计算的信息处理方法
CN104794239A (zh) * 2015-05-08 2015-07-22 成都博元科技有限公司 一种云平台数据处理方法
CN106294444B (zh) * 2015-05-27 2020-02-18 阿里巴巴集团控股有限公司 一种数据处理方法和设备
CN104994442A (zh) * 2015-07-06 2015-10-21 无锡天脉聚源传媒科技有限公司 一种传输视频文件的方法及装置
CN105335463B (zh) * 2015-09-23 2018-09-25 广州市中崎商业机器股份有限公司 一种用于收款机的数据存储方法和快速读取方法
CN106570425A (zh) * 2015-10-10 2017-04-19 北京奇虎科技有限公司 一种硬盘数据加密方法和系统
CN106657200A (zh) * 2015-11-04 2017-05-10 中国移动通信集团重庆有限公司 一种文件传送方法及装置
CN105872036A (zh) * 2016-03-28 2016-08-17 联想(北京)有限公司 一种数据上传、下载方法、电子设备及服务器
CN107239226B (zh) * 2016-03-29 2020-05-26 联想(北京)有限公司 一种数据去重方法及终端、服务器
CN105955675B (zh) * 2016-06-22 2018-11-09 南京邮电大学 一种用于去中心云环境的重复数据删除系统及方法
CN108241640B (zh) * 2016-12-23 2022-04-08 中科星图股份有限公司 一种分布式的文件存储方法
CN108667867B (zh) * 2017-03-29 2021-05-18 华为技术有限公司 数据存储方法及装置
CN107153588A (zh) * 2017-05-12 2017-09-12 成都优孚达信息技术有限公司 数据编码存储方法
CN109257405A (zh) * 2017-07-14 2019-01-22 中兴通讯股份有限公司 文件上传的处理方法、装置和服务器
CN107241233A (zh) * 2017-08-01 2017-10-10 南京南瑞集团公司 一种多信道遥测数据双机协同采集方法
CN110413443A (zh) * 2019-07-25 2019-11-05 重庆市筑智建信息技术有限公司 一种bim资料信息数据检验优化方法及其系统
CN111586094A (zh) * 2020-03-26 2020-08-25 平安养老保险股份有限公司 一种文件上传方法、装置及计算机设备
EP4236137A4 (en) * 2020-11-16 2023-11-22 Huawei Cloud Computing Technologies Co., Ltd. DATA TRANSMISSION METHOD AND APPARATUS, APPARATUS, SYSTEM AND STORAGE MEDIUM
CN112822256B (zh) * 2020-12-31 2023-01-17 上海英方软件股份有限公司 一种行情文件转数据流传输的方法及装置
CN112765276A (zh) * 2021-01-27 2021-05-07 云账户技术(天津)有限公司 一种增量数据同步方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9395929B2 (en) * 2008-04-25 2016-07-19 Netapp, Inc. Network storage server with integrated encryption, compression and deduplication capability
US8204868B1 (en) * 2008-06-30 2012-06-19 Symantec Operating Corporation Method and system for improving performance with single-instance-storage volumes by leveraging data locality
US8281143B1 (en) * 2008-09-29 2012-10-02 Symantec Operating Corporation Protecting against chosen plaintext attacks in untrusted storage environments that support data deduplication
US8255365B2 (en) * 2009-06-08 2012-08-28 Symantec Corporation Source classification for performing deduplication in a backup operation
US20100333116A1 (en) * 2009-06-30 2010-12-30 Anand Prahlad Cloud gateway system for managing data storage to cloud storage sites
CN101699822A (zh) * 2009-08-06 2010-04-28 腾讯科技(深圳)有限公司 一种文件上传方法、装置和海量存储系统
US8930686B2 (en) * 2009-12-23 2015-01-06 International Business Machines Corporation Deduplication of encrypted data
US9158653B2 (en) * 2010-03-21 2015-10-13 Hewlett-Packard Development Company, L.P. Determining impact of virtual storage backup jobs
CN101917396B (zh) * 2010-06-25 2013-06-19 清华大学 一种网络文件系统中数据的实时去重和传输方法
TWI420306B (zh) * 2010-12-22 2013-12-21 Inventec Corp 支援重複數據刪除程序的數據區塊查詢方法
CN102279887B (zh) * 2011-08-18 2016-06-01 北京百度网讯科技有限公司 一种文档分类方法、装置及系统
CN103873507A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 数据分块上传与存储系统及方法

Also Published As

Publication number Publication date
CN103873507A (zh) 2014-06-18
US20140164391A1 (en) 2014-06-12

Similar Documents

Publication Publication Date Title
TW201423426A (zh) 資料分塊上傳與儲存系統及方法
TWI477981B (zh) 儲存集群中的資料塊去重系統及方法
TW201423425A (zh) 資料分塊儲存至分散式伺服器的系統及方法
KR102133951B1 (ko) 짧은 링크 처리 방법, 디바이스, 및 서버
US9454541B2 (en) Systems and methods for storing compressed data in cloud storage
TW201423449A (zh) 壓縮包上傳去重系統及方法
TW201423427A (zh) 資料塊備份系統及方法
US11627207B2 (en) Systems and methods for data deduplication by generating similarity metrics using sketch computation
US9998141B2 (en) Method and system for transmitting data
US20180060348A1 (en) Method for Replication of Objects in a Cloud Object Store
TW201301053A (zh) 基於雲端儲存的檔案處理方法,系統及伺服器叢集系統
US20130067237A1 (en) Providing random access to archives with block maps
BR112014001749B1 (pt) Método e sistema de download offline
WO2014067063A1 (zh) 重复数据检索方法及设备
US20220156233A1 (en) Systems and methods for sketch computation
CN103227818A (zh) 终端、服务器、文件传输方法、文件存储管理系统和方法
CN106874348A (zh) 文件存储和索引方法、装置及读取文件的方法
US11249987B2 (en) Data storage in blockchain-type ledger
US20180107404A1 (en) Garbage collection system and process
CN110597461B (zh) 块链式账本中的数据存储方法、装置及设备
CN104023070B (zh) 基于云存储的文件压缩方法
CN113542422B (zh) 数据存储方法、装置、存储介质及电子装置
CN118210770A (zh) 增量数据同步方法、装置、计算机设备和存储介质
TWI420333B (zh) 分散式的重複數據刪除系統及其處理方法
US10083121B2 (en) Storage system and storage method