WO2013075668A1

WO2013075668A1 - Procédé et dispositif de suppression de données en double

Info

Publication number: WO2013075668A1
Application number: PCT/CN2012/085278
Authority: WO
Inventors: 付旭东; 徐君
Original assignee: 华为技术有限公司
Priority date: 2011-11-25
Filing date: 2012-11-26
Publication date: 2013-05-30
Also published as: CN103150260A; CN103150260B

Abstract

L'invention concerne un procédé et un dispositif de suppression de données en double. Ledit procédé consiste : à diviser un fichier à stocker et à calculer l'empreinte numérique de chaque partition dans le résultat du processus de division ; à échantillonner l'empreinte numérique de chaque partition et à générer une table d'échantillonnage d'empreintes numériques pour le fichier à stocker, conformément à l'empreinte numérique échantillonnée ; à déterminer un regroupement similaire du fichier à stocker dans une bibliothèque d'échantillonnage de regroupements conformément à la table d'échantillonnage d'empreintes numériques et à la bibliothèque d'échantillonnage de regroupements ; et à réaliser la suppression des données en double dans le fichier à stocker conformément aux données d'empreintes numériques dans un regroupement d'empreintes numériques correspondant au regroupement similaire dans une bibliothèque d'empreintes numériques. Ledit dispositif comprend : un module de division, un module d'échantillonnage, un module de regroupement et un module de suppression des données en double. La présente invention résout le problème rencontré dans l'état de la technique, où un grand nombre de données divisées entraîne une importante quantité de calculs et une consommation de ressources élevée pendant la suppression des doubles, et elle limite la quantité de calculs de la déduplication pendant la suppression des données en double.