EP2972772B1

EP2972772B1 - Copies instantanées en place et la récupération d'espace mémoire pour ceux-ci

Info

Publication number: EP2972772B1
Application number: EP14768489.8A
Authority: EP
Inventors: Anurag Windlass Gupta; Pradeep Jnana Madhavarapu; Samuel James Mckelvie; Neal FACHAN
Original assignee: Amazon Technologies Inc
Current assignee: Amazon Technologies Inc
Priority date: 2013-03-15
Filing date: 2014-03-13
Publication date: 2019-12-25
Anticipated expiration: 2034-03-13
Also published as: EP2972772A1; EP2972772A4; KR101932372B1; US10180951B2; KR20170129959A; WO2014151237A1; AU2017239539A1; CA2906547C; CN105190533B; KR20150132472A; JP6777673B2; US20140279900A1; CN105190533A; JP2018129078A; CA2906547A1; AU2014235162A1; AU2017239539B2; JP2016511498A

Claims

Système (400), comportant :
un ou plusieurs nœuds informatiques (430, 440, 450), dont chacun comporte au moins un processeur et une mémoire, le ou les nœuds informatiques étant configurés pour mettre en œuvre collectivement un système (410) de stockage réparti structuré en journaux d'un service de base de données configuré pour :
recevoir une pluralité d'enregistrements de journal, chaque enregistrement de la pluralité d'enregistrements de journal étant associé à une modification respective de données stockées par le système de stockage réparti structuré en journaux, chaque enregistrement de la pluralité d'enregistrements de journal étant associé à un numéro d'ordre respectif de journal parmi une pluralité de numéros d'ordre de journal ;

générer une copie instantanée qui est utilisable pour lire des données datant d'un état correspondant à la copie instantanée, ladite génération de la copie instantanée comprenant :
la génération de métadonnées qui sont indicatives d'un identifiant de copie instantanée et sont en outre indicatives d'un numéro de la pluralité de numéros d'ordre de journal qui est associé à un enregistrement particulier de la pluralité d'enregistrements de journal, les métadonnées étant utilisables pour empêcher un ou plusieurs des enregistrements de journal de subir une récupération d'espace, et les métadonnées étant stockées au sein de chaque enregistrement de journal ;

ladite génération de la copie instantanée étant effectuée sans lire, copier ou écrire une page des données dans le cadre de ladite génération de la copie instantanée ; et

la réalisation d'une récupération d'espace sur la pluralité d'enregistrements de journal, la réalisation d'une récupération d'espace comportant les étapes consistant à :
déterminer qu'il convient de ne pas effectuer une récupération d'espace sur la pluralité d'enregistrements de journal si les métadonnées indiquent que les enregistrements de journal sont protégés de la récupération d'espace du fait que :
les métadonnées indiquent explicitement que les enregistrements de journal ne doivent pas subir la récupération d'espace, ou

les métadonnées identifient un type de copie instantanée et un numéro d'ordre de journal correspondant à la copie instantanée, le type de copie instantanée étant soit continu soit discret, et :
pour un type discret de copie instantanée, les enregistrements de journal protégés de la récupération d'espace comprenant un enregistrement de journal absolu d'utilisateur "AULR" le plus récent et d'éventuels enregistrements de journal différentiels d'utilisateur "DULR" depuis l'AULR le plus récent jusqu'au numéro d'ordre de journal correspondant à la copie instantanée ; et

pour un type continu de copie instantanée, les enregistrements de journal protégés de la récupération d'espace comprenant un AULR précédant l'AULR le plus récent et d'éventuels DULR depuis l'AULR précédant l'AULR le plus récent jusqu'au numéro d'ordre de journal correspondant à la copie instantanée ; et

la suppression des enregistrements de journal si les métadonnées n'indiquent pas que les enregistrements de journal sont protégés de la récupération d'espace.
Système selon la revendication 1, les métadonnées étant en outre indicatives d'un autre numéro de la pluralité de numéros d'ordre de journal qui est associé à un autre enregistrement particulier de la pluralité d'enregistrements de journal.
Système selon l'une quelconque des revendications précédentes, les métadonnées indiquant que la copie instantanée est une copie instantanée continue, la copie instantanée continue étant utilisable pour rétablir les données à une pluralité d'instants entre des premier et deuxième instants.
Procédé, comportant les étapes consistant à :
faire effectuer, par un ou plusieurs ordinateurs d'un service de base de données, des actions consistant à :
entretenir (810) une pluralité d'enregistrements de journal, chaque enregistrement de la pluralité d'enregistrements de journal étant associé à une modification respective de données stockées par le service de base de données ; et

recevoir une pluralité d'enregistrements de journal, chaque enregistrement de la pluralité d'enregistrements de journal étant associé à une modification respective de données stockées par le système de stockage réparti structuré en journaux, chaque enregistrement de la pluralité d'enregistrements de journal étant associé à un numéro d'ordre respectif de journal parmi une pluralité de numéros d'ordre de journal ;

générer (820) une copie instantanée qui est utilisable pour lire les données datant d'un état correspondant à la copie instantanée, ladite génération de la copie instantanée comprenant la génération de métadonnées qui sont indicatives d'un identifiant de copie instantanée et sont en outre indicatives d'un numéro de la pluralité de numéros d'ordre de journal qui est associé à un enregistrement particulier de la pluralité d'enregistrements de journal, les métadonnées étant utilisables pour empêcher un ou plusieurs des enregistrements de journal de subir une récupération d'espace, et les métadonnées étant stockées au sein de chaque enregistrement de journal ;

ladite génération de la copie instantanée étant effectuée sans lire, copier ou écrire une page des données dans le cadre de ladite génération de la copie instantanée ; et

réaliser une récupération d'espace sur la pluralité d'enregistrements de journal, la réalisation d'une récupération d'espace comportant les étapes consistant à :
déterminer qu'il convient de ne pas effectuer une récupération d'espace sur la pluralité d'enregistrements de journal si les métadonnées indiquent que les enregistrements de journal sont protégés de la récupération d'espace du fait que :
les métadonnées indiquent explicitement que les enregistrements de journal ne doivent pas subir la récupération d'espace, ou

les métadonnées identifient un type de copie instantanée et un numéro d'ordre de journal correspondant à la copie instantanée, le type de copie instantanée étant soit continu soit discret, et :
pour un type discret de copie instantanée, les enregistrements de journal protégés de la récupération d'espace comprenant un enregistrement de journal absolu d'utilisateur "AULR" le plus récent et d'éventuels enregistrements de journal différentiels d'utilisateur "DULR" depuis l'AULR le plus récent jusqu'au numéro d'ordre de journal correspondant à la copie instantanée ; et

pour un type continu de copie instantanée, les enregistrements de journal protégés de la récupération d'espace comprenant un AULR précédant l'AULR le plus récent et d'éventuels DULR depuis l'AULR précédant l'AULR le plus récent jusqu'au numéro d'ordre de journal correspondant à la copie instantanée ; et

supprimer les enregistrements de journal si les métadonnées n'indiquent pas que les enregistrements de journal sont protégés de la récupération d'espace.
Procédé selon la revendication 4, comportant en outre l'étape consistant à :
lire les données datant de l'état correspondant à la copie instantanée, ladite lecture comprenant l'application d'un ou de plusieurs des enregistrements de journal incluant l'enregistrement de journal particulier à une version précédente des données sans créer une copie de la version précédente des données.
Procédé selon la revendication 5, ladite application étant effectuée en tant que processus d'arrière-plan pour le service de base de données.
Procédé selon la revendication 5 ou la revendication 6, ladite application étant effectuée en parallèle à travers divers nœuds du service de base de données.
Procédé selon l'une quelconque des revendications 4 à 7, comportant en outre les étapes consistant à :
rétablir les données à l'état correspondant à la copie instantanée ; et

indiquer qu'un ou plusieurs enregistrements de journal associés à des instants postérieurs à un instant associé à la copie instantanée peuvent subir une récupération d'espace.
Procédé selon l'une quelconque des revendications 4 à 8, comportant en outre l'étape consistant à :
coalescer une pluralité des enregistrements de journal en se basant, au moins en partie, sur la copie instantanée.
Produit de programme informatique comportant un programme qui, lorsqu'il est exécuté, réalise le procédé selon l'une quelconque des revendications 4 à 9.