RU2825077C1 - Способ и система гранулярного восстановления резервной копии базы данных - Google Patents
Способ и система гранулярного восстановления резервной копии базы данных Download PDFInfo
- Publication number
- RU2825077C1 RU2825077C1 RU2024107610A RU2024107610A RU2825077C1 RU 2825077 C1 RU2825077 C1 RU 2825077C1 RU 2024107610 A RU2024107610 A RU 2024107610A RU 2024107610 A RU2024107610 A RU 2024107610A RU 2825077 C1 RU2825077 C1 RU 2825077C1
- Authority
- RU
- Russia
- Prior art keywords
- dbms
- backup
- database
- data
- backup copy
- Prior art date
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 8
- 239000000126 substance Substances 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 14
- 238000011835 investigation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Abstract
Изобретение относится к технологии резервного копирования и восстановления данных, а именно к системе и способу гранулярного восстановления резервной копии базы данных. Технический результат заключается в возможности частичного восстановления данных из резервной копии БД без необходимости чтения и полного извлечения данных из резервной копии. Система содержит аппаратное и программное обеспечение, при этом аппаратное обеспечение включает, по крайней мере, память, содержащую блок программного обеспечения в виде машиночитаемых инструкций, процессор, связанный с памятью, исполняющий машиночитаемые инструкции, и подсистему резервного копирования; блок программного обеспечения включает по крайней мере файловую систему, операционную систему, выполненную с возможностью обработки запросов пользователя и содержащую модуль ядра или блок программного интерфейса, выполненные с возможностью монтирования файловой системы, блок доступа к резервным копиям в подсистеме резервного копирования, систему управления базами данных (СУБД) и агент гранулярного восстановления резервной копии базы данных, выполненный с возможностью виртуального монтирования в файловой системе директории, содержащей файлы резервной копии, с возможностью перехвата запросов СУБД к файлам директории, записи во временное хранилище, и чтения либо из резервной копии, либо из временного хранилища. 2 н. и 5 з.п. ф-лы, 4 ил.
Description
Область техники, к которой относится изобретение
Группа изобретений относится к технологии резервного копирования и восстановления данных, а именно к способу и системе для гранулярного восстановления резервной копии базы данных и может использоваться при поддержке систем управления реляционными базами данных, в частности, PostgreSQL.
Уровень техники
На сегодняшний день известно большое количество способов резервного копирования и восстановления данных. Однако в сложных высоконагруженных системах используются не просто данные, а упорядоченный набор структурированной информации или данных, называемый базами данных (БД). Базы данных дают возможность множеству пользователей в одно и то же время быстро и безопасно получать доступ к данным и запрашивать их, используя развитую логику и язык запросов. В свою очередь, существующие решения восстановления данных систем управления базами данных (СУБД) основаны на извлечении всех данных резервной копии СУБД с последующим запуском СУБД на восстановленных данных. Использовать их для гранулярного восстановления отдельной БД или таблицы БД, либо для расследования инцидентов, неудобно и неэффективно, так как, несмотря на то что требуется доступ к небольшой части данных, данные резервной копии необходимо восстановить целиком. Для этого требуется как время, так и временное хранилище в объеме всех данных.
Из уровня техники известны различные способы и системы восстановления резервной копии данных. В частности, из заявки US 2021263810 известен способ безагентного и ускоренного резервного копирования базы, который обеспечивает полное резервное копирование данных. Способ дополнительно включает прием устройством резервного копирования данных от сервера данных одного или более собственных журналов, указывающих одну или более транзакций, выполненных сервером данных. Способ также включает в себя определение с помощью устройства резервного копирования данных и на основе собственных журналов одного или нескольких измененных блоков данных. Способ дополнительно включает обеспечение с помощью устройства резервного копирования данных восстановление сервера данных на определенный момент времени путем создания синтетической полной резервной копии, которая накладывает один или несколько блоков данных на один или несколько измененных блоков и которая совместно использует оставшиеся блоки и блоки данных с полным резервным копированием.
Недостатком данного способа является отсутствие возможности применения в отношении таких распространенных СУБД, как PostgreSQL (то есть отсутствие стандартного интерфейса взаимодействия).
Из патента RU 2406118 известны способ и система для резервного копирования и сохранения данных. Сначала выполняют полное резервное копирование с целью создать полный набор данных. После этого могут быть созданы инкрементные или дифференциальные наборы данных посредством инкрементного или дифференциального резервного копирования, соответственно. Когда требуется новый полный набор данных, то вместо выполнения полного резервного копирования предыдущий полный набор данных может быть объединен с последующими инкрементными или дифференциальными наборами данных, с созданием нового полного набора данных.
Недостатком данного способа является необходимость выполнения предварительного полного копирования при восстановлении частичной целевой копии.
Наиболее близкими к предлагаемому изобретению являются система и способ восстановления резерной копии базы данных, разработанные компанией Postgres Professional fhttps://postgrespro.com/docs/postgrespro/16/app-pgprobackup). Основанные на проведении полного восстановления данных из резервной копии с возможностью пропускать восстановление БД, доступ к которым заведомо не нужен, в соответствии с фильтром.
Основным недостатком прототипа является необходимость предварительного определения данных, подлежащих восстановлению и данных, восстановление которых не требуется. Кроме того, гранулярность такого определения данных - это целая база данных, что не позволяет обеспечить восстановление менее гранулярных сущностей - отдельных таблиц базы данных, отдельных строк таблиц и т.д. Также данное решение неприменимо для расследования инцидентов, когда заранее неизвестно, к каким БД потребуется доступ.
Недостаток, характерный для всех приведенных выше аналогов и применяемых в них технологий выполнения восстановления резервной копии базы данных заключается в необходимости производить полное копирование при восстановлении частичной целевой копии базы данных. Таким образом, существующие решения частичного восстановления подразумевают полное восстановление данных во временное хранилище в виде файлов и обеспечения доступа для СУБД.
Технической проблемой, на решение которой направлено настоящее изобретение, является создание способа и системы, обеспечивающих возможность частичного или гранулярного восстановления данных из резервной копии БД без необходимости чтения и полного извлечения данных из резервной копии, что ускоряет извлечение частичных данных и позволяет сохранить свободное место на целевом хранилище, а также позволяет произвести расследование инцидентов потери данных.
Раскрытие изобретения
Техническим результатом является создание системы и способа гранулярного восстановления резервной копии базы данных посредством монтирования данных из резервной копии и запуска временного экземпляра СУБД, обеспечивающих возможность частичного восстановления данных из резервной копии БД без необходимости чтения и полного извлечения данных из резервной копии (чтение только необходимых данных для запуска экземпляра СУБД). Заявляемые система и способ обеспечивают получение доступа на уровне SQL запросов к данным резервной копии системы управления базами данных (СУБД) уровня файлов и могут использоваться для целей частичного восстановления, либо расследования инцидентов. Кроме того, группа изобретений обеспечивает ускорение извлечения частичных данных и сохранение свободного места на целевом хранилище.
Технический результат достигается за счет создания системы гранулярного восстановления резервной копии базы данных, включающей аппаратное и программное обеспечение, при этом аппаратное обеспечение включает, по меньшей мере, память, содержащую блок программного обеспечения в виде машиночитаемых инструкций, процессор, связанный с памятью, исполняющий машиночитаемые инструкции, и подсистему резервного копирования; блок программного обеспечения включает, по крайней мере, файловую систему, операционную систему, выполненную с возможностью обработки запросов пользователя и содержащую модуль ядра или блок программного интерфейса, выполненные с возможностью монтирования файловой системы, блок доступа к резервным копиям в подсистеме резервного копирования, систему управления базами данных (СУБД) и агент гранулярного восстановления резервной копии базы данных, выполненный с возможностью виртуального монтирования в файловой системе директории, содержащей файлы резервной копии, с возможностью перехвата запросов СУБД к файлам директории, записи во временное хранилище, и чтения либо из резервной копии, либо из временного хранилища.
В одном из частных вариантов реализации изобретения в качестве модуля ядра может быть использован FUSE, в качестве СУБД может быть использован PostreSQL.
Технический результат также достигается за счет создания способа гранулярного восстановления резервной копии базы данных с использованием вышеописанной системы, согласно которому:
- запускают агента гранулярного восстановления резервной копии базы данных;
- посредством агента создают временное хранилище;
- с помощью агента выполняют виртуальное монтирование к файловой системе директории, предоставляющей доступ к данным резервной копии и временного хранилища;
- посредством операционной системы производят запуск СУБД в виде временного экземпляра с предоставлением ему доступа к виртуально смонтированной директории, содержащей файлы резервной копии;
- формируют и направляют запросы уровня СУБД к временному экземпляру СУБД с последующим направлением запросов уровня файлов от СУБД к операционной системе;
- посредством агента производят переадресацию запросов уровня файлов к данным резервной копии или временного хранилища;
- посредством временного экземпляра СУБД выполняют запросы без предварительного полного восстановления файловых данных резервной копии, при этом выполнение запросов на чтение регионов файлов, в которые СУБД ранее выполняла запись, осуществляют путем чтения из временного хранилища; выполнение запросов на чтение регионов файлов, в которые СУБД ранее не выполняла запись, осуществляют путем чтения из файлов резервной копии, при этом выполнение запросов на запись осуществляют с помощью алгоритма «запись в копию».
Согласно одному из вариантов реализации способа, запросы уровня СУБД к временному экземпляру СУБД формируют с помощью стандартных или сторонних утилит.
Согласно другому варианту реализации способа посредством агента создают дамп БД текущего временного экземпляра СУБД в автоматическом режиме.
В другом частном варианте реализации способа в автоматическом режиме посредством агента копируют БД из временного экземпляра СУБД в предоставленный пользователем для восстановления БД экземпляр СУБД.
Предлагаемый способ может использоваться для расследования инцидентов потери информации в базах данных.
Отличительными особенностями заявляемого способа являются:
- осуществление запуска экземпляра СУБД как части процесса восстановления резервной копии БД;
- обеспечение «записи в копию» (copy-on-write);
- чтение только необходимых данных для запуска экземпляра СУБД (обычно для запуска экземпляра требуются чтение всех файлов экземпляра из резервной копии);
- использование временного хранилища, с возможностью перехвата запросов от экземпляра СУБД к агенту.
Для восстановления данных используется запуск временного экземпляра СУБД с предоставлением ему доступа к виртуально смонтированной, например, при помощи FUSE директории, содержащей файлы резервной копии. Дальнейшее восстановление происходит путем создания соединения к временному экземпляру СУБД и выполнения запросов уровня СУБД (например, на языке SQL) либо с помощью утилит, создающих резервные копии уровня SQL (такие как pg dump в postgress) и указания им в качестве источника временного экземпляра СУБД, либо с помощью консоли и сторонних программных средств. Под «виртуально смонтированной директорией» для целей настоящего изобретения понимается перехват обращений СУБД к файлам в директории и выполнение этих запросов без предварительного полного восстановления файловых данных резервной копии. Причем виртуально смонтированной директории предоставляется возможность модификации данных, что является необходимым, т.к. СУБД при запуске должна проиграть журналы. Запись обеспечивается с помощью алгоритма «запись в копию», т.е. выполнение запросов на чтение регионов файлов, которые не подвергались модификации СУБД, осуществляется путем чтения из архива. При этом выполнение запросов на запись выполняется путем записи во временное хранилище, а выполнение запросов на чтение регионов файлов, которые подвергались модификации СУБД, осуществляется путем чтения из временного хранилища.
Краткое описание чертежей
Группа изобретений иллюстрируется чертежами, где на Фиг. 1 представлена структурная схема одного из частных вариантов выполнения вычислительной системы, на основе которой может быть реализовано настоящее изобретение.
На Фиг. 2 представлена блок-схема, демонстрирующая пример архитектуры компьютерной системы согласно предлагаемому изобретению и взаимосвязь компонентов системы.
На Фиг. 3 представлена блок-схема алгоритма, представляющая собой в общем виде действия, которые могут происходить для выполнения восстановления резервной копии базы данных в соответствии с различными аспектами изобретения.
На Фиг. 4 представлена блок-схема с временным экземпляром СУБД в режиме восстановления.
Осуществление изобретения
В настоящем описании использованы следующие термины, определения и сокращения, характеризующие устройства, системы, технологии, протоколы, языки программирования и форматы, архитектуры, фреймворки и библиотеки, и др.
Термины, определения и сокращения, характеризующие архитектуру, использованную при создании программно-реализуемого продукта на основе заявленного изобретения:
СУБД - система управления базами данных (англ. Database Management System, сокр. DBMS), совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных (БД) [ГОСТ Р ИСО МЭК ТО 10032-2007: Эталонная модель управления данными (идентичен ISO/IEC TR 10032:2003 Information technology - Reference model of data management)]. Также комплекс программ, позволяющих создать базу данных и манипулировать данными (вставлять, обновлять, удалять и выбирать). Система обеспечивает безопасность, надежность хранения и целостность данных, а также предоставляет средства для администрирования БД [Кузнецов С.Д. Система управления базами данных Архивная копия от 24 октября 2018 на Wayback Machine // Большая российская энциклопедия].
Временный экземпляр СУБД экземпляр СУБД, представляющий собой копию исполняемого файла, который работает как служба операционной системы. Каждый экземпляр может управлять несколькими системными базами данных, а также одной или несколькими пользовательскими базами данных. На каждом компьютере могут работать несколько экземпляров СУБД. Приложения подключаются к экземпляру для выполнения работы в базе данных, которой управляет экземпляр.
PostgreSQL открытая реляционная система управления базами данных, которая используется для хранения и управления данными в приложениях и вебсайтах.
Архив - файл, содержащий в себе один или несколько других файлов и/или папок, а также метаданные. Архивы используются для объединения множества любых файлов в единый файл-контейнер с целью удобства хранения и переноса информации или просто чтобы сжать данные. Для создания архивов и работы с ними используются программы-архиваторы.
Виртуальная файловая система (VFS) уровень абстракции поверх конкретной реализации файловой системы. Целью VFS является обеспечение единообразного доступа клиентских приложений к различным типам файловых систем. VFS может быть использована для доступа к локальным устройствам и файлам (ext4, FAT32, NTFS), сетевым устройствам и файлам на них (NFS), а также к устройствам, не предназначенным для хранения данных. VFS декларирует программный интерфейс между ядром и конкретной файловой системой, таким образом, для добавления поддержки новой файловой системы не требуется вносить изменений в ядро операционной системы.
Агент - программа, реализующая функцию монтирования виртуальной директории (временного хранилища) файловой системы в пользовательском пространстве (FUSE).
FUSE файловая система в пользовательском пространстве, позволяющая смонтировать виртуальный каталог и превратить обращения в этот каталог в вызовы внутрь процесса, который ее создал. При этом поддерживаются многие стандартные оптимизации, относящиеся к кэшированию файловой системы - read-ahead и write-back (особенно это касается FUSE3). Кроме того, FUSE сама организует запросы на передачу данных и ответы в системные очереди - никакого дополнительного "транспорта" не требуется.
PITR восстановление на момент времени (Point-in-time recovery, PITR), в контексте компьютерных систем представляет собой такую возможность восстановления старого состояния системы, когда восстанавливается состояние системы или ее части из прошлого, с указанием на конкретный момент прошлого, на который актуально восстанавливаемое состояние.
Base backup предназначен для создания резервных копий работающего кластера баз данных PostgreSQL. Процедура создания копии не влияет на работу других клиентов. Полученные копии могут использоваться для обеих стратегий восстановления - на заданный момент в прошлом и в качестве отправной точки для ведомого сервера при реализации трансляции файлов или потоковой репликации [https://postgrespro.ru/docs/postgresql/9.6/app-pgbasebackup].
WAL (Журнал предзаписи, журнал транзакционных логов) файл, содержащий сведения об изменениях в файлах с данными (где находятся таблицы и индексы), которые записаны только после того, как эти изменения были занесены в журнал, т.е. после того, как записи журнала, описывающие данные изменения, сохранены на постоянное устройство хранения [https://postgrespro.ru/docs/postgrespro/9.5/wal-intro].
Dump-файл (Дамп БД) - в реляционных СУБД представляет собой файл в формате.sql, содержащий информацию о структуре и содержании базы данных. Файл может быть импортирован - загружен в пустую базу или добавлен к уже существующей для замены или расширения имеющихся данных. Содержащийся в файле список запросов на языке SQL позволяет автоматически наполнить базу нужными данными.
pg_dump программа для создания резервных копий базы данных Postgres Pro. Она создает целостные копии, даже если база параллельно используется. Программа pg dump не препятствует доступу других пользователей к базе данных (ни для чтения, ни для записи) [https://postgrespro.ru/docs/postgrespro/10/app-pgdump].
Гранулярное восстановление БД восстановление одной базы или ее части или восстановление набора данных на определенный момент времени в прошлом (PITR).
Маунт базы данных - установка связи экземпляра с указанной базой данных одного экземпляра СУБД, каждый из которых монтирует физически отдельную базу данных.
Термины, определения и сокращения, характеризующие фреймворки и библиотеки, которые могут быть использованы при создании программно-реализуемого продукта на основе заявленного изобретения:
API (Application Programming Interface) - набор определенных правил и протоколов, которые позволяют разным программам и компонентам программного обеспечения взаимодействовать друг с другом.
Библиотека коллекция программных функций, процедур и ресурсов, предназначенных для решения конкретных задач или обеспечения определенной функциональности в рамках программирования.
cstdlib часть стандартной библиотеки языка Си для выполнения множества операций, включая конвертацию, генерацию псевдослучайных чисел, выделение памяти, контроль процессов, окружения, сигналов, поиска и сортировки.
Термины, определения и сокращения, характеризующие языки и форматы программирования, использованные при создании программно-реализуемого продукта на основе заявленного изобретения:
Golang компилируемый многопоточный язык программирования, разработанный внутри компании Google [https://techcrunch.com/2009/11/10/google-go-language/].
SQL - «язык структурированных запросов», декларативный язык программирования, применяемый для создания, модификации и управления данными в реляционной базе данных, управляемой соответствующей системой управления базами данных.
Запись в копию (Copy-on-write, COW) - запросы на запись данных выполняются путем записи данных во временное хранилище. Запросы на чтение данных выполняются в зависимости от того, писались ли эти данные ранее если писались, чтение происходит из временного хранилища, в противном случае чтение происходит из резервной копии.
Ниже представлено более детальное описание реализации заявляемой группы изобретений, которое не ограничивает объем притязаний изобретений, а демонстрирует возможность их осуществления с достижением заявляемого технического результата.
На Фиг. 1 проиллюстрирован пример вычислительной системы, с использованием которой может быть реализовано предлагаемое изобретение, и которая не ограничивает объем использования или функциональные возможности изобретения, а также не должна толковаться как имеющая какую-либо зависимость или требование, относящиеся к какому-либо компоненту или сочетанию компонентов системы. Изобретение способно работать и с другими вычислительными системами общего или специального назначения. Примерами хорошо известных вычислительных систем, сред и/или конфигураций, которые могут быть пригодны для использования при реализации изобретения, включают, например, персональные компьютеры, компьютеры-с ер в еры, многопроцессорные системы, сетевые персональные компьютеры, миникомпьютеры, универсальные компьютеры, распределенные вычислительные системы, которые включают в себя любые из вышеописанных систем или устройств.
Изобретение может быть описано в общем контексте машиноисполняемых команд, таких как программные модули, исполняемые компьютером. Обычно программные модули включают в себя процедуры, программы, объекты, компоненты, структуры данных, выполняющие конкретные задачи или реализующие алгоритмы над определенными типами данных. Изобретение также может быть практически реализовано в вычислительных системах, в которых задачи выполняются удаленными устройствами обработки данных, связанными через сеть связи. В этом случае программные модули могут быть размещены как в локальных, так и в удаленных компьютерных носителях информации, включая запоминающие устройства.
Согласно Фиг. 1, приводимая в качестве примера вычислительная система для реализации изобретения содержит вычислительное устройство в виде компьютера (1). Компоненты компьютера (1) могут содержать, но не ограничиваясь, процессор (2), блок памяти (3) и системную шину (4), которая соединяет различные компоненты системы, включая системную память, с процессором (2). Системная шина (4) может относиться к любому из нескольких типов структур шины, включая шину памяти или контроллер памяти, периферийную шину и локальную шину. Компьютер (1) содержит разнообразные машиночитаемые носители информации, которые могут представлять собой любые доступные носители информации, к которым может осуществлять доступ компьютер (1), и включают в себя как энергозависимые, так и энергонезависимые носители информации, как съемные, так и несъемные носители информации. В качестве примера машиночитаемые носители информации могут включать в себя компьютерные носители информации и устройства передачи данных. Компьютерные носители информации включают в себя энергозависимые и энергонезависимые, съемные и несъемные носители информации, реализованные любым известным способом или технологией для хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители информации могут включать в себя оперативное запоминающее устройство (ОЗУ, RAM) постоянное запоминающее устройство (ПЗУ, ROM), электрически стираемое программируемое постоянное запоминающее устройство (ЭСППЗУ, EEPROM), флэш-память или память, использующую другую технологию, или любой другой носитель, который может быть использован для хранения необходимой информации и к которому может осуществлять доступ компьютер (1).
В блоке памяти (3) содержатся базовые процедуры, способствующие передаче информации между элементами внутри компьютера (1), например, при запуске. В качестве примера, на Фиг. 1 проиллюстрированы ядро операционной системы (5), программное обеспечение в виде машиночитаемых инструкций (6), СУБД (7) и подсистема резервного копирования (8). Компьютер (1) также может содержать другие съемные/несъемные, энергозависимые/энергонезависимые компьютерные носители информации.
Пользователь может осуществлять ввод команд и информации в компьютер (1) посредством устройств ввода, таких как клавиатура (9), и координатно-указательное устройство (10), обычно обозначающее мышь, шаровой манипулятор или сенсорную панель. Данные устройства ввода соединены с процессором (2) посредством интерфейса
(11) пользовательского ввода, подсоединенного к системной шине. Компьютер (1) может функционировать в сетевой среде, используя логические соединения с одним или более удаленными компьютерами, такими как удаленный компьютер (12). Удаленный компьютер (12) может представлять собой персональный компьютер, сервер, сетевой персональный компьютер (PC), одноранговое устройство или другой узел общей сети, и обычно включает в себя элементы, описанные выше в отношении компьютера (1). Логические соединения, изображенные на Фиг. 1, включают в себя локальную сеть (LAN) (13) и глобальную сеть (WAN) (14), но могут также включать в себя и другие сети. При использовании в сетевой среде LAN компьютер (1) соединен с LAN (13) посредством сетевого интерфейса или адаптера (15). При использовании в сетевой среде WAN компьютер (1) обычно содержит сетевое оборудование (16) для установления связи через сеть WAN (14), такую как сеть Интернет. Сетевое оборудование (16), которое может быть внутренним или внешним, может быть подсоединено к системной шине (4) посредством интерфейса (11) пользовательского ввода или другого соответствующего механизма.
Изобретение может найти воплощение в программном продукте (агенте), написанном на языке программирования, например, Golang, и который может быть реализован с использованием вычислительной системы, пример которой представлен на Фиг. 1, с (а) обеспечением доступа к резервной копии (РК), (б) установленным в ядре операционной системы 5 на Фиг. 1 драйвере FUSE, а также (в) установленными исполняемыми файлами и утилитами СУБД.
Согласно предлагаемому изобретению, агент выполняет следующие функции: регистрирует виртуальную директорию во FUSE, создает временное хранилище, а также запускает временный экземпляр СУБД с указанием смонтированной виртуальной директории. В результате в агент перенаправляются запросы, которые делает экземпляр СУБД, обращаясь к данным экземпляра в виртуальной директории. Также агент может запускать штатные утилиты СУБД для копирования данных на уровне SQL из временного экземпляра либо в целевой экземпляр, либо в дамп файл уровня SQL.
Компьютерно-реализуемая система для восстановления резервной копии базы данных согласно предлагаемому изобретению включает, по меньшей мере, аппаратное и программное обеспечение при этом аппаратное обеспечение включает, по крайней мере, память, содержащую блок программного обеспечения в виде машиночитаемых инструкций, процессор, связанный с памятью, исполняющий машиночитаемые инструкции, и подсистему резервного копирования. Блок программного обеспечения включает, по крайней мере, файловую систему, операционную систему, выполненную с возможностью обработки запросов пользователя и содержащую модуль ядра или блок программного интерфейса, выполненные с возможностью монтирования файловой системы, блок доступа к резервным копиям в подсистеме резервного копирования, систему управления базами данных (СУБД) и агент гранулярного восстановления резервной копии базы данных, выполненный с возможностью виртуального монтирования в файловой системе директории, содержащей файлы резервной копии, с возможностью перехвата запросов СУБД к файлам директории, записи во временное хранилище, и чтения либо из резервной копии, либо из временного хранилища. Блок-схема, демонстрирующая пример системы для гранулярного восстановления, приведена на Фиг. 2.
Согласно одному аспекту изобретения резервные копии баз данных хранятся в блоке памяти 3 в подсистеме резервного копирования (Фиг. 1) на запоминающем устройстве, таком как жесткий магнитный диск.
В предпочтительном варианте реализации изобретения, способ восстановления резервной копии базы данных включает следующие этапы (Фиг. 3).
1. Процесс инициируется пользователем. При этом пользователь выбирает режим работы (маунт для обращения к временному экземпляру стандартными или сторонними утилитами, либо автоматизированное восстановления выбранных БД в другой экземпляр СУБД, либо автоматизированное восстановления выбранных БД в дамп файл уровня SQL), опционально время для восстановления на точку во времени (PITR). При выборе режима автоматизированного восстановления в другой экземпляр СУБД пользователь задает параметры доступа к другому экземпляру. При выборе режима автоматизированного восстановления в дамп файл уровня SQL пользователь задает целевую директорию для дамп-файлов.
2. Агент регистрирует виртуальную директорию во FUSE. Также агент организует временное хранилище. В результате в агент перенаправляются запросы на чтение и запись в файлы в виртуальной директории. Агент реализует для этих запросов механизм записи в копию (copy on write). Запросы на запись данных выполняются путем записи данных во временное хранилище. Запросы на чтение данных выполняются в зависимости от того, писались ли эти данные ранее - если писались, чтение происходит из временного хранилища, в противном случае чтение происходит из резервной копии (Фиг. 4).
3. Агент запускает временный экземпляр СУБД над виртуальной директорией в режиме восстановления. При этом СУБД передается указанный пользователем момент во времени (если указано). Временный экземпляр проигрывает транзакционные логи до указанного момента во времени (если указано) либо все существующие логи. Для этого временный экземпляр читает файлы с логами из виртуальной директории, а затем делает описанные в логе изменения в основных файлах БД. При этом агент получает перенаправленные FUSE запросы к файлам виртуальной директории и выполняет их как описано выше. Закончив восстановление СУБД завершает процесс. Как результат временное хранилище содержит все измененные данные в соответствии с инструкциями в транзакционных логах.
4. Агент запускает временный экземпляр СУБД над виртуальной директорией в режиме обслуживания запросов. Начиная с данного момента временный экземпляр СУБД доступен для запросов стандартными средствами.
Далее возможны несколько сценариев (Фиг. 3).
5.1. Если пользователь выбрал режим маунта для обращения к временному экземпляру стандартными или сторонними утилитами, то он самостоятельно пользуется этими средствами. Этот режим предназначен не только для восстановления данных, но также для расследования инцидентов - выяснения кто и когда модифицировал данные. А также для выяснения желательного момента во времени для восстановления. Система пребывает в режиме маунта, пока пользователь не запросит отмену маунта.
5.2. Если пользователь выбрал режим автоматизированного восстановления выбранных БД в другой экземпляр, агент использует стандартную утилиту СУБД для создания дамп файла уровня SQL, а также перенаправляет этот дамп в стандартную утилиту СУБД для восстановления дамп файла в другой экземпляр.
5.3. Если пользователь выбрал режим автоматизированного восстановления выбранных БД в дамп файл уровня SQL, агент использует стандартную утилиту СУБД для создания дамп файла уровня SQL.
6. Агент останавливает временный экземпляр СУБД, выполняет действия для дерегистрации виртуальной директории во FUSE и стирает временное хранилище. Примеры реализации изобретения. Монтирование экземпляра БД.
Сценарий: пользователю необходимо посмотреть, проверить содержимое и, по возможности, восстановить одну базу или часть базы из резервной копии PostgreSQL. Это может быть актуально для решения задач, связанных с проверкой данных в архиве или при восстановлении отдельных таблиц без необходимости восстановить весь экземпляр или большую базу. Кроме того, это полезно при расследовании инцидентов, когда целью данной операции является не восстановление данных, а выяснение обстоятельств повреждения данных либо выяснение момента времени, на который следует делать восстановление. В данном сценарии пользователь в консоли управления агентом выбирает опцию монтирования экземпляра, выбирает момент времени для монтирования (PITR) - если требуется. При этом происходит создание временного хранилища, монтирование виртуальной директории к точке, запуск СУБД над виртуальной директорией в режиме проигрывания логов, запуск временного экземпляра СУБД над виртуальной директорией в режиме обслуживания запросов. По окончании монтирования пользователь видит в консоли управления агентом параметры присоединения к временному экземпляру СУБД. После того, как база смонтирована, пользователь использует параметры присоединения в консоли PostgreSQL для подключения к базе (или любой другой инструмент, который работает с базой через стандартное подключение - pgAdmin, pg dump и т.д.) и выполнения необходимых операций. По завершении пользователь в консоли управления агентом выбирает отключение монтирования. При этом агент останавливает временный экземпляр СУБД, отменяет маунт виртуальной директории, удаляет временное хранилище.
Для того, чтобы монтирование работало корректно, агент должен быть установлен на ОС Linux систему, для монтирования данных из архива требуется установка библиотеки libfuse. В системе должна быть установлена СУБД PostgreSQL той же версии, что и в резервной копии.
Восстановление отдельных баз в дамп БД.
Сценарий: требуется экспортировать базы из резервной копии в дамп БД для дальнейшего использования средствами PostgreSQL. Это может потребоваться, например, при переносе базы в другой экземпляр PostgreSQL. В данном сценарии пользователь в консоли управления агентом выбирает опцию восстановления в дамп БД, выбирает момент времени для монтирования (PITR) - если требуется, выбирает требуемые БД, указывает директорию для дампов БД. При этом происходит создание временного хранилища, монтирование виртуальной директории, запуск СУБД над виртуальной директорией в режиме проигрывания логов, запуск временного экземпляра СУБД над виртуальной директорией в режиме обслуживания запросов. Затем агент запускает стандартную утилиту создания дампов БД PostgreSQL - pg dump.Затем агент останавливает временный экземпляр СУБД, отменяет маунт виртуальной директории, удаляет временное хранилище.
Восстановление отдельной базы данных в экземпляр СУБД (п. 7 формулы).
Сценарий: Восстановление отдельной базы PostgreSQL из резервной копии экземпляра PostgreSQL в исходную базу или в новую базу экземпляра PostgreSQL. В данном сценарии пользователь в консоли управления агентом выбирает опцию восстановления в экземпляр СУБД, выбирает момент времени для монтирования (PITR) - если требуется, выбирает требуемые БД, указывает параметры присоединения целевого экземпляра СУБД. При этом происходит создание временного хранилища, монтирование виртуальной директории, запуск СУБД над виртуальной директорией в режиме проигрывания логов, запуск временного экземпляра СУБД над виртуальной директорией в режиме обслуживания запросов. Затем агент запускает стандартную утилиту создания дампов БД PostgreSQL pg dump, перенаправив создаваемый им дамп БД в консоль СУБД, присоединенную к целевому экземпляру СУБД. Затем агент останавливает временный экземпляр СУБД, отменяет маунт виртуальной директории, удаляет временное хранилище.
Таким образом, предлагаемые способ и система гранулярного восстановления баз данных позволяют восстановить требуемые данные без необходимости восстановления всего экземпляра PostgreSQL.
Claims (14)
1. Система для гранулярного восстановления резервной копии базы данных, включающая аппаратное и программное обеспечение, при этом аппаратное обеспечение включает, по крайней мере, память, содержащую блок программного обеспечения в виде машиночитаемых инструкций, процессор, связанный с памятью, исполняющий машиночитаемые инструкции, и подсистему резервного копирования; блок программного обеспечения включает, по крайней мере, файловую систему, операционную систему, выполненную с возможностью обработки запросов пользователя и содержащую модуль ядра или блок программного интерфейса, выполненные с возможностью монтирования файловой системы, блок доступа к резервным копиям в подсистеме резервного копирования, систему управления базами данных (СУБД) и агент гранулярного восстановления резервной копии базы данных, выполненный с возможностью виртуального монтирования в файловой системе директории, содержащей файлы резервной копии, с возможностью перехвата запросов СУБД к файлам директории, записи во временное хранилище, и чтения либо из резервной копии, либо из временного хранилища.
2. Система по п.1, отличающаяся тем, что в качестве модуля ядра выбран FUSE.
3. Система по п.1, отличающаяся тем, что в качестве СУБД выбран PostreSQL.
4. Способ гранулярного восстановления резервной копии базы данных с использованием системы по п.1, характеризующийся тем, что:
- запускают агента гранулярного восстановления резервной копии базы данных;
- посредством агента создают временное хранилище;
- с помощью агента выполняют виртуальное монтирование к файловой системе директории, предоставляющей доступ к данным резервной копии и временного хранилища;
- посредством операционной системы производят запуск СУБД в виде временного экземпляра с предоставлением ему доступа к виртуально смонтированной директории, содержащей файлы резервной копии;
- формируют и направляют запросы уровня СУБД к временному экземпляру СУБД с последующим направлением запросов уровня файлов от СУБД к операционной системе;
- посредством агента производят переадресацию запросов уровня файлов к данным резервной копии или временного хранилища;
- посредством временного экземпляра СУБД выполняют запросы без предварительного полного восстановления файловых данных резервной копии, при этом выполнение запросов на чтение регионов файлов, в которые СУБД ранее выполняла запись, осуществляют путем чтения из временного хранилища; выполнение запросов на чтение регионов файлов, в которые СУБД ранее не выполняла запись, осуществляют путем чтения из файлов резервной копии, при этом выполнение запросов на запись осуществляют с помощью алгоритма «запись в копию».
5. Способ по п.4, характеризующийся тем, что запросы уровня СУБД к временному экземпляру СУБД формируют с помощью стандартных или сторонних утилит.
6. Способ по п.4, характеризующийся тем, что в автоматическом режиме посредством агента создают дамп БД текущего временного экземпляра СУБД.
7. Способ по п.4, характеризующийся тем, что в автоматическом режиме посредством агента копируют БД из временного экземпляра СУБД в предоставленный пользователем для восстановления БД экземпляр СУБД.
Publications (1)
Publication Number | Publication Date |
---|---|
RU2825077C1 true RU2825077C1 (ru) | 2024-08-19 |
Family
ID=
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2406118C2 (ru) * | 2004-09-22 | 2010-12-10 | Майкрософт Корпорейшн | Способ и система для синтетического резервного копирования и восстановления данных |
US20110087874A1 (en) * | 2009-10-12 | 2011-04-14 | Veeam Software International Ltd. | Item-level restoration and verification of image level backups |
RU2526753C1 (ru) * | 2013-06-20 | 2014-08-27 | Закрытое акционерное общество Научно-производственное предприятие "Реляционные экспертные системы" | Способ восстановления данных в системе управления базами данных |
RU2531569C2 (ru) * | 2009-06-12 | 2014-10-20 | Майкрософт Корпорейшн | Защищенное и конфиденциальное хранение и обработка резервных копий для доверенных сервисов вычисления и данных |
RU2622630C2 (ru) * | 2015-06-05 | 2017-06-16 | Закрытое акционерное общество "Лаборатория Касперского" | Система и способ восстановления модифицированных данных |
US10114705B1 (en) * | 2015-04-14 | 2018-10-30 | EMC IP Holding Company LLC | Presenting virtual machine backup files for block and file level restore |
US20210263810A1 (en) * | 2020-02-25 | 2021-08-26 | Veritas Technologies Llc | Systems and methods for agentless and accelerated backup of a database |
US20230094628A1 (en) * | 2021-09-27 | 2023-03-30 | EMC IP Holding Company LLC | System and method for securing instant access of data in file based backups in a backup storage system using metadata files |
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2406118C2 (ru) * | 2004-09-22 | 2010-12-10 | Майкрософт Корпорейшн | Способ и система для синтетического резервного копирования и восстановления данных |
RU2531569C2 (ru) * | 2009-06-12 | 2014-10-20 | Майкрософт Корпорейшн | Защищенное и конфиденциальное хранение и обработка резервных копий для доверенных сервисов вычисления и данных |
US20110087874A1 (en) * | 2009-10-12 | 2011-04-14 | Veeam Software International Ltd. | Item-level restoration and verification of image level backups |
RU2526753C1 (ru) * | 2013-06-20 | 2014-08-27 | Закрытое акционерное общество Научно-производственное предприятие "Реляционные экспертные системы" | Способ восстановления данных в системе управления базами данных |
US10114705B1 (en) * | 2015-04-14 | 2018-10-30 | EMC IP Holding Company LLC | Presenting virtual machine backup files for block and file level restore |
RU2622630C2 (ru) * | 2015-06-05 | 2017-06-16 | Закрытое акционерное общество "Лаборатория Касперского" | Система и способ восстановления модифицированных данных |
US20210263810A1 (en) * | 2020-02-25 | 2021-08-26 | Veritas Technologies Llc | Systems and methods for agentless and accelerated backup of a database |
US20230094628A1 (en) * | 2021-09-27 | 2023-03-30 | EMC IP Holding Company LLC | System and method for securing instant access of data in file based backups in a backup storage system using metadata files |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Armbrust et al. | Delta lake: high-performance ACID table storage over cloud object stores | |
KR102579190B1 (ko) | 일관된 데이터베이스 스냅샷들을 이용한 분산 데이터베이스에서의 백업 및 복원 | |
US10671642B2 (en) | Copying data changes to a target database | |
US10146631B1 (en) | Incremental forever backups for exchange | |
EP1535198B1 (en) | Multiple concurrent active file systems | |
KR100622801B1 (ko) | 파일 시스템 액세스 방법, 파일 시스템 복원 방법, 컴퓨터 판독 가능 기록 매체 및 데이터 처리 시스템 | |
US11847028B2 (en) | Efficient export of snapshot changes in a storage system | |
US7472129B2 (en) | Lossless recovery for computer systems with map assisted state transfer | |
US7360111B2 (en) | Lossless recovery for computer systems with remotely dependent data recovery | |
US6223269B1 (en) | Stacked mapped storage system | |
US10810092B2 (en) | Checkpoints for document store | |
US11755427B2 (en) | Fast recovery and replication of key-value stores | |
US11288128B2 (en) | Indexing a relationship structure of a filesystem | |
KR20090110823A (ko) | 데이터 섀도잉 시스템 및 데이터의 자동 백업 저장 방법 | |
US11550485B2 (en) | Paging and disk storage for document store | |
US11947823B2 (en) | System and methods for providing a memory slice data structure for use with diverse memory and storage media | |
Graefe et al. | Instant recovery with write-ahead logging | |
US11829291B2 (en) | Garbage collection of tree structure with page mappings | |
RU2825077C1 (ru) | Способ и система гранулярного восстановления резервной копии базы данных | |
Ritz | Crash Consistency Testing for Block Based File Systems on NVMe Drives | |
KR102005727B1 (ko) | 파일 시스템의 변경 연산 가로채기 기법을 기반으로 한 다중 스냅샷 방법 | |
McKusick | a brief history of the BSD Fast File System | |
Badoiu et al. | A Distributed Provenance Aware Storage System |