RU2469388C1 - Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти - Google Patents

Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти Download PDF

Info

Publication number
RU2469388C1
RU2469388C1 RU2011138392/08A RU2011138392A RU2469388C1 RU 2469388 C1 RU2469388 C1 RU 2469388C1 RU 2011138392/08 A RU2011138392/08 A RU 2011138392/08A RU 2011138392 A RU2011138392 A RU 2011138392A RU 2469388 C1 RU2469388 C1 RU 2469388C1
Authority
RU
Russia
Prior art keywords
metadata
files
file system
servers
parallel file
Prior art date
Application number
RU2011138392/08A
Other languages
English (en)
Inventor
Олег Игоревич Аверьянов
Александр Михайлович Бармин
Анатолий Михайлович Варгин
Игорь Васильевич Горьков
Андрей Иванович Ермошкин
Сергей Николаевич Косарев
Вадим Вячеславович Кошелев
Дмитрий Вадимович Кульнев
Марина Вениаминовна Муравьева
Георгий Петрович Семенов
Алексей Александрович Холостов
Андрей Иванович Чайка
Александр Геннадиевич Симонов
Original Assignee
Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" - Госкорпорация "Росатом"
Федеральное государственное унитарное предприятие "Российский Федеральный ядерный центр - Всероссийский научно-исследовательский институт экспериментальной физики" - ФГУП "РФЯЦ-ВНИИЭФ"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" - Госкорпорация "Росатом", Федеральное государственное унитарное предприятие "Российский Федеральный ядерный центр - Всероссийский научно-исследовательский институт экспериментальной физики" - ФГУП "РФЯЦ-ВНИИЭФ" filed Critical Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" - Госкорпорация "Росатом"
Priority to RU2011138392/08A priority Critical patent/RU2469388C1/ru
Application granted granted Critical
Publication of RU2469388C1 publication Critical patent/RU2469388C1/ru

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Изобретение относится к организации иерархической памяти компьютерных файлов данных. Техническим результатом является повышение производительности передачи данных, масштабируемость и обеспечение гибких механизмов управления потоками данных и политиками хранения, балансировки нагрузки. Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти заключается в том, что формируют базу данных на серверах метаданных путем сканирования файлов, к которым должно осуществляться обращение, периодически просматривают метаданные с помощью программного обеспечения, в случае достижения заданного уровня заполненности и для освобождения пространства в параллельной файловой системе производят одновременно перемещение файлов на серверы миграции и занесение метаданных о перемещенных файлах в базу данных, при необходимости осуществляют возврат перемещенных файлов с помощью метаданных, в качестве программного обеспечения используют распределенную систему, серверы миграции и серверы метаданных объединяют между собой с помощью коммуникационной среды. 1 ил.

Description

Изобретение относится к организации иерархической памяти компьютерных файлов данных и может применяться для построения систем хранения высокопроизводительных вычислительных систем.
Объем данных, хранимых на жестких дисках компьютеров, работающих в качестве устройств массовой памяти, быстро увеличивается в течение последнего десятилетия. Это особенно верно для данных, хранимых на сетевых файл-серверах, где в настоящее время обычными являются подсистемы на жестких дисках емкостью несколько Пб (петабайт) или выше, содержащие многие миллионы файлов.
В типовом случае ко многим из файлов на сетевых файл-серверах не будет обращения в течение некоторого времени. Это может объясняться разными причинами: файл может быть старой версией, резервной копией или может храниться до тех пор, пока однажды не потребуется. Файл может быть фактически вообще избыточным, однако только хозяин файла может идентифицировать его таковым, и в результате - файл хранится по причинам резервирования или надежности. В соответствии с общепринятой компьютерной практикой считается, что в случае сомнения файлы должны храниться неограниченно долго. Естественным следствием этого является то, что жесткие диски заполняются старыми файлами. Это случается в каждой компьютерной системе от самой маленькой до самой большой.
Организация иерархической памяти (HSM) является известным способом решения этой проблемы. Большинство современных операционных систем поддерживают информацию о последних дате и времени обновления файла. Многие также поддерживают информацию о последних дате и времени обращения к файлу. Система HSM периодически просматривает список файлов на жестких дисках, проверяя последние дату/время для каждого. Если к файлу не было обращений в течение заранее определенного промежутка времени, то файл переносится на вторичное устройство памяти, например магнитную ленту, и удаляется с жесткого диска.
Дальнейшее усовершенствование систем HSM, известное как деперемещение (демиграция, обратное перемещение), вынуждает HSM-систему автоматически восстанавливать перемещенный файл на исходный диск в случае, когда пользователь или прикладная задача пытаются обратиться к нему. Когда перемещенные данные хранятся на устройстве, работающем в режиме «почти on-line», например на ленточной библиотеке с автоматической сменой лент, запрос на обращение к файлу может быть даже временно приостановлен до тех пор, пока файл не будет восстановлен, после чего продолжается работа, как если бы файл никогда не был перемещен.
Известен «Способ обращения к данным, хранимым в компьютерной системе, с иерархической организацией памяти» (см. патент РФ №2182360 от 01.12.1995, опубликован 10.05.2002 г.), который включает этапы подачи команд, хранимых в оперативной памяти, в центральный процессор для обеспечения им поиска данных обращения, хранимых в оперативной памяти, путем генерирования, по меньшей мере, запроса на считывание, идентификации файла, к которому требуется обращение, причем файл состоит из частей файла, идентификации частей файла в файле, к которым необходимо обращения, обращения к частям файла, причем этап обращения включает проверку таблицы распределения файлов, которая определяет местоположение частей файла в средстве массовой памяти, для определения того, находятся ли части файла в средствах массовой памяти, и если это так, то определение местоположений таких частей файла, и формирования базы данных, которая идентифицирует местоположение частей файла, к которым должно осуществляться обращение.
В вышеуказанном патенте поддерживается вспомогательная база данных, указывающая, к каким блокам данных было обращение и в какие даты. Блоки, к которым не было обращения, могут быть затем заархивированы и удалены из файла на диске для освобождения памяти.
Если осуществляется запрос на считывание для части файла, которая заархивирована или перемещена, то система перемещает обратно требуемую часть файла перед тем, как запрос на считывание удовлетворяется.
Однако записи, обращение к которым имело место недавно, уже должны быть на жестком диске и доступ к ним может быть обеспечен немедленно в последующее время. Таким образом, доступ к часто требуемым записям будет обеспечен с высоким быстродействием без необходимости сохранения всего файла на жестком диске.
Способ может быть расширен, в сущности, с помощью увеличения порога пассивности для срока службы вспомогательной базы данных. Если из большого файла базы данных только к малому количеству записей было обращение, то все записи, к которым было обращение, могут быть сохранены на жестком диске, независимо от даты последнего обращения. Записи, к которым не было обращения, могут быть, однако, удалены для освобождения дискового пространства. В этом случае не требуется, чтобы вспомогательная база данных хранила дату или дату/время последнего обращения. Через продолжительные промежутки времени все области, к которым было обращение, могут быть перемещены, а вспомогательная база данных очищена.
Вышеуказанный способ является наиболее близким к заявляемому способу по технической сущности и поэтому выбран в качестве прототипа.
Недостатками данного способа являются:
- недостаточное быстродействие системы из-за единственности центрального процессора;
- миграция частей файла, т.к. происходит изменение целых файлов;
- невозможность применения данного способа для параллельной файловой системы.
Решаемой задачей является создание способа с организацией иерархического хранения данных для параллельной файловой системы.
Достигаемым техническим результатом является реализация производительности передачи данных, сравнимой со скоростью работы параллельной файловой системы, масштабируемость и обеспечение гибких механизмов управления потоками данных и политиками хранения, балансировки нагрузки.
Для достижения технического результата в способе обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти, который заключается в том, что формируют базу данных на серверах метаданных путем сканирования файлов, к которым должно осуществляться обращение, периодически просматривают метаданные с помощью программного обеспечения, в случае достижения заданного уровня заполненности и для освобождения пространства в параллельной файловой системе производят одновременно перемещение файлов на серверы миграции и занесение метаданных о перемещенных файлах в базу данных, при необходимости осуществляют возврат перемещенных файлов с помощью метаданных; новым является то, что в качестве программного обеспечения используют распределенную систему, серверы миграции и серверы метаданных объединяют между собой с помощью коммуникационной среды.
Применение в качестве программного обеспечения распределенной системы, серверов миграции с дисковыми массивами и серверов метаданных и объединение их между собой коммуникационной средой позволяет организовать иерархическую среду хранения данных для параллельной файловой системы.
На чертеже представлена функциональная схема, реализующая способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти.
Устройство, реализующее заявляемый способ, содержит высокопроизводительный вычислительный комплекс 1, включающий в себя параллельную файловую систему 2, серверы метаданных 3…3m, на которых организованы сканеры параллельной файловой системы, базы данных миграционного уровня системы хранения и клиенты параллельной файловой системы 4…4m, серверы миграции 5…5n, на которых находятся локальные дисковые массивы и клиенты параллельной файловой системы 6…6n, 7 - коммуникационная среда, организованная с помощью коммуникационной фабрики 8, объединяющая параллельную файловую систему 2, серверы метаданных 3…3m и серверы миграции 5…5n.
Реализованное программное обеспечение представляет собой распределенную систему, которая выполняет основные функции:
- осуществляет перемещение файлов в параллельном режиме;
- выделяет в монопольном или разделяемом режиме ресурсы (серверы миграции 5…5n, устройства хранения и т.д.) на время выполнения какой-либо операции с данными;
- предоставляет инструменты для запуска, исполнения и мониторинга заданий на выполнение какой-либо операции с данными;
- управляет очередью заданий, выполняет старт заданий и разрешение конфликтов при запросе ресурсов.
Основными компонентами реализованной системы являются:
- ядро системы;
- подсистема анализа загрузки параллельной файловой системы;
- транспортная подсистема;
- база данных;
- графический интерфейс;
- подсистемы зеркалирования или резервного копирования.
Программное обеспечение позволяет управлять серверами метаданных 3…3m, на которых осуществляется сканирование параллельной файловой системы 2, серверами миграции 5…5n, на которых осуществляется выполнение различных операций с данными (перенос данных из одного хранилища в другое, удаление данных и т.д) и заданиями, представляющими собой совокупность выделенных ресурсов, связанных с пользователем на определенное время.
Способ реализуется следующим образом.
В процессе функционирования путем периодического сканирования файлов в параллельной файловой системе 2, к которым должно осуществляться обращение, формируется база данных на серверах метаданных 3…3m.
Реализованное программное обеспечение на серверах метаданных 3…3m осуществляет отслеживание достижения заданного уровня заполненности параллельной файловой системы 2. При наступлении этого события для освобождения пространства происходит перемещение файлов на серверы миграции 5…5n по заранее заданным критериям и одновременное занесение метаданных в базу данных, находящуюся на серверах метаданных 3…3m.
При необходимости с помощью метаданных осуществляется возврат перемещенных файлов в параллельную файловую систему 2.
Заявляемый способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти высокопроизводительного вычислительного комплекса позволяет:
- отслеживать уровень заполнения параллельной файловой системы 2 высокопроизводительного вычислительного комплекса 1;
- осуществлять миграцию редко используемых данных с параллельной файловой системы 2 на дисковые массивы;
- восстанавливать мигрировавшие данные по запросу пользователей или в автоматическом режиме.
Был изготовлен опытный образец, испытания которого подтвердили его работоспособность и достижение заявленного технического результата.

Claims (1)

  1. Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти, заключающийся в том, что формируют базу данных на серверах метаданных путем сканирования файлов, к которым должно осуществляться обращение, периодически просматривают метаданные с помощью программного обеспечения, в случае достижения заданного уровня заполненности и для освобождения пространства в параллельной файловой системе производят одновременно перемещение файлов на серверы миграции и занесение метаданных о перемещенных файлах в базу данных, при необходимости осуществляют возврат перемещенных файлов с помощью метаданных, отличающийся тем, что в качестве программного обеспечения используют распределенную систему, серверы миграции и сервера метаданных объединяют между собой с помощью коммуникационной среды.
RU2011138392/08A 2011-09-19 2011-09-19 Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти RU2469388C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2011138392/08A RU2469388C1 (ru) 2011-09-19 2011-09-19 Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2011138392/08A RU2469388C1 (ru) 2011-09-19 2011-09-19 Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти

Publications (1)

Publication Number Publication Date
RU2469388C1 true RU2469388C1 (ru) 2012-12-10

Family

ID=49255875

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011138392/08A RU2469388C1 (ru) 2011-09-19 2011-09-19 Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти

Country Status (1)

Country Link
RU (1) RU2469388C1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176843A (zh) * 2013-03-20 2013-06-26 百度在线网络技术(北京)有限公司 MapReduce分布式系统的文件迁移方法及设备
RU2609089C2 (ru) * 2015-02-24 2017-01-30 Общество С Ограниченной Ответственностью "Яндекс" Система и способ выполнения очереди запросов в отношении цифровых объектов

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070179995A1 (en) * 2005-11-28 2007-08-02 Anand Prahlad Metabase for facilitating data classification
EP0892347B1 (en) * 1997-07-11 2007-09-05 International Business Machines Corporation Parallel file system and method for independent metadata logging
EA013001B1 (ru) * 2008-01-10 2010-02-26 Параллелз Холдингз, Лтд. Способ и устройство для управления компьютерной файловой системой с использованием деревьев файловой системы
RU2391697C2 (ru) * 2004-09-09 2010-06-10 Майкрософт Корпорейшн Способ, система и устройство для создания модели архитектуры для генерирования надежных и легких в управлении приложений для защиты данных в системе защиты данных
RU2398275C2 (ru) * 2005-02-28 2010-08-27 Майкрософт Корпорейшн Файловая система, представленная внутри базы данных
US7870355B2 (en) * 2005-12-19 2011-01-11 Commvault Systems, Inc. Log based data replication system with disk swapping below a predetermined rate

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0892347B1 (en) * 1997-07-11 2007-09-05 International Business Machines Corporation Parallel file system and method for independent metadata logging
RU2391697C2 (ru) * 2004-09-09 2010-06-10 Майкрософт Корпорейшн Способ, система и устройство для создания модели архитектуры для генерирования надежных и легких в управлении приложений для защиты данных в системе защиты данных
RU2398275C2 (ru) * 2005-02-28 2010-08-27 Майкрософт Корпорейшн Файловая система, представленная внутри базы данных
US20070179995A1 (en) * 2005-11-28 2007-08-02 Anand Prahlad Metabase for facilitating data classification
US7870355B2 (en) * 2005-12-19 2011-01-11 Commvault Systems, Inc. Log based data replication system with disk swapping below a predetermined rate
EA013001B1 (ru) * 2008-01-10 2010-02-26 Параллелз Холдингз, Лтд. Способ и устройство для управления компьютерной файловой системой с использованием деревьев файловой системы

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176843A (zh) * 2013-03-20 2013-06-26 百度在线网络技术(北京)有限公司 MapReduce分布式系统的文件迁移方法及设备
CN103176843B (zh) * 2013-03-20 2018-12-14 百度在线网络技术(北京)有限公司 MapReduce分布式系统的文件迁移方法及设备
RU2609089C2 (ru) * 2015-02-24 2017-01-30 Общество С Ограниченной Ответственностью "Яндекс" Система и способ выполнения очереди запросов в отношении цифровых объектов

Similar Documents

Publication Publication Date Title
CA2631197C (en) Systems and methods for data management
US7822749B2 (en) Systems and methods for classifying and transferring information in a storage network
US7606844B2 (en) System and method for performing replication copy storage operations
RU2469388C1 (ru) Способ обращения к данным, хранимым в параллельной файловой системе, с иерархической организацией памяти
AU2006318338B2 (en) Systems and methods for data management