RU108662U1 - Система хранения данных с параллельным доступом - Google Patents

Система хранения данных с параллельным доступом Download PDF

Info

Publication number
RU108662U1
RU108662U1 RU2011116646/08U RU2011116646U RU108662U1 RU 108662 U1 RU108662 U1 RU 108662U1 RU 2011116646/08 U RU2011116646/08 U RU 2011116646/08U RU 2011116646 U RU2011116646 U RU 2011116646U RU 108662 U1 RU108662 U1 RU 108662U1
Authority
RU
Russia
Prior art keywords
designed
disk
hard drives
storage
data storage
Prior art date
Application number
RU2011116646/08U
Other languages
English (en)
Inventor
Александр Александрович Московский
Максим Русланович Коваленко
Екатерина Олеговна Тютляева
Олег Сергеевич Аладышев
Original Assignee
Учреждение Российской академии наук Институт программных систем им. А.К. Айламазяна РАН (ИПС им. А.К. Айламазяна РАН)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Учреждение Российской академии наук Институт программных систем им. А.К. Айламазяна РАН (ИПС им. А.К. Айламазяна РАН) filed Critical Учреждение Российской академии наук Институт программных систем им. А.К. Айламазяна РАН (ИПС им. А.К. Айламазяна РАН)
Priority to RU2011116646/08U priority Critical patent/RU108662U1/ru
Application granted granted Critical
Publication of RU108662U1 publication Critical patent/RU108662U1/ru

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

1. Система хранения данных с параллельным доступом, включающая два сервера хранения данных, на одном из которых дополнительно организован сервер метаданных, и дисковые системы, количество которых может варьироваться, при этом каждая дисковая система включает жесткие диски с различной реализуемой ими функциональностью и соединена с каждым из серверов хранения данных при помощи SAS-кабелей, а серверы хранения данных соединены посредством системной сети InfiniBand QDR с клиентами системы хранения данных с параллельным доступом с помощью интерконнекта InfiniBand QDR, при этом одна из дисковых систем включает жесткие диски, как минимум, предназначенные для хранения данных, обрабатываемых высокопроизводительной файловой системой в конфигурации RAID6, и два жестких диска, предназначенных для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare"); еще хотя бы одна из дисковых систем включает жесткие диски, как минимум, предназначенные для хранения метаданных высокопроизводительной файловой системы в конфигурации RAID1; а на базе RAID-массива организован один или более логических томов. ! 2. Система хранения данных по п.1, отличающаяся тем, что дополнительно включает дисковые системы, включающие жесткие диски, как минимум, предназначенные для нужд пользователей без включения их в состав высокопроизводительной файловой системы, часть их которых сконфигурирована в RAID6, и два жестких диска, предназначенных для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare").

Description

Полезная модель относится к области высокопроизводительных отказоустойчивых систем хранения данных с параллельным доступом.
Известна система для хранения данных компании DDN - Data Direct Networks. Решение ExaScaler предполагает наличие двух отдельных серверов для работы с метаданными, поддерживает высокопроизводительный параллельный доступ, для организации которого используется открытая кластерная файловая система, гарантирует высокую степень отказоустойчивости за счет отсутствия единой точки отказа. Недостатком данного решения является то, что оно не поддерживает стандарт InfiniBand QDR, что обуславливает низкую скорость доступа к данным. Также сервер обработки метаданных не совмещен с сервером доступа к данным, что увеличивает стоимость системы хранения данных.
Известна система хранения данных с параллельным доступом Terascala компании Dell (http://www.terascala.com/pdf/Dell_Terascala_HPC_Storage_Solution_Final.pdf). Данное решение предусматривает использование для соединения основных узлов системной сети InfiniBand, таким образом, что дисковые массивы доступны со всех обрабатывающих серверов. Также для повышения отказоустойчивости используется технология Active-Active для серверов управления доступом к данным.
В данном решении сервер доступа к данным не совмещается с сервером обработки метаданных, что обуславливает необходимость использования двух дополнительных вычислительных серверов. Это повышает надежность, но увеличивает стоимость системы хранения данных с параллельным доступом. К тому же в решении Terascala не определяется схема организации дисковых ресурсов.
Задачей полезной модели является расширение арсенала средств хранения данных с параллельным доступом, создание дешевой и надежной системы для хранения данных с параллельным доступом.
Технический результат заключается в расширении арсенала средств хранения данных с параллельным доступом, обеспечении высокого уровня отказоустойчивости при невысокой стоимости системы хранения данных с параллельным доступом, увеличении скорости доступа к данным в режиме ее нормального функционирования.
Технический результат достигается тем, что система хранения данных с параллельным доступом включает два сервера хранения данных, на одном из которых дополнительно организован сервер метаданных, и дисковые системы, количество которых может варьироваться, при этом каждая дисковая система включает жесткие диски с различной реализуемой ими функциональностью и соединена с каждым из серверов хранения данных при помощи SAS-кабелей, а серверы хранения данных соединены посредством системной сети InfiniBand QDR с клиентами системы хранения данных с параллельным доступом с помощью интерконнекта InfiniBand QDR, при этом одна из дисковых систем включает жесткие диски, как минимум, предназначенные для хранения данных, обрабатываемых высокопроизводительной файловой системой в конфигурации RAID6, и два жестких диска, предназначенных для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare"); еще хотя бы одна из дисковых систем включает жесткие диски, как минимум, предназначенные для хранения метаданных высокопроизводительной файловой системы в конфигурации RAID1; а на базе RAID-массива организован один или более логических томов.
При этом в вариантах реализации полезной модели система хранения данных дополнительно включает дисковые системы, включающие жесткие диски, как минимум, предназначенные для нужд пользователей без включения их в состав высокопроизводительной файловой системы, часть их которых сконфигурирована в RAID6, и два жестких диска, предназначенных для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare").
На рис.1 изображена схема системы хранения данных с параллельным доступом.
На рис.2 изображена схема организации дискового пространства дисковой системы типа А.
На рис.3 изображена схема организации дискового пространства дисковой системы типа В.
На рис.4 изображена схема организации дискового пространства дисковой системы типа С.
На рис.5 изображена схема организации дискового пространства дисковой системы типа D.
На рис.6 изображена схема организации дискового пространства дисковой системы типа Е.
На рис.7 изображена схема организации дискового пространства дисковой системы типа F.
На рис.8 изображена схема организации системы хранения данных с параллельным доступом.
На рис.9 приведены основные компоненты и характеристики примера реализации системы хранения данных с параллельным доступом.
На рис.10 изображена схема организации дискового пространства дисковых систем для примера реализации системы хранения данных с параллельным доступом.
Система хранения данных с параллельным доступом состоит из дисковых систем 1, количество которых может варьироваться, и двух серверов хранения данных 2 и 3. Каждый сервер хранения данных соединен с каждой из дисковых систем при помощи SAS-кабелей 4, 5 и 6. Серверы хранения данных 2 и 3 соединены с клиентами системы хранения данных с параллельным доступом 7 посредством сети InfiniBand QDR 8 при помощи интерконнекта InfiniBand QDR 9. Серверы хранения данных 2 и 3 представляют собой сервисы чтения, записи и обработки сетевых запросов от клиентов системы хранения данных с параллельным доступом 7 к одной или нескольким дисковым системам 1.
Для обеспечения надлежащего уровня надежности разработана следующая схема организации дискового пространства дисковых систем. Дисковые системы включают различные по реализуемой функциональности жесткие диски. Жесткие диски 10 предназначены для хранения данных, обрабатываемых высокопроизводительной файловой системой и организованы по технологии RAID6, позволяющей восстановить данные в случае выхода из строя части оборудования. Жесткие диски 11 предназначены для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare"), что способствует максимальной работоспособности и отказоустойчивости системы хранения данных с параллельным доступом. Жесткие диски 12 предназначены для хранения метаданных высокопроизводительной файловой системы, например, информации о расположении файлов, разбиении, правах доступа к файлам и т.п. С целью обеспечения высокого уровня надежности количество таких жестких дисков удваивают с целью организации полного зеркалирования по технологии RAID1. Жесткие диски 13 предоставляются под нужды пользователей, например, организацию зеркалируемых домашних каталогов, под специальные проекты и т.п., без включения их в состав высокопроизводительной файловой системы.
Комбинации групп жестких дисков в составе одной дисковой системы могут быть различными. В зависимости от этого дисковые системы делятся на 6 типов: А, В, С, D, Е и F.
Дисковая система А-типа состоит из жестких дисков 10, объединенных в RAID6, и жестких дисков 11.
Дисковая система В-типа состоит из жестких дисков 10, объединенных в RAID6, двух жестких дисков 11 и жестких дисков 12, объединенных в RAID1.
Дисковая система С-типа состоит из жестких дисков 10, объединенных в RAID6, двух жестких дисков 11 и жестких дисков 13, часть из которых сконфигурирована в RAID6.
Дисковая система D-типа состоит из жестких дисков 10, объединенных в RAID6, двух жестких дисков 11, жестких дисков 12, объединенных в RAID1, и жестких дисков 13, часть из которых сконфигурирована в RAID6.
Дисковая система Е-типа состоит из двух жестких дисков 11 и жестких дисков 13, часть из которых сконфигурирована в RAID6.
Дисковая система F-типа состоит из двух жестких дисков 11, жестких дисков 12, объединенных в RAID1 и жестких дисков 13, часть из которых сконфигурирована в RAID6.
Система хранения данных с параллельным доступом обязательно образована такими типами дисковых систем, которые включают как минимум жесткие диски 10 и 11, и такими типами дисковых систем, которые включают как минимум жесткие диски 12 и 11. В вариантах реализации полезной модели в состав системы хранения данных дополнительно входят дисковые системы остальных типов как по отдельности, так и в различных их комбинациях.
На базе RAID-массива формируют логические тома 14 в соответствии с ограничениями, накладываемыми выбранной файловой системой. Наиболее предпочтительным вариантом является создание одного логического тома на базе одного RAID-массива.
На одном из серверов хранения данных дополнительно организован сервер метаданных 15, предназначенный для управления именами и каталогами. Другой сервер хранения данных используется только в качестве сервера хранения данных.
Такое исполнение системы хранения данных с параллельным доступом позволяет повысить производительность доступа к хранящейся информации.
Система хранения данных с параллельным доступом работает следующим образом.
В режиме нормального функционирования запросы от клиентов системы хранения данных 7 посылаются на оба сервера хранения данных 2 и 3. Каждый из серверов хранения данных обслуживает свою группу дисковых систем 1 с помощью связей 4. Сервер хранения данных 2 выполняет операции с данными, расположенными на логических томах 14, образованных на базе одной группы дисковых систем 1, в состав которой обязательно входит хотя бы одна дисковая система, включающая жесткие диски 12. Сервер хранения данных 2 выполняет функцию сервера метаданных и управляет именами и каталогами высокопроизводительной файловой системы. Сервер хранения данных 3 в режиме нормального функционирования используется как сервер хранения данных и выполняет операции с данными, расположенными на логических томах 14, образованных на базе другой группы дисковых систем 1. Доступ пользователя с клиентов системы хранения данных 7 ко всем видам данных, расположенным на обоих серверах хранения данных 2 и 3 и всех дисковых систем 1 осуществляется единообразно.
В режиме аварийного функционирования в случае отказа сервера хранения данных 2 между ресурсами системы хранения данных с параллельным доступом реализуются связи 5, а в случае отказа сервера хранения данных 3 между ресурсами системы хранения данных с параллельным доступом реализуются связи 6.
Таким образом, реализуется схема отказоустойчивости Active-Active. В режиме нормального функционирования системы хранения данных с параллельным доступом оба сервера хранения данных обрабатывают соответствующие им ресурсы системы хранения данных с параллельным доступом с высокой пропускной способностью. Если же работоспособность одного из серверов хранения данных нарушается, все обслуживаемые им ресурсы системы хранения данных с параллельным доступом автоматически монтируются на оставшийся исправным сервер хранения данных и менее чем через пять минут полностью восстанавливается доступ клиентов системы хранения данных ко всем ее ресурсам. В режиме аварийного функционирования скорость доступа к данным неизбежно будет снижена, но в целом корректность работы системы хранения данных с параллельным доступом не нарушится.
Совмещение в одном из серверов хранения данных функции сервера хранения данных и сервера метаданных позволяет значительно сократить затраты на оборудование. Так, для организации системы хранения данных по предложенной схеме достаточно двух серверов, в отличии от решения Terascala, где требуется минимум четыре сервера. При этом обеспечивается надлежащий уровень отказоустойчивости благодаря организации отказоустойчивой схемы между серверами Active-Active.
Избыточное соединение серверов хранения данных 2 и 3 с дисковыми системами 1 позволяет обеспечить высокий уровень отказоустойчивости.
Пример.
В состав системы хранения данных с параллельным доступом входят четыре дисковые системы, два сервера хранения данных и восемь SAS-кабелей. Каждая дисковая система включает 16 жестких дисков по 1 Тб каждый. В качестве отказоустойчивой параллельной файловой системы используется система Lustre.
Характеристики системы хранения данных с параллельным доступом приведены на фиг.9. Организация дискового пространства показана на фиг.10.
Общая емкость дискового хранилища составляет таким образом 64 Тб. Разбиение дискового пространства четырех дисковых систем выполнено следующим образом. 8 Тб предназначено для замены вышедших из строя дисков без выключения системы ("hot-spare"); 28 Тб отведено для организации логического устройства хранения; 2 Тб отведено для организации устройства хранения метаданных. Остальные жесткие диски не входят в состав файловой системы Lustre, а предоставлены под нужды пользователей.
Полезное пространство хранения первых двух дисковых систем состоит из 24 жестких дисков по 1 Тб. Таким образом, обозначенные выше 28 жестких дисков представляют в своей совокупности логическое устройство хранения. Дополнительные 4 жестких диска использованы для организации двух RAID-массивов по технологии RAID6, позволяющей восстанавливать данные в случае отказа жестких дисков. В свою очередь полезное пространство разделено на 4 OST емкостью по 6 Тб. OST предназначены для хранения данных как объектов данных.
Третья дисковая система содержит диски 11 для замены вышедших из строя дисков без выключения системы ("hot-spare"). Кроме того, она содержит 2 жестких диска по 1 Тб для хранения метаданных (таких как имена файлов, директорий, прав доступа и расположения файлов). Между этими жесткими дисками реализовано полное зеркалирование всех данных по технологии RAID1 для обеспечения высокого уровня надежности. Оставшиеся нераспределенными диски 13, часть из которых организована по технологии RAID 6 (на фиг.10 границы RAID-массива не показаны), предоставляются под нужды пользователей.
Четвертая дисковая система содержит диски 11 для замены вышедших из строя дисков без выключения системы ("hot-spare"). Оставшиеся неразмеченными диски 13, часть из которых организована по технологии RAID6 (на фиг.10 границы RAID-массива не показаны), предоставляются под нужды пользователей.

Claims (2)

1. Система хранения данных с параллельным доступом, включающая два сервера хранения данных, на одном из которых дополнительно организован сервер метаданных, и дисковые системы, количество которых может варьироваться, при этом каждая дисковая система включает жесткие диски с различной реализуемой ими функциональностью и соединена с каждым из серверов хранения данных при помощи SAS-кабелей, а серверы хранения данных соединены посредством системной сети InfiniBand QDR с клиентами системы хранения данных с параллельным доступом с помощью интерконнекта InfiniBand QDR, при этом одна из дисковых систем включает жесткие диски, как минимум, предназначенные для хранения данных, обрабатываемых высокопроизводительной файловой системой в конфигурации RAID6, и два жестких диска, предназначенных для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare"); еще хотя бы одна из дисковых систем включает жесткие диски, как минимум, предназначенные для хранения метаданных высокопроизводительной файловой системы в конфигурации RAID1; а на базе RAID-массива организован один или более логических томов.
2. Система хранения данных по п.1, отличающаяся тем, что дополнительно включает дисковые системы, включающие жесткие диски, как минимум, предназначенные для нужд пользователей без включения их в состав высокопроизводительной файловой системы, часть их которых сконфигурирована в RAID6, и два жестких диска, предназначенных для замены вышедших их строя дисков соответствующего массива без выключения системы хранения данных ("hot-spare").
Figure 00000001
RU2011116646/08U 2011-04-27 2011-04-27 Система хранения данных с параллельным доступом RU108662U1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2011116646/08U RU108662U1 (ru) 2011-04-27 2011-04-27 Система хранения данных с параллельным доступом

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2011116646/08U RU108662U1 (ru) 2011-04-27 2011-04-27 Система хранения данных с параллельным доступом

Publications (1)

Publication Number Publication Date
RU108662U1 true RU108662U1 (ru) 2011-09-20

Family

ID=44759244

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011116646/08U RU108662U1 (ru) 2011-04-27 2011-04-27 Система хранения данных с параллельным доступом

Country Status (1)

Country Link
RU (1) RU108662U1 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2496134C1 (ru) * 2012-07-02 2013-10-20 Сергей Михайлович Абрамов Серверная ферма с иммерсионной системой охлаждения
RU2656739C1 (ru) * 2017-10-04 2018-06-06 Общество с ограниченной ответственностью "ИНТЕЛЛЕКТУАЛЬНЫЙ РЕЗЕРВ" Способ и система хранения данных
US10409696B2 (en) 2014-09-12 2019-09-10 Microsoft Technology Licensing, Llc Scalable data storage pools

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2496134C1 (ru) * 2012-07-02 2013-10-20 Сергей Михайлович Абрамов Серверная ферма с иммерсионной системой охлаждения
US10409696B2 (en) 2014-09-12 2019-09-10 Microsoft Technology Licensing, Llc Scalable data storage pools
RU2702268C2 (ru) * 2014-09-12 2019-10-07 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Масштабируемые пулы хранения данных
RU2656739C1 (ru) * 2017-10-04 2018-06-06 Общество с ограниченной ответственностью "ИНТЕЛЛЕКТУАЛЬНЫЙ РЕЗЕРВ" Способ и система хранения данных

Similar Documents

Publication Publication Date Title
US10146456B1 (en) Data storage system with multi-level, scalable metadata structure
US8010829B1 (en) Distributed hot-spare storage in a storage cluster
Calder et al. Windows azure storage: a highly available cloud storage service with strong consistency
US10073621B1 (en) Managing storage device mappings in storage systems
US9483349B2 (en) Clustered raid data organization
US9846544B1 (en) Managing storage space in storage systems
US10346245B2 (en) Data storage system and data storage method
Kaiser et al. Design of an exact data deduplication cluster
CN105446890B (zh) 智能数据部署
US10852966B1 (en) System and method for creating mapped RAID group during expansion of extent pool
US10572186B2 (en) Random access memory (RAM)-based computer systems, devices, and methods
US10521316B2 (en) System and method for handling multi-node failures in a disaster recovery cluster
US20130282976A1 (en) Self-protecting mass storage systems and methods
US10387273B2 (en) Hierarchical fault tolerance in system storage
US9304865B2 (en) Efficient handing of semi-asynchronous raid write failures
US9959335B2 (en) System and method for avoiding object identifier collisions in a peered cluster environment
CN108733326B (zh) 一种磁盘处理方法及装置
CN103761059A (zh) 一种用于海量数据管理的多盘位存储方法及系统
RU108662U1 (ru) Система хранения данных с параллельным доступом
CN111897486A (zh) 一种基于软件定义的智能统一存储系统
CN201237907Y (zh) 单盘结构的固态raid系统
CN103209219A (zh) 一种分布式集群文件系统
Dufrasne et al. IBM DS8870 Architecture and Implementation (release 7.5)
Wei et al. DSC: Dynamic stripe construction for asynchronous encoding in clustered file system
US11860746B2 (en) Resilient data storage system with efficient space management

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20130428

NF1K Reinstatement of utility model

Effective date: 20140927