RU2543962C2 - Hardware-computer system for virtualisation and management of resources in cloud computing environment - Google Patents

Hardware-computer system for virtualisation and management of resources in cloud computing environment Download PDF

Info

Publication number
RU2543962C2
RU2543962C2 RU2013118640/08A RU2013118640A RU2543962C2 RU 2543962 C2 RU2543962 C2 RU 2543962C2 RU 2013118640/08 A RU2013118640/08 A RU 2013118640/08A RU 2013118640 A RU2013118640 A RU 2013118640A RU 2543962 C2 RU2543962 C2 RU 2543962C2
Authority
RU
Russia
Prior art keywords
resources
computers
group
computer
hardware
Prior art date
Application number
RU2013118640/08A
Other languages
Russian (ru)
Other versions
RU2013118640A (en
Inventor
Дмитрий Александрович Гаврилов
Николай Николаевич Щелкунов
Original Assignee
Федеральное Государственное Автономное Образовательное Учреждение Высшего Профессионального Образования "Московский Физико-Технический Институт (Государственный Университет)"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное Государственное Автономное Образовательное Учреждение Высшего Профессионального Образования "Московский Физико-Технический Институт (Государственный Университет)" filed Critical Федеральное Государственное Автономное Образовательное Учреждение Высшего Профессионального Образования "Московский Физико-Технический Институт (Государственный Университет)"
Priority to RU2013118640/08A priority Critical patent/RU2543962C2/en
Publication of RU2013118640A publication Critical patent/RU2013118640A/en
Application granted granted Critical
Publication of RU2543962C2 publication Critical patent/RU2543962C2/en

Links

Abstract

FIELD: physics, computer engineering.
SUBSTANCE: invention relates to cloud computing systems. A virtualisation module is connected to a second group of computers for storing program sessions and a control computer. A scheduling module is connected to a second group of computers for storing program sessions and a control computer; a graphics control means is connected to the second group of computers for storing program sessions and the control computer. The virtualisation module is configured create a virtual machine by emulating at least one hardware resource selected from: high-efficiency computer resources, partitioned file storages, memory and create one-to-one links between at least one selected hardware resource and emulation thereof. The scheduling module is configured to control processes of allocating/retrieving hardware resources for the virtual machine, assign a priority for each virtual machine at the launch thereof and assign weight and limit parameters thereto, where the weight parameter determines the value of the real available processor time, and the limit parameter determines the value of the maximum available processor time. The graphics control means is configured to allocate network resources between virtual machines based on information obtained from the control computer.
EFFECT: shorter time for switching a load between nodes.

Description

Заявленное изобретение, в общем, относится к области облачных вычислительных систем, предназначенных для обработки данных.The claimed invention, in General, relates to the field of cloud computing systems designed for data processing.

Развитие и модернизация ИТ-инфраструктуры (ИТ - информационные технологии) организаций государственного сектора, стратегических промышленных предприятий и компаний также, как и в целом в коммерческом секторе, идут по пути централизации вычислений, строительства высокопроизводительных ЦОД (центров обработки данных) или аренды вычислительных ресурсов и сервисов. Для крупных компаний и организаций это предполагает построение/аренду распределенных вычислительных сред.The development and modernization of IT infrastructure (IT - information technologies) of public sector organizations, strategic industrial enterprises and companies, as well as in the commercial sector as a whole, is moving towards centralizing computing, building high-performance data centers (data centers), or renting computing resources and services. For large companies and organizations, this involves the construction / rental of distributed computing environments.

В качестве ключевых недостатков существующего в настоящее время ИТ-ландшафта систем, построенных на базе классической архитектуры, обозначены: низкий коэффициент использования ресурсов, неоднородная нагрузка, избыточное дублирование, сложность и непрозрачность управления, низкая мобильность ресурса, что препятствует его оперативному перераспределению между различными функциями.The key disadvantages of the current IT landscape of systems built on the basis of the classical architecture are: low resource utilization, heterogeneous load, excessive duplication, complexity and non-transparency of management, low resource mobility, which impedes its operational redistribution between different functions.

Из уровня техники ([1], с.44) известно построение вычислительных систем в виде кластеров (многомашинных систем), которые представляют собой вычислительный комплекс, состоящий из нескольких компьютеров (узлов), а также программные и аппаратные средства связи компьютеров, которые обеспечивают работу всех компьютеров комплекса как единого целого.From the prior art ([1], p.44) it is known the construction of computer systems in the form of clusters (multi-machine systems), which are a computer complex consisting of several computers (nodes), as well as software and hardware communications computers that provide work all computers of the complex as a whole.

Кластеры применяют для повышения надежности и производительности вычислительной системы. Надежность повышается за счет того, что при отказе одного из узлов кластера вычислительная нагрузка (или часть ее) переносится на другой узел.Clusters are used to increase the reliability and performance of a computing system. Reliability is increased due to the fact that when one of the cluster nodes fails, the computational load (or part of it) is transferred to another node.

Для обмена служебной информацией узлами используются межпроцессорные связи. С помощью этих связей каждый узел кластера периодически проверяет состояние других узлов и выполняемых ими вычислительных задач. Если какой-либо узел или одна из его задач (входящая в набор защищаемых от отказов задач) изменили свое состояние на неработоспособное, то начинается процедура перемещения (реконфигурации) нагрузки на один из работоспособных узлов. При этом защищаемая задача должна хранить свои данные на одном из разделяемых дисков, чтобы новый узел смог продолжать их использовать после отказа основного.For the exchange of service information, nodes use interprocessor communications. Using these links, each cluster node periodically checks the status of other nodes and the computational tasks they perform. If any node or one of its tasks (included in the set of fail-safe tasks) changed its state to non-working, then the procedure of moving (reconfiguring) the load to one of the working nodes begins. At the same time, the protected task must store its data on one of the shared disks, so that the new node can continue to use them after the failure of the main one.

Однако такое решение имеет все перечисленные выше недостатки, поскольку отсутствует механизм управления ресурсами таким образом, чтобы обеспечивалось оптимальное распределение нагрузки в системе.However, such a solution has all of the above disadvantages, since there is no resource management mechanism in such a way as to ensure optimal load distribution in the system.

Сложность и непрозрачность управления кластером обусловлена тем, что каждый из компьютеров, входящих в его состав, может работать под управлением собственной, отличной от других, операционной системы.The complexity and opacity of cluster management is due to the fact that each of the computers included in its composition can operate under the control of its own, different from the others, operating system.

Кроме того, указанное решение имеет большое время реконфигурации, поскольку оно связано с активацией новой копии программного процесса на другом узле.In addition, this solution has a long reconfiguration time, since it is associated with the activation of a new copy of the software process on another node.

При этом также возможна потеря части данных, находившихся в оперативной памяти отказавшего узла.In this case, it is also possible to lose some of the data in the RAM of the failed node.

Наиболее близким аналогом настоящего изобретения является аппаратно-вычислительный комплекс для предоставления доступа к программному обеспечению в концепции облачных вычислений, включающий связанные между собой и соединенные с Интернет группу ЭВМ, группу ЭВМ для хранения программных сессий, файловые хранилища и высокопроизводительные вычислительные ресурсы, при этом аппаратно-вычислительный комплекс дополнительно снабжен ЭВМ учета ресурсов, через которую связаны группа ЭВМ для хранения программных сессий и высокопроизводительные вычислительные ресурсы ([2]).The closest analogue of the present invention is a hardware-computer complex for providing access to software in the concept of cloud computing, including interconnected and connected to the Internet computer group, a computer group for storing program sessions, file storages and high-performance computing resources, while the computing complex is additionally equipped with a computer for resource accounting, through which a group of computers for storing program sessions is connected and is highly productive th computing resources ([2]).

Указанный комплекс, как следует из описания, обеспечивает достижение технического результата в виде расширения класса программных продуктов, которые могут быть установлены в инфраструктуру хаба (платформы, на которую можно установить программный продукт). При этом система учета ресурсов (управления), которую предусматривает такой комплекс, обеспечивает лишь ограничение доступа к ресурсам лицам, не прошедшим проверку (см. [2], с.3, стр.41-43).The specified complex, as follows from the description, ensures the achievement of a technical result in the form of an extension of the class of software products that can be installed in the hub infrastructure (the platform on which the software product can be installed). At the same time, the resource accounting (management) system, which such a complex provides, provides only a restriction of access to resources to persons who have not passed the audit (see [2], p.3, p. 41-43).

Таким образом, комплекс, принятый в качестве наиболее близкого аналога настоящего изобретения, также имеет все перечисленные выше недостатки, поскольку использованная в нем система учета ресурсов не обеспечивает их оптимальное распределение с учетом вычислительных мощностей узлов.Thus, the complex, adopted as the closest analogue of the present invention, also has all the above disadvantages, since the resource accounting system used in it does not provide their optimal distribution taking into account the computing power of the nodes.

Кроме того, в указанном комплексе отсутствует какое-либо техническое решение проблемы длительного времени реконфигурации узлов.In addition, in this complex there is no technical solution to the problem of a long time reconfiguration of nodes.

Указанные выше недостатки решаются заявленным изобретением, которое позволяет обеспечить эффективное распределение нагрузки в системе путем управления ресурсами, а также снизить время реконфигурации узлов.The above disadvantages are solved by the claimed invention, which allows for efficient load distribution in the system by resource management, as well as to reduce the time of reconfiguration of nodes.

Предложен аппаратно-вычислительный комплекс виртуализации и управления ресурсами в среде облачных вычислений.A hardware-computer complex for virtualization and resource management in a cloud computing environment is proposed.

Предпочтительная реализация предлагаемого аппаратно-вычислительного комплекса виртуализации и управления ресурсами в среде облачных вычислений включает в себя связанные между собой и соединенные посредством сети первую группу рабочих ЭВМ и вторую группу ЭВМ для хранения программных сессий, а также ЭВМ управления, через которую связаны вторая группа ЭВМ для хранения программных сессий, высокопроизводительные вычислительные ресурсы и разделяемые файловые хранилища.The preferred implementation of the proposed hardware and computer complex for virtualization and resource management in a cloud computing environment includes the first group of working computers and the second group of computers connected to each other and connected via a network for storing program sessions, as well as the control computer through which the second group of computers for storage of software sessions, high-performance computing resources and shared file storage.

При этом комплекс отличается тем, что в него дополнительно введены модуль виртуализации, модуль диспетчеризации и средство управления графиком, при этом модуль виртуализации связан со второй группой ЭВМ для хранения программных сессий и с ЭВМ управления, модуль диспетчеризации связан со второй группой ЭВМ для хранения программных сессий и с ЭВМ управления, средство управления графиком связано со второй группой ЭВМ для хранения программных сессий и с ЭВМ управления, причем модуль виртуализации выполнен с возможностью создания виртуальной машины (ВМ) посредством эмуляции, по меньшей мере, одного аппаратного ресурса, выбранного из: высокопроизводительных вычислительных ресурсов, разделяемых файловых хранилищ, памяти и создания однозначных связей между, по меньшей мере, одним выбранным аппаратным ресурсом и его эмуляцией; модуль диспетчеризации выполнен с возможностью управления процессами выделения/возврата аппаратных ресурсов для ВМ и назначения для каждой ВМ параметров вес и лимит, где параметр вес определяет величину реального доступного процессорного времени, а параметр лимит определяет величину максимального доступного процессорного времени; средство управления графиком выполнено с возможностью распределения сетевых ресурсов между ВМ на основании информации, полученной от ЭВМ управления.Moreover, the complex is different in that it additionally includes a virtualization module, a scheduling module and a schedule management tool, while a virtualization module is connected to a second computer group for storing program sessions and a control computer, a scheduling module is connected to a second computer group for storing program sessions and with the control computer, the schedule management tool is connected with a second group of computers for storing program sessions and with a control computer, the virtualization module being configured to create a virtual oh machine (VM) by emulating at least one hardware resource selected from: high performance computing resources, shared file storage, memory and creating an unambiguous relation between the at least one hardware resource selected and its emulation; the scheduling module is configured to control the allocation / return of hardware resources for the VM and assign weight and limit parameters for each VM, where the weight parameter determines the amount of real available processor time, and the limit parameter determines the maximum available processor time; the graph management tool is configured to distribute network resources between the VMs based on information received from the management computer.

Технический результат, достигаемый заявляемым изобретением, заключается в существенном снижении времени перевода нагрузки между узлами за счет представленной технологии виртуализации, поскольку она не зависит от типа установленной операционной системы на компьютере пользователя (рабочей ЭВМ) и не требует активизации новой копии программного процесса. Кроме того, введение модуля диспетчеризации с объявленными функциями позволяет обеспечить эффективное распределение нагрузки в системе, учитывая запросы от ЭВМ пользователей и доступные вычислительные мощности реальных устройств.The technical result achieved by the claimed invention is to significantly reduce the transfer time of the load between nodes due to the presented virtualization technology, since it does not depend on the type of installed operating system on the user's computer (working computer) and does not require activation of a new copy of the software process. In addition, the introduction of a dispatching module with declared functions allows for efficient load distribution in the system, taking into account requests from users' computers and the available computing power of real devices.

Указанные выше и другие преимущества заявленного изобретения станут ясными специалисту из приведенного ниже подробного описания существа заявленного изобретения.The above and other advantages of the claimed invention will become clear to the specialist from the following detailed description of the essence of the claimed invention.

Необходимо отметить, что изложенные ниже сведения не следует принимать как ограничивающие объем правовой охраны заявленного изобретения, определенный формулой, поскольку они приведены лишь в качестве примера осуществления изобретения. Специалисту в данной области становится понятным, что могут существовать и другие варианты осуществления настоящего изобретения, согласующиеся с сущностью и объемом настоящего изобретения.It should be noted that the information below should not be taken as limiting the scope of legal protection of the claimed invention defined by the formula, since they are given only as an example of the invention. One skilled in the art will recognize that there may be other embodiments of the present invention consistent with the spirit and scope of the present invention.

Под сетью в данном случае может пониматься как сеть Интернет, так и другие виды сетей (например, LAN, WLAN и т.п.).In this case, a network can be understood as the Internet, as well as other types of networks (for example, LAN, WLAN, etc.).

Для преодоления указанных выше недостатков, существующих в уровне техники решений, в предлагаемый аппаратно-вычислительный комплекс дополнительно вводится система виртуализации аппаратных ресурсов.To overcome the above disadvantages existing in the prior art, a system of virtualization of hardware resources is additionally introduced into the proposed hardware and computer complex.

Технология виртуализации в данном случае представлена гипервизорной виртуализацией аппаратных ресурсов. В основе гипервизорной виртуализации лежит гипервизор (монитор виртуальных машин). Он выполняет роль посредника между физическими устройствами сервера и их представлением в гостевой операционной системе. Отличается гибкостью и поддержкой практически любых операционные систем в качестве гостевых операционных систем.Virtualization technology in this case is represented by hypervisor virtualization of hardware resources. Hypervisor virtualization is based on the hypervisor (virtual machine monitor). It acts as an intermediary between the physical devices of the server and their presentation in the guest operating system. It features flexibility and support for almost any operating system as a guest operating system.

Система виртуализации и управления ресурсами позволяет обеспечить выполнение следующих функций.The virtualization and resource management system allows for the following functions.

Обеспечение возможности виртуализации и разделения между отдельными виртуальными машинами следующих типов аппаратных (физических) ресурсов хоста: физические процессоры, оперативная память, ресурсы хранения данных, внешние аппаратные интерфейсы (USB, IEEE 1394, RS-232, FC, SAS, SCSI, IDE, LPT, СОМ). Монопольное предоставление доступа виртуальной машины к конкретному интерфейсу является частным случаем виртуализации. Виртуализация данных интерфейсов осуществляется как выборочно, в соответствии с потребностями в данных интерфейсах создаваемых виртуальных машин, так и одновременно.Providing virtualization and separation between the following virtual machines of the following types of hardware (physical) host resources: physical processors, RAM, storage resources, external hardware interfaces (USB, IEEE 1394, RS-232, FC, SAS, SCSI, IDE, LPT , COM). The exclusive provision of virtual machine access to a specific interface is a special case of virtualization. Virtualization of these interfaces is carried out both selectively, in accordance with the needs for these interfaces of the created virtual machines, and simultaneously.

Обеспечение возможности запуска и выполнения (в режиме разделения ресурсов) в рамках виртуальных машин следующих типов гостевых операционных систем (далее ОС): а) ОС семейства MS Windows, сертифицированные по требованиям безопасности информации, с возможностью использования в автоматизированных системах с классом защищенности не ниже 1Г; б) ОС семейства Linux, сертифицированные по требованиям безопасности информации, с возможностью использования в автоматизированных системах с классом защищенности не ниже 1Г.Providing the ability to start and execute (in resource sharing mode) within the virtual machines of the following types of guest operating systems (hereinafter OS): a) MS Windows family of OS certified for information security requirements with the possibility of use in automated systems with a security class of at least 1G ; b) OS of the Linux family, certified according to information security requirements, with the possibility of use in automated systems with a security class of at least 1G.

Обеспечение возможности дискретного изменения количества выделенных виртуальным машинам ресурсов (квоты процессорного времени, размеров ресурсов дискового хранения, размеров оперативной памяти).Providing the possibility of discrete changes in the number of resources allocated to virtual machines (processor time quotas, disk storage resource sizes, RAM sizes).

Обеспечение диспетчеризации выполнения виртуальных машин на физических серверах (вторая группа ЭВМ) с учетом приоритетов, назначаемых отдельным виртуальным машинам в момент их запуска.Providing scheduling the execution of virtual machines on physical servers (the second group of computers), taking into account the priorities assigned to individual virtual machines at the time of their launch.

Обеспечение управления запущенными виртуальными машинами, в том числе: изменение приоритета выполнения, изменение квот выделенных ресурсов, перемещение виртуальных машин между хостами.Providing management of running virtual machines, including: changing execution priority, changing quotas for allocated resources, moving virtual machines between hosts.

Обеспечение мониторинга состояния виртуальных машин (загружена/работает/остановлена), количество назначенных ресурсов.Providing monitoring of the state of virtual machines (loaded / running / stopped), the number of assigned resources.

Поддержание не менее 64 виртуальных процессоров на гостевую ОС, с возможностью последующего увеличения до 128.Maintaining at least 64 virtual processors on a guest OS, with the possibility of a subsequent increase to 128.

Поддержание не менее 64 Гб виртуальной оперативной памяти на гостевую ОС, с возможностью увеличения до 128 Гб.Maintaining at least 64 GB of virtual RAM on the guest OS, with the possibility of increasing to 128 GB.

Поддержание не менее 2-х виртуальных сетевых интерфейсов на виртуальную машину, с возможностью последующего увеличения количества в процессе эксплуатации до 8.Maintaining at least 2 virtual network interfaces to a virtual machine, with the possibility of a subsequent increase in number during operation to 8.

Обеспечение возможности виртуализации физических сетевых интерфейсов между виртуальными системами. Монопольное предоставление сетевых ресурсов выделенному виртуальному серверу является частным случаем виртуализации.Enabling virtualization of physical network interfaces between virtual systems. The exclusive provision of network resources to a dedicated virtual server is a special case of virtualization.

Обеспечение создания снимков состояния виртуальных машин по расписанию.Providing scheduled snapshots of virtual machines

Обеспечение возможности архивирования снимков состояния виртуальных машин.Providing the ability to archive virtual machine snapshots.

Обеспечение увеличения размера дискового пространства для гостевых ОС без перезагрузки/выключения до 10 Тб.Providing an increase in disk space for guest operating systems without rebooting / shutting down to 10 TB.

Предлагаемый аппаратно-вычислительный комплекс работает следующим образом.The proposed hardware and computer complex works as follows.

В составе введенного в комплекс гипервизора входит модуль виртуализации, который предназначен для виртуализации аппаратных ресурсов. Под виртуализацией подразумевают маскировку аппаратных ресурсов, поскольку невозможно разделить физические ресурсы между разными вычислительными машинами.The hypervisor introduced into the complex includes a virtualization module, which is designed to virtualize hardware resources. Virtualization means masking hardware resources because it is impossible to share physical resources between different computers.

Процесс виртуализации состоит из эмуляции устройства (аппаратного ресурса), созданием связей между устройством и его эмуляцией, назначением (при необходимости) политик доступа виртуальных машин (ВМ) к виртуализированному ресурсу.The virtualization process consists of emulating a device (hardware resource), creating connections between the device and its emulation, assigning (if necessary) access policies of virtual machines (VMs) to the virtualized resource.

Совокупность ВМ может быть реализована посредством второй группы ЭВМ для хранения программных сессий.A set of VMs can be implemented through a second group of computers for storing program sessions.

За создание виртуальных устройств отвечает модуль виртуализации, за распределение виртуальных ресурсов - модуль диспетчеризации.The virtualization module is responsible for creating virtual devices, and the dispatching module is responsible for the distribution of virtual resources.

Виртуализация памяти определяется как трансляция адресного пространства физической памяти в виртуальное адресное пространство.Memory virtualization is defined as translating the address space of physical memory into a virtual address space.

Виртуализация сети определяется как процесс объединения аппаратных и программных сетевых ресурсов в единую виртуальную сеть. Виртуализация сети разделяется на внешнюю, то есть соединяющую несколько аппаратных сетей в одну виртуальную, и внутреннюю, создающую виртуальную сеть между ВМ, выполняющихся на одном хосте.Network virtualization is defined as the process of combining hardware and software network resources into a single virtual network. Network virtualization is divided into external, that is, connecting several hardware networks into one virtual, and internal, creating a virtual network between VMs running on the same host.

Виртуализация дисковых устройств (файловых хранилищ) определяется как прозрачное представление системы хранения на уровне блоков, когда логический адрес блока никак не привязан к его реальному, физическому адресу. Виртуализация разделяемых дисковых устройств позволяет объединять физические устройства хранения в виртуальные пулы дисков. Из пулов могут выделяться отдельные виртуальные диски, подключаемые при необходимости к ВМ.Virtualization of disk devices (file storages) is defined as a transparent representation of the storage system at the block level, when the logical address of the block is in no way tied to its real, physical address. Virtualization of shared disk devices enables you to combine physical storage devices into virtual disk pools. Separate virtual disks can be allocated from pools, which are connected to the VM if necessary.

Информацией, используемой при реализации алгоритма создания ВМ, являются: уникальные идентификаторы всех аппаратных ресурсов; сведения о доступности аппаратных ресурсов (ОЗУ, процессоры, хранилище); сведения о создаваемой ВМ (ОЗУ, процессоры, размер виртуального диска, сетевые параметры).The information used in the implementation of the VM creation algorithm is: unique identifiers of all hardware resources; information about the availability of hardware resources (RAM, processors, storage); information about the created VM (RAM, processors, virtual disk size, network parameters).

Результатом реализации алгоритма создания ВМ является создание уникального идентификатора ВМ и регистрация параметров ВМ (в ЭВМ управления или в модуле виртуализации).The result of the implementation of the VM creation algorithm is the creation of a unique VM identifier and registration of the VM parameters (in the control computer or in the virtualization module).

Информацией, используемой при реализации алгоритма удаления ВМ, являются: уникальный идентификатор удаляемой ВМ; информация о состоянии удаляемой ВМ (запущена/не запущена).The information used in the implementation of the VM removal algorithm is: a unique identifier for the deleted VM; information about the state of the deleted VM (running / not running).

Результатом реализации алгоритма удаления ВМ является остановка ВМ, если она запущена, и удаление метаданных ВМ и образа жесткого диска. При этом должен происходить запрос состояния ВМ - если ВМ запущена, перед удалением ее необходимо корректно завершить и освободить ресурсы.The result of implementing the VM removal algorithm is to stop the VM, if it is running, and to delete the VM metadata and the hard disk image. At the same time, a VM status request should occur - if the VM is running, it must be correctly completed and resources released before uninstalling.

Миграция ВМ производится в случае необходимости технического обслуживания аппаратного узла, при уплотнении малонагруженных ВМ с целью экономии ресурсов. Информацией, используемой при реализации алгоритма миграции ВМ, являются: уникальный идентификатор переносимой ВМ; метаданные переносимой ВМ; уникальные идентификаторы всех аппаратных ресурсов; сведения о доступности аппаратных ресурсов (ОЗУ, процессоры, хранилище); уникальный идентификатор узла, на который будет произведена миграция;VM migration is carried out in case of need for maintenance of the hardware node, when compacting lightly loaded VMs in order to save resources. The information used in the implementation of the VM migration algorithm is: a unique identifier for the transferred VM; portable VM metadata; Unique identifiers of all hardware resources information about the availability of hardware resources (RAM, processors, storage); unique identifier of the node to which the migration will be made;

Результатом реализации алгоритма миграции ВМ является перенос ВМ на другой аппаратный узел.The result of the implementation of the VM migration algorithm is the transfer of the VM to another hardware node.

При холодной миграции происходит остановка ВМ и запуск ее на другом узле. Согласно требованиям по отказоустойчивости все ресурсы пула равнозначны и располагают информацией о всех ВМ и доступом к единому хранилищу, следовательно переноса информации не требуется, необходимо просто дать команду на запуск ВМ модулю управления другого аппаратного узла.During cold migration, the VM stops and starts it on another node. According to the requirements for fault tolerance, all pool resources are equivalent and have information about all VMs and access to a single repository, therefore, transferring information is not required, you just need to give a command to start the VM to the control module of another hardware node.

При горячей миграции происходит перенос в фоновом режиме образа оперативной памяти запущенной ВМ на другой аппаратный узел, таким образом остановки ВМ не происходит. Под понятием «живая миграция» подразумевается процесс переключения контекста исполнения ВМ с одного хоста пула на другой.During hot migration, the image of the running memory of the running VM is transferred to the other hardware node in the background; thus, the VM does not stop. The term "live migration" means the process of switching the execution context of a VM from one pool host to another.

Модуль виртуализации состоит из нескольких компонентов: компонента предоставления аппаратных ресурсов, предназначенного для выделения аппаратных ресурсов, их виртуализации и предоставления для использования виртуальными машинами; компонента управления, предназначенного для управления компонентой предоставления аппаратных ресурсов и предоставления внешнего интерфейса приложений (API) для ЭВМ управления; компонента регистрации событий, предназначенного для регистрации событий в процессе виртуализации и управления.The virtualization module consists of several components: a component for providing hardware resources, designed to allocate hardware resources, virtualize them and provide them for use by virtual machines; a management component for managing a component for providing hardware resources and providing an external application interface (API) for computer management; event registration component designed to record events during virtualization and management.

Указанные компоненты в составе модуля могут быть выполнены в виде агентов, размещенных на машиночитаемом носителе или в памяти, при выполнении которых компьютером обеспечивается реализация описанных функций. Кроме того, такие компоненты могут быть выполнены в виде устройств, размещенных на общей шине данных, функционирующих под управлением соответствующего программного обеспечения.These components as part of the module can be made in the form of agents located on a computer-readable medium or in memory, during which the computer provides the implementation of the described functions. In addition, such components can be made in the form of devices located on a common data bus, operating under the control of appropriate software.

Модуль диспетчеризации (в составе гипервизора) предназначен для управления процессами выделения/возврата аппаратных ресурсов для ВМ.The dispatching module (as part of the hypervisor) is designed to control the processes of allocation / return of hardware resources for VMs.

В частности, распределение ресурсов процессора происходит по следующему алгоритму.In particular, the distribution of processor resources occurs according to the following algorithm.

Все виртуальные процессоры (vCPU) виртуальных машин выстраиваются в очередь модуля диспетчеризации (например, в его оперативной памяти). Модуль диспетчеризации обрабатывает очередь vCPU, распределяя vCPU между доступными физическими процессорами в соответствии с политиками. Политики распределения описываются параметрами ВМ - параметрами вес и лимит. Значение веса определяет, сколько получит ВМ реального процессорного времени. Например, ВМ с весом 512 получит на хосте в два раза больше процессорного времени физического процессора, чем ВМ со значением веса 256. Значение параметра вес может изменяться в диапазоне от 1 до 65535, по умолчанию равен 256.All virtual processors (vCPUs) of virtual machines are lined up in the dispatch module (for example, in its RAM). The scheduling module processes the vCPU queue, distributing the vCPU among the available physical processors in accordance with the policies. Distribution policies are described by VM parameters - weight and limit parameters. The weight value determines how much real processor time the VM will receive. For example, a VM with a weight of 512 will receive twice as much processor time of a physical processor on the host as a VM with a weight value of 256. The value of the parameter weight can vary from 1 to 65535, the default is 256.

Значение лимита может использоваться для того, чтобы указать максимальную величину процессорного времени, которую может получить ВМ, даже в случае, если хост-система простаивает. Значение выражается в процентах: 100 - это 1 физический процессор, 50 - это половина процессора, 400 - 4 процессора. При этом значение лимита не может быть большим чем VCPU*100, т.е. одному виртуальному процессору не может соответствовать больше чем один реальный процессор.The limit value can be used to indicate the maximum amount of processor time that a VM can receive, even if the host system is idle. The value is expressed as a percentage: 100 is 1 physical processor, 50 is half the processor, 400 is 4 processors. Moreover, the limit value cannot be greater than VCPU * 100, i.e. more than one real processor cannot correspond to one virtual processor.

Ресурсы процессора могут быть выбраны из состава высокопроизводительных вычислительных ресурсов (которые могут представлять собой, например, пул процессоров).Processor resources can be selected from the composition of high-performance computing resources (which can be, for example, a processor pool).

Распределение памяти происходит по следующему алгоритму.The distribution of memory occurs according to the following algorithm.

Модуль диспетчеризации выделяет память виртуальной машине в монопольное пользование. Выделение памяти ВМ больше, чем имеется физической памяти, невозможно. Доступная для ВМ память определяется как объем физической памяти хоста, входящего в пул, за минусом объема памяти, необходимой для работы служебных ВМ. Максимальное количество памяти, выделяемой ВМ, определяется параметрами ВМ при запуске ВМ на исполнение. В случае, если объема доступной виртуальной памяти недостаточно для запуска ВМ с указанным объемом памяти, запуск ВМ невозможен.The dispatch module allocates memory to the virtual machine for exclusive use. Allocating VM memory more than physical memory is not possible. The memory available for the VM is defined as the amount of physical memory of the host that is part of the pool, minus the amount of memory needed to run the service VMs. The maximum amount of memory allocated by the VM is determined by the VM parameters when the VM starts for execution. If the amount of available virtual memory is not enough to start the VM with the specified amount of memory, starting the VM is not possible.

Ресурсы физической памяти могут быть выбраны из состава второй группы ЭВМ для хранения программных сессий.The resources of physical memory can be selected from the second group of computers for storing program sessions.

Распределение сетевых ресурсов между виртуальными машинами выполняется средствами управления графиком.Distribution of network resources between virtual machines is performed by schedule management tools.

Приоритизация обращений ВМ к дисковой подсистеме может выполняться с помощью механизма планировщика CFQ (Completely Fair Queuing) Linux.VM calls to the disk subsystem can be prioritized using the Linux CFQ (Completely Fair Queuing) scheduler mechanism.

Алгоритм распределения дискового пространства между ВМ аналогичен алгоритму распределения памяти.The algorithm for allocating disk space between VMs is similar to the memory allocation algorithm.

Модуль диспетчеризации состоит из нескольких компонентов: компонента выделения/возврата аппаратных ресурсов, предназначенного для управления процессами выделения/возврата аппаратных ресурсов для виртуальных машин и управляющими структурами, контролирующими распределение оперативной памяти между процессами комплекса и виртуальными машинами; компонента управления, предназначенного для управления программной компонентой выделения/возврата аппаратных ресурсов и предоставления внешнего API для ЭВМ управления; компонента регистрации событий, предназначенного для регистрации событий в процессе диспетчеризации и управления.The scheduling module consists of several components: a component of allocation / return of hardware resources, designed to control the processes of allocation / return of hardware resources for virtual machines and control structures that control the distribution of RAM between the processes of the complex and virtual machines; a management component for managing a software component for allocating / returning hardware resources and providing an external API for computer management; component of event registration, designed to register events in the process of scheduling and management.

Указанные компоненты в составе модуля могут быть выполнены в виде агентов, размещенных на машиночитаемом носителе или в памяти, при выполнении которых компьютером обеспечивается реализация описанных функций. Кроме того, такие компоненты могут быть выполнены в виде устройств, размещенных на общей шине данных, функционирующих под управлением соответствующего программного обеспечения.These components as part of the module can be made in the form of agents located on a computer-readable medium or in memory, during which the computer provides the implementation of the described functions. In addition, such components can be made in the form of devices located on a common data bus, operating under the control of appropriate software.

ЭВМ управления обеспечивает ведение мониторинга и учета выделенных и потребленных отдельными виртуальными машинами ресурсов и обменивается полученной информацией и соответствующими командами с модулем виртуализации, модулем диспетчеризации и средством управления графиком.The control computer provides monitoring and accounting of resources allocated and consumed by individual virtual machines and exchanges the information received and the corresponding commands with the virtualization module, the scheduling module, and the schedule management tool.

Это позволяет обеспечить гибкость распределения нагрузки в сети, а также позволяет своевременно обеспечивать создание необходимого количества ВМ для обработки поступающих запросов от рабочих ЭВМ.This allows you to provide flexibility in the distribution of load on the network, and also allows you to timely ensure the creation of the required number of VMs for processing incoming requests from working computers.

Модули виртуализации, диспетчеризации и средства управления графиком могут быть выполнены в виде аппаратно-программного комплекса на базе существующих ЭВМ под управлением соответствующего программного обеспечения.Virtualization, scheduling and schedule management tools can be made in the form of a hardware-software complex based on existing computers under the control of the corresponding software.

Использованная литератураReferences

[1] В.Г. Олифер, Н.А. Олифер. Компьютерные сети, учебник для вузов, СПб., 2005.[1] V.G. Olifer, N.A. Olifer. Computer networks, textbook for universities, St. Petersburg, 2005.

[2] RU 122505 U1, 27.11.2012, Бюл. №33.[2] RU 122505 U1, 11/27/2012, bull. No. 33.

Claims (1)

Аппаратно-вычислительный комплекс виртуализации и управления ресурсами в среде облачных вычислений, включающий в себя связанные между собой и соединенные посредством сети первую группу рабочих ЭВМ и вторую группу ЭВМ для хранения программных сессий, а также ЭВМ управления, через которую связаны вторая группа ЭВМ для хранения программных сессий, высокопроизводительные вычислительные ресурсы и разделяемые файловые хранилища, отличающийся тем, что в него дополнительно введены модуль виртуализации, модуль диспетчеризации и средство управления графиком, при этом модуль виртуализации связан со второй группой ЭВМ для хранения программных сессий и с ЭВМ управления, модуль диспетчеризации связан со второй группой ЭВМ для хранения программных сессий и с ЭВМ управления, средство управления графиком связано со второй группой ЭВМ для хранения программных сессий и с ЭВМ управления, причем модуль виртуализации выполнен с возможностью создания виртуальной машины (ВМ) посредством эмуляции, по меньшей мере, одного аппаратного ресурса, выбранного из: высокопроизводительных вычислительных ресурсов, разделяемых файловых хранилищ, памяти и создания однозначных связей между, по меньшей мере, одним выбранным аппаратным ресурсом и его эмуляцией; модуль диспетчеризации выполнен с возможностью управления процессами выделения/возврата аппаратных ресурсов для ВМ, назначения для каждой ВМ приоритета в момент ее запуска и назначения ей параметров вес и лимит, где параметр вес определяет величину реального доступного процессорного времени, а параметр лимит определяет величину максимального доступного процессорного времени; средство управления графиком выполнено с возможностью распределения сетевых ресурсов между ВМ на основании информации, полученной от ЭВМ управления. The hardware-computer complex of virtualization and resource management in the cloud computing environment, which includes the first group of working computers connected to each other and connected via a network and the second group of computers for storing program sessions, as well as the control computer through which the second group of computers for storing program sessions is connected sessions, high-performance computing resources and shared file storages, characterized in that it additionally includes a virtualization module, a dispatch module, and a control tool the schedule, while the virtualization module is connected with the second group of computers for storing program sessions and with the control computer, the dispatch module is connected with the second group of computers for storing the program sessions and with the control computer, the schedule management tool is connected with the second group of computers for storing the program sessions and with a control computer, the virtualization module being configured to create a virtual machine (VM) by emulating at least one hardware resource selected from: high-performance computing Tel'nykh resources shared file storage, memory and creating an unambiguous relation between the at least one hardware resource selected and its emulation; the scheduling module is capable of controlling the processes of allocating / returning hardware resources for VMs, assigning priority for each VM at the time of its launch and assigning it weight and limit parameters, where the weight parameter determines the amount of real available processor time, and the limit parameter determines the maximum available processor time time; the graph management tool is configured to distribute network resources between the VMs based on information received from the management computer.
RU2013118640/08A 2013-04-23 2013-04-23 Hardware-computer system for virtualisation and management of resources in cloud computing environment RU2543962C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2013118640/08A RU2543962C2 (en) 2013-04-23 2013-04-23 Hardware-computer system for virtualisation and management of resources in cloud computing environment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013118640/08A RU2543962C2 (en) 2013-04-23 2013-04-23 Hardware-computer system for virtualisation and management of resources in cloud computing environment

Publications (2)

Publication Number Publication Date
RU2013118640A RU2013118640A (en) 2014-10-27
RU2543962C2 true RU2543962C2 (en) 2015-03-10

Family

ID=53290470

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013118640/08A RU2543962C2 (en) 2013-04-23 2013-04-23 Hardware-computer system for virtualisation and management of resources in cloud computing environment

Country Status (1)

Country Link
RU (1) RU2543962C2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2665224C1 (en) * 2017-11-09 2018-08-28 Российская Федерация, от имени которой выступает Государственная корпорация по космической деятельности "РОСКОСМОС" Method of dynamic control of conflict situations in complex technical systems with environmental cloud computing
RU2665246C1 (en) * 2017-11-09 2018-08-28 Российская Федерация, от имени которой выступает Государственная корпорация по космической деятельности "РОСКОСМОС" Hardware computing system of virtualization and resource management in the cloud computing environment
RU2729228C1 (en) * 2019-12-25 2020-08-05 Федеральное государственное казенное военное образовательное учреждение высшего образования Академия Федеральной службы охраны Российской Федерации Method of managing distribution of resources in distributed information-computing environments
RU2729885C2 (en) * 2015-10-13 2020-08-13 Шнейдер Электрик Эндюстри Сас Software-defined automated system and architecture

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697329A (en) * 2022-03-28 2022-07-01 北京蓝耘科技股份有限公司 HPC cloud computing system based on cloud computing mobile network resource management

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7424543B2 (en) * 1999-09-08 2008-09-09 Rice Iii James L System and method of permissive data flow and application transfer
RU122505U1 (en) * 2012-07-25 2012-11-27 Федеральное государственное бюджетное учреждение науки Институт системного программирования Российской академии наук (ИСП РАН) HARDWARE-COMPUTER COMPLEX FOR PROVIDING ACCESS TO THE SOFTWARE IN THE CONCEPT OF CLOUD COMPUTING

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7424543B2 (en) * 1999-09-08 2008-09-09 Rice Iii James L System and method of permissive data flow and application transfer
RU122505U1 (en) * 2012-07-25 2012-11-27 Федеральное государственное бюджетное учреждение науки Институт системного программирования Российской академии наук (ИСП РАН) HARDWARE-COMPUTER COMPLEX FOR PROVIDING ACCESS TO THE SOFTWARE IN THE CONCEPT OF CLOUD COMPUTING

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2729885C2 (en) * 2015-10-13 2020-08-13 Шнейдер Электрик Эндюстри Сас Software-defined automated system and architecture
RU2747966C2 (en) * 2015-10-13 2021-05-18 Шнейдер Электрик Эндюстри Сас Centralized control of software-defined automated system
RU2665224C1 (en) * 2017-11-09 2018-08-28 Российская Федерация, от имени которой выступает Государственная корпорация по космической деятельности "РОСКОСМОС" Method of dynamic control of conflict situations in complex technical systems with environmental cloud computing
RU2665246C1 (en) * 2017-11-09 2018-08-28 Российская Федерация, от имени которой выступает Государственная корпорация по космической деятельности "РОСКОСМОС" Hardware computing system of virtualization and resource management in the cloud computing environment
RU2729228C1 (en) * 2019-12-25 2020-08-05 Федеральное государственное казенное военное образовательное учреждение высшего образования Академия Федеральной службы охраны Российской Федерации Method of managing distribution of resources in distributed information-computing environments

Also Published As

Publication number Publication date
RU2013118640A (en) 2014-10-27

Similar Documents

Publication Publication Date Title
Bhimani et al. Accelerating big data applications using lightweight virtualization framework on enterprise cloud
EP4050477B1 (en) Virtual machine migration techniques
US9239765B2 (en) Application triggered state migration via hypervisor
US9875122B2 (en) System and method for providing hardware virtualization in a virtual machine environment
US8381002B2 (en) Transparently increasing power savings in a power management environment
US8850434B1 (en) System and method of constraining auto live migration of virtual machines using group tags
EP1622014B1 (en) Systems and methods for inializing multiple virtual processors within a single virtual machine
US8019861B2 (en) Speculative virtual machine resource scheduling
JP6564838B2 (en) Multi-operating system operating method and apparatus based on Industrial Internet Operating System
US20180139100A1 (en) Storage-aware dynamic placement of virtual machines
RU2543962C2 (en) Hardware-computer system for virtualisation and management of resources in cloud computing environment
JP2013511079A (en) Symmetric live migration of virtual machines
US8990520B1 (en) Global memory as non-volatile random access memory for guest operating systems
Matsumoto et al. Dynamic resource management in cloud environment
US20190146888A1 (en) Handling migration in a virtualization environment
WO2021018267A1 (en) Live migration method for virtual machine and communication device
RU2665246C1 (en) Hardware computing system of virtualization and resource management in the cloud computing environment
US20180136958A1 (en) Storage-aware dynamic placement of virtual machines
Radiskhlebova et al. Study of the possibilities of using virtualization tools to optimize the cluster resources management
US8402191B2 (en) Computing element virtualization
Kulkarni et al. Virtualization technology: A leading edge
US20190332413A1 (en) Migration of services of infrastructure management virtual machines to containers
US20230205653A1 (en) Metering framework for improving resource utilization for a disaster recovery environment
Kang et al. Partial migration technique for GPGPU tasks to Prevent GPU Memory Starvation in RPC‐based GPU Virtualization
Quesnel et al. Operating systems and virtualization frameworks: From local to distributed similarities

Legal Events

Date Code Title Description
TK4A Correction to the publication in the bulletin (patent)

Free format text: AMENDMENT TO CHAPTER -FG4A- IN JOURNAL: 7-2015 FOR TAG: (54)