ES2953737T3

ES2953737T3 - Asignación dinámica de recursos de cálculo heterogéneos determinada por ejecución de aplicaciones

Info

Publication number: ES2953737T3
Application number: ES19700841T
Authority: ES
Inventors: Thomas Lippert; Bernhard Frohwitter
Original assignee: Partec AG
Current assignee: Partec AG
Priority date: 2018-01-23
Filing date: 2019-01-23
Publication date: 2023-11-15
Anticipated expiration: 2039-01-23
Also published as: HUE062986T2; EP3743812C0; PL3743812T3; KR20200107971A; US20210096923A1; WO2019145354A1; HRP20231058T1; CN111656323A; EP3743812B1; RU2020123319A; CA3087219A1; US11537442B2; JP2021511609A; JP2024040165A; EP3743812A1

Abstract

La presente invención proporciona un método para operar un sistema informático heterogéneo que comprende una pluralidad de nodos de cómputo y una pluralidad de nodos de refuerzo, estando dispuesto al menos uno de la pluralidad de nodos de cómputo y la pluralidad de nodos de refuerzo para calcular una tarea de cómputo, la tarea de cómputo que comprende una pluralidad de subtareas, en donde en una primera iteración informática, la pluralidad de subtareas son asignadas y procesadas por uno de la pluralidad de nodos de cálculo y nodos de refuerzo en una primera distribución; y la información relacionada con el procesamiento de la pluralidad de subtareas por la pluralidad de nodos de cómputo y nodos de refuerzo se usa para generar una distribución adicional de las subtareas entre los nodos de cómputo y el nodo de refuerzo para procesarlas en una iteración de cómputo adicional. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Asignación dinámica de recursos de cálculo heterogéneos determinada por ejecución de aplicaciones

La presente invención se refiere a un mecanismo para ejecutar tareas de cálculo dentro de un entorno informático, en particular de un entorno informático heterogéneo adaptado para el tratamiento paralelo de una tarea de cálculo.

La presente invención es un desarrollo del sistema descrito en la solicitud anterior WO 2012/049247 A1, el documento ^wO 2012/049247 A1, que describe una arquitectura de ordenadores en clúster que comprende una pluralidad de nodos de cálculo y una pluralidad de nodos de refuerzo conectados entre sí por medio de una interfaz de comunicación. Un gestor de recursos es responsable de la asignación de uno o más nodos de refuerzo de los nodos de cálculo entre sí de una manera dinámica durante el tiempo de ejecución. Un ejemplo de dicha gestión de tratamiento dinámica se describe en Clauss et al., “Gestión de Tratamiento Dinámico con Coplanificación de Asignación Interna hacia el Supercálculo Interactivo”, COSH 2016, 19 de enero, Praga, CZ. Aunque la disposición del documento WO 2012/049247 proporciona una disposición flexible para asignar reforzadores para nodos de cálculo, no presta atención a la forma de distribución de las tareas entre los nodos de cálculo de refuerzo.

La disposición del documento WO 2012/049247 se describe también por Eicker et al. en “El Proyecto DEEP, una estrategia alternativa al cálculo en clúster heterogéneo en la era multinúcleos”. Concurrency Computa!: Pract. Exper.

2016; 28: 2394 - 2411. El sistema heterogéneo que se describe comprende una pluralidad de nodos de cálculo y una pluralidad de nodos de refuerzo conectados a una red conmutable. Con el fin de tratar una aplicación, la aplicación es “tareificada” con el fin de proporcionar una indicación acerca de qué tareas pueden ser descargadas desde un nodo de cálculo hasta un reforzador. La tareificación se consigue mediante el desarrollador de aplicaciones que anota el código con pragmas que indican las dependencias entre diferentes tareas y así mismo las etiquetas que indican las partes de código altamente escalables que deben ser tratadas por un reforzador. La escabilidad en este contexto hace referencia a cuando la carga ofrecida al servicio aumenta, un incremento paulatino y lineal en el hardware puede mantener el mismo nivel de servicio por usuario.

El documento US 2017/262311 A1 describe un aspecto de procesos de tiempo de ejecución que pueden total o parcialmente automatizar la distribución de datos y el establecimiento de correspondencia de tareas en recursos de cálculo. Un denominado experto sintonizador, esto es, un operador personal, puede ser de nuevo requerido para establecer la correspondencia de las acciones respecto de los recursos disponibles. En esencia, se describe cómo una aplicación determinada que debe ser calculada puede establecer la correspondencia sobre una jerarquía de computación determinada.

La presente invención proporciona un procedimiento de explotación de un sistema informático heterogéneo que comprende una pluralidad de nodos de cálculo y una pluralidad de nodos de refuerzo, estando al menos uno de la pluralidad de nodos de cálculo y de la pluralidad de nodos de refuerzo dispuesto para calcular una tarea de cálculo, comprendiendo la tarea de cálculo una pluralidad de subtareas, en el que en una primera iteración de cálculo, la pluralidad de subtareas es asignada a y tratada por uno o unos entre la pluralidad de nodos de cálculo y de nodos de refuerzo en una primera distribución, utilizando las informaciones relacionadas con el tratamiento de la pluralidad de subtareas por la pluralidad de nodos de cálculo y de nodos de refuerzo para generar una distribución de las subtareas entre los nodos de cálculo y los nodos de refuerzo para de esta forma tratar una iteración de cálculo adicional.

De modo preferente, las informaciones se proporcionan mediante unos respectivos demonios (o duendes) que operan en cada uno de los nodos de cálculo y de refuerzo. Las informaciones suministradas permiten que un gestor de aplicaciones determine si la distribución de subtareas entre los nodos de cálculo y los nodos de refuerzo puede ser adaptada o mejorada tras una iteración de cálculo adicional.

Un gestor de recursos puede determinar la asignación de tareas y subtareas a los nodos de cálculo y a los nodos de refuerzo respecto de la primera iteración en función de la tarea de cálculo y de los parámetros adicionales. El gestor de aplicaciones trata las informaciones como datos de entrada al gestor de recursos, de manera que el gestor de recursos dinámicamente altera en mayor medida las distribuciones durante el cálculo de la tarea de cálculo.

En un aspecto adicional de la invención, el gestor de recursos, en base a las informaciones, dinámicamente altera la asignación de los nodos de cálculo y de los nodos de refuerzo entre sí durante el cálculo de la tarea de cálculo.

La distribución inicial puede también determinarse mediante la utilización por parte del gestor de aplicaciones de las informaciones suministradas por un usuario del sistema en el código de programación compilado para su ejecución por el sistema. Como alternativa, el gestor de aplicaciones puede estar dispuesto de tal manera que genere dicha distribución en base a un análisis de la codificación de subtareas.

En un aspecto adicional, la invención proporciona un sistema de cálculo heterogéneo que comprende una pluralidad de nodos de cálculo y una pluralidad de nodos de refuerzo para el cálculo de una o más tareas que comprenden múltiples subtareas, una interfaz de comunicación que conecta los nodos de cálculo entre sí y con los nodos de refuerzo, en el que el sistema comprende un gestor de recursos para asignar nodos de refuerzo y nodos de cálculo entre sí para el cálculo de las tareas y en el que el sistema comprende además un gestor de aplicaciones, estando el gestor de aplicaciones dispuesto par recibir las informaciones procedentes de los demonios que operan en los nodos de cálculo y en los nodos de refuerzo para actualizar una distribución de las subtareas entre los nodos de cálculo y los nodos de refuerzo entre una primera iteración de cálculo y una iteración de cálculo adicional.

En otro aspecto adicional de la invención, el gestor de recursos recibe las informaciones de tal manera que el gestor de recursos dinámicamente altera la asignación de los nodos de cálculo y de los nodos de refuerzo, los unos con los otros durante el cálculo de la tarea de cálculo. A continuación, se describirán formas de realización de la invención, únicamente a modo de ejemplo, con referencia a los dibujos que se acompañan, en los cuales:

La Fig. 1 muestra un diagrama esquemático de un sistema de ordenadores en clúster que incorpora la invención.

Con referencia a la Fig. 1, en ella se muestra una representación esquemática de un sistema de ordenadores en clúster 10 que incorpora la invención. El sistema 10 comprende una pluralidad de nodos de cálculo 20 y una pluralidad de nodos de refuerzo 22. Los nodos de cálculo 20 y los nodos de refuerzo están conectados por medio de una infraestructura de comunicación 24, estando los nodos de refuerzo conectados a la interfaz de comunicación por medio de una interfaz de refuerzo 23. Cada uno de los nodos de cálculo 20 y de los nodos de refuerzo 22 está representado esquemáticamente por un rectángulo y cada uno de estos nodos en funcionamiento incorpora al menos un demonio entre un respectivo demonio 26a y 26b, esquemáticamente ilustrados mediante un cuadrado dentro del rectángulo del respectivo nodo. El demonio de la presente invención es una aplicación que discurre como un proceso de fondo y es capaz de proporcionar las informaciones tal como son utilizadas en la presente memoria. Clauss et al., “Gestión de Tratamiento Dinámico con Coprogramación de Asignación Interna hacia un Supercálculo Interactivo”, COSH 2016, 19 de enero, Praga, CZ, divulgan unos demonios como los referidos en la presente memoria.

El sistema 10 también incluye un gestor de recursos 28 mostrado conectado a la infraestructura de comunicación 24 y un gestor de aplicaciones 30. Cada uno entre el gestor de recursos 28 y el gestor de aplicaciones 30 incluye un demonio respectivo 32 y 34. Los nodos de cálculo 20 pueden ser idénticos entre sí o pueden ser de características diferentes. Cada nodo de cálculo incorpora uno o más procesadores multinúcleo como por ejemplo el procesador Intel Xeon E5-2680. Los nodos están conectados entre sí por medio de una interfaz de comunicación que puede basarse en una estructura Mellanox InfiniBand ConnectX, capaz de transferir datos a una velocidad de muchos Gbits. La interfaz de nodos de cálculo se intercomunica a través de la interfaz de comunicación con la pluralidad de nodos de refuerzo, en teoría a través de una serie de interfaces de refuerzo 40. Como se muestra, los nodos de refuerzo albergan al menos un procesador tipo acelerador, por ejemplo, un procesador multinúcleo Intel Xeon Phi, capaz de poner en marcha y ejecutar autónomamente su propio sistema operativo. Dicha tecnología se describe en Concurrency Computat.: Pract. Exper. 2016; 28: 2394 -2411 anteriormente referenciado.

Así mismo, el sistema 10 puede incluir una capa de abstracción de cálculo modular según se describe en la solicitud no publicada PCT/EP 2017/075375, para posibilitar la comunicación entre los demonios y el gestor de aplicaciones.

Una tarea que debe ser calculada por el sistema puede comprender una pluralidad de tareas algunas de las cuales o todas pueden ser repetidas una serie de veces durante la ejecución de la tarea o trabajo. Por ejemplo, el trabajo puede ser una simulación basada en “Monte - Carlo” donde un efecto es modelado utilizando un número aleatorio, repitiéndose en los cálculos muchas veces de forma reiterada.

Las tareas pueden comprender una pluralidad de subtareas o núcleos. Cada una de estas subtareas puede ser más o menos apropiada para su tratamiento por uno o más nodos de cálculo o por uno o más reforzadores. En particular, la escabilidad de la subtarea puede indicar si es más apropiada para la tarea que debe ser tratada por un nodo de cálculo o por un reforzador. El sistema es flexible en todas direcciones, permitiendo también el tratamiento conjunto de subtareas por todos los nodos a los que se dirigen en la presente memoria, así como la remodelación del tratamiento entre los nodos.

Si una tarea es calculada con una primera división de subtareas entre un nodo de cálculo y un reforzador, es posible que dicha división no sea una división óptima para el cálculo de la tarea. Determinadas subtareas que fueron asignadas a un reforzador en la primera iteración podrían de hecho no ser apropiadas para su tratamiento mediante el reforzador de manera que un tratamiento de las subtareas por un nodo de cálculo distinto de un reforzador podría optimizar el cálculo de la tarea como conjunto. Por consiguiente, para una segunda y posibles iteraciones adicionales, si fuera necesario, de la tarea con una segunda y / o adicionales distribución alterada de subtareas podría mejorar la eficiencia del cálculo de la tarea.

Por consiguiente, el sistema 10 incluye un mecanismo por medio del cual cada uno de los nodos de cálculo y de los nodos en clúster están dispuestos de manera que los demonios 26a, 26b y 32 retrotraigan las informaciones hacia el demonio 34 relativas al tratamiento de las subtareas y a un estado actual de la respectiva entidad de tratamiento. El demonio 34 utiliza las informaciones utilizadas por los demonios 26a, 26b y 32 para determinar si la distribución de subtareas a los nodos de cálculo y a los reforzadores podría ser ajustada para optimizar o adaptar el cálculo de la tarea respecto de una segunda subsecuente iteración. El gestor de recursos puede también reasignar los nodos de cálculo y los reforzadores unos con otros, además de la distribución ajustada de las tareas.

Un trabajo que incluye una tarea en la que un operador ha estimado un factor de escabilidad para cada subtarea es introducido en el sistema. Esta tarea es compilada y el código compilado es ejecutado. En la ejecución, una tarea es analizada por el gestor de aplicaciones y las subtareas de la tarea son divididas en subtareas apropiadas de nodos de cálculo y de subtareas apropiadas de reforzador y estas informaciones son transmitidas al gestor de recursos para la asignación de reforzadores a los nodos de cálculo. Durante una primera iteración de la tarea, los resultados de la ejecución de las subtareas son recogidos de manera conjunta con las informaciones procedentes de los demonios relativas al tratamiento de las tareas y del estado de los nodos. El gestor de aplicaciones lleva a cabo entones una reasignación de las tareas para una iteración subsiguiente de la tarea y trasmite estas informaciones de asignación utilizadas al gestor de recursos el cual puede también ajustar la asignación de reforzadores a los nodos de manera consecuente.

Respecto de cada iteración, los demonios que operan en los nodos de cálculo y en los reforzadores dan cuenta de las informaciones de estado al gestor de aplicaciones y al gestor de recursos haciendo posible el cálculo de las subsiguientes iteraciones que deben ser optimizadas por ajustes adicionales a la asignación de subtareas a los nodos de cálculo y a los reforzadores.

Aunque el anterior procedimiento ha sido descrito como incorporando una etapa de tareificiación en el que factor de escabilidad inicial puede ser introducido por el codificador de programa, también es posible que el gestor de aplicaciones automáticamente fije un factor de escabilidad inicial respecto de las subtareas, con la mejora de las subsiguientes operaciones de este ajuste inicial. Dicha disposición tiene la ventaja de que se consigue que la codificación de las tareas sea más directa, posibilitando con ello una manejabilidad mejorada del sistema con respecto a codificadores de programa no familiarizados con operaciones de cálculo en clúster.

Tanto como para ajustar la distribución de subtareas entre nodos de cálculo y reforzadores en base a la escabilidad de subtareas, la distribución puede también verse influida por las informaciones conocidas acerca del tratamiento de la subtarea y de cualquier necesidad de solicitar otras subtareas durante el tratamiento. En el caso de que una primera subtarea sea gestionada por un reforzador y requiera unos datos de entrada procedentes de una segunda subtarea que no es gestionada por el reforzador, esto puede conducir a una interrupción en el tratamiento de la primera subtarea. Por consiguiente, el demonio del reforzador que maneja la primera subtarea puede informar acerca de esta situación al gestor de aplicaciones, de manera que, en una iteración adicional, tanto la primera como la segunda subtareas sean manejadas por el reforzador. Por consiguiente, el gestor de aplicaciones está dispuesto para utilizar las informaciones suministradas por los demonios que operan en los nodos de cálculo y en los reforzadores para ajustar las agrupaciones de subtareas para la asignación de los nodos de cálculo y de los reforzadores.

Aunque a los nodos de cálculo de la Fig. 1 se les ha otorgado el mismo número de referencia, lo mismo que a los nodos de refuerzo, esto no implica que todos los nodos de cálculo sean idénticos entre sí, y que todos los nodos de refuerzo sean también idénticos entre sí. El sistema 10 puede incorporar nodos de cálculo y / o nodos de refuerzo añadidos al sistema los cuales difieran en determinadas características de los demás nodos de cálculo / reforzadores. Por consiguiente, los concretos nodos de cálculo y / o nodos de refuerzo pueden estar particularmente indicados para el tratamiento de subtareas concretas. El gestor de aplicaciones tiene en cuenta estas informaciones estructurales y transfiere dichas informaciones de asignación al gestor de recursos para asegurar que las subtareas sean distribuidas de una forma óptima.

Un importante aspecto de la invención se refiere al reconocimiento de que un establecimiento de correspondencia, una personalización de las tareas de cálculo y de las subtareas sobre una jerarquía informática puede no proporcionar el suficiente uso de la flexibilidad inherente y de la adaptabilidad de la arquitectura informática, como se muestra como ejemplo de acuerdo con el documento WO 2012/049247 A1. Por tanto, la presente invención integra la personalización de la tarea de aplicación de la manera máxima suficiente, como ejemplo de acuerdo con el documento WO 2017/0262319 A1, así como la configuración dinámica de los nodos de cálculo y de los nodos de refuerzo unos con otros, y en definitiva la readaptación dinámica del establecimiento de correspondencia de las tareas de cálculo durante el tiempo de ejecución en base a la información proporcionada por los demonios acerca de la eficiencia de la ejecución o de la tarea de cálculo, y la reasignación dinámica de los nodos de cálculo y de los reforzadores de cálculo unos con otros.

Claims

REIVINDICACIONES

1. - Un procedimiento de explotación de un sistema informático heterogéneo (10) que comprende una pluralidad de nodos de cálculo (20) y una pluralidad de nodos de refuerzo (22), estando dispuesto al menos uno de la pluralidad de nodos de cálculo (20) y de la pluralidad de nodos de refuerzo (22) para calcular una tarea de cálculo, comprendiendo la tarea de cálculo una pluralidad de subtareas, en el que

en una primera iteración de cálculo, la pluralidad de subtareas es asignada y tratada por un nodo entre la pluralidad de nodos de cálculo (20) y de nodos de refuerzo (22) en una primera distribución;

caracterizado porque

las informaciones relativas al tratamiento de la pluralidad de subtareas por la pluralidad de nodos de cálculo (20) y por nodos de refuerzo (22) es utilizada para generar una distribución adicional de las subtareasentre los nodos de cálculo (20) y los nodos de refuerzo (22) para su tratamiento en el curso de una iteración de cálculo adicional.

2. - El procedimiento de acuerdo con la reivindicación 1, en el que un gestor de aplicaciones (30) recibe las informaciones y determina la distribución adicional.

3. - El procedimiento de acuerdo con la reivindicación 2, en el que un gestor de recursos (28) determina la asignación de tareas y de subtareas a los nodos de cálculo (20) y a los nodos de refuerzo (22) para la primera iteración en función de la tarea de cálculo y en el que el gestor de aplicaciones (30) recibe las informaciones y las trata como datos de entrada al gestor de recursos (28), de manera que el gestor de recursos (20) dinámicamente altera la distribución adicional durante el cálculo de la tarea de cálculo.

4. - El procedimiento de acuerdo con la reivindicación 3, en el que el gestor de recursos (28) recibe las informaciones de manera que el gestor de recursos (28) altera dinámicamente la asignación de los nodos de cálculo (20) y de los nodos de refuerzo (22) unos en relación con los otros, durante el cálculo de la tarea de cálculo.

5. - El procedimiento de acuerdo con la reivindicación 1 o 2, en el que unos demonios (26a, 26b) operan en los nodos de cálculo (20) y en los nodos de refuerzo (22) para generar las informaciones.

6. - El procedimiento de acuerdo con cualquier reivindicación precedente, en el que la primera distribución se determina en base a la clasificación suministrada en el código fuente para cada subtarea.

7. - El procedimiento de acuerdo con cualquier reivindicación precedentes en el que las informaciones son utilizadas para suministrar una agrupación de subtareas en al menos una entre la primera y la segunda iteraciones.

8. - El procedimiento de acuerdo con la reivindicación 3, en el que un demonio que opera un demonio genera una medida de una carga del nodo durante el tratamiento de una subtarea.

9. - Un sistema informático heterogéneo (10) que comprende una pluralidad de nodos de cálculo (20) y una pluralidad de nodos de refuerzo (22) para el cálculo de una o varias tareas que comprenden varias subtareas, uniendo una interfaz de comunicación los nodos de cálculo (20) entre ellos y los nodos de refuerzo (22), en el que el sistema (10) comprende un gestor de recursos (28) para asignar los nodos de refuerzo (22) y los nodos de cálculo (20) los uno con respecto de los otros para el cálculo de las tareas

Caracterizado porque

el sistema (10) comprende además un gestor de aplicaciones (30), estando el gestor de aplicaciones (30) provisto para recibir informaciones relativas al tratamiento de la pluralidad de subtareas proveniente de los demonios (26a, 26b) que operan en los nodos de cálculo (20) y en los nodos de refuerzo (22) con el fin de actualizar un reparto de las subtareas entre los nodos de cálculo (20) y los nodos de refuerzo (22) para una iteración de cálculo adicional.

10. - El sistema informático (10) de acuerdo con la reivindicación 9, en el que el gestor de recursos (28) recibe las informaciones, de manera que el gestor de recursos (28) modifica dinámicamente la asignación de nodos de cálculo (20) y de nodos de refuerzo (20) los unos respecto de los otros.