DE112012005529T5

DE112012005529T5 - Dynamisches Skalieren von mehrschichtigen Anwendungen in einer Cloud-Umgebung

Info

Publication number: DE112012005529T5
Application number: DE112012005529.2T
Authority: DE
Inventors: Gargi Banerjee Dasgupta; Akshat Verma; Sankalp Gera; Balaji Viswanathan
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2011-12-30
Filing date: 2012-11-14
Publication date: 2014-10-02
Also published as: CN104025055A; CN104025055B; US8756610B2; US20130174149A1; US20130174146A1; WO2013097552A1; US8756609B2

Abstract

Eine voraussichtliche Arbeitslast einer mehrschichtigen Anwendung wird für einen definierten Zeitraum ermittelt. Für die voraussichtliche Arbeitslast wird eine Änderung der Anwendungskapazität ermittelt. Für die Änderung der Anwendungskapazität wird dynamisch eine Skalierungsstrategie gewählt, wobei die Skalierungsstrategie ein vertikales und ein horizontales Skalieren beinhaltet.

Description

TECHNISCHES GEBIET
Die vorliegende Offenbarung betrifft das Cloud-Computing und Cloud-Computing-Anwendungen und insbesondere das Skalieren einer Anwendung in Cloud-Computing-Umgebungen.
HINTERGRUND
Cloud-Computing betrifft allgemein servergestützte Datenverarbeitungsressourcen, auf die über ein Datenverarbeitungsnetzwerk wie beispielsweise ein Weitverkehrsnetzwerk, das Internet oder dergleichen zugegriffen werden kann. Die Datenverarbeitungsressourcen können beinhalten: Anwendungen, die über Fernzugriff auf Servern ausgeführt werden können, welche als Cloud-Server bezeichnet werden; Datenspeicher und dergleichen. In einer Cloud-Umgebung kann die gesamte Verarbeitung und Datenspeicherung auf Cloud-Servern und zugehörigen Speichereinheiten abgewickelt werden. Demgemäß brauchen Benutzer von Cloud-Computing-Ressourcen Daten nicht lokal zu speichern oder verwendete Anwendungen lokal auszuführen.
Cloud-Computing-Ressourcen können im Allgemeinen angepasst werden, um eine bestimmte Nachfrage oder einen bestimmten Bedarf zu befriedigen, indem zum Beispiel zusätzliche Verarbeitungs- oder Speicherressourcen bereitgestellt werden. Da der Speicherbedarf einer Cloud-Anwendung jedoch zeitlich schwanken kann, müssen die verfügbaren Ressourcen verwaltet werden. Wenn die verfügbaren Ressourcen für einen bestimmten Bedarf nicht ausreichen, kann die Leistungsfähigkeit der Cloud-Anwendung darunter leiden. Wenn hingegen die verfügbaren Cloud-Ressourcen den Bedarf übersteigen, können die Ressourcen nicht ausgelastet sein, was unnötige Kosten oder verschenkte Möglichkeiten bedeutet, die Ressourcen für andere Zwecke zu nutzen. Aktivitätsspitzen, in denen der Bedarf nach Ressourcen im Verlauf von Minuten oder einigen Stunden sehr schnell ansteigen kann, zum Beispiel eine Zunahme um ein Vielfaches oder um Größenordnungen, können an die Verwaltung von Cloud-Ressourcen große Anforderungen stellen.
KURZDARSTELLUNG DER OFFENBARUNG
Gemäß einer ersten Ausführungsform kann ein Skalierungsverfahren das Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum durch eine Datenverarbeitungseinheit beinhalten. Für die voraussichtliche Arbeitslast kann eine Änderung der Anwendungskapazität ermittelt werden. Für die Änderung der Anwendungskapazität kann dynamisch eine Skalierungsstrategie gewählt werden. Die Skalierungsstrategie kann vertikales Skalieren und horizontales Skalieren beinhalten.
Hierzu können ein oder mehrere der folgenden Merkmale gehören. Zu der Skalierungsstrategie kann ein Implementieren einer Vielzahl virtueller Maschinen gehören, auf denen die mehrschichtige Anwendung ausgeführt wird. Jeder aus der Vielzahl virtueller Maschinen können allgemein gleich konfigurierte Ressourcen zugeordnet sein. Mindestens eine virtuelle Maschine kann so implementiert sein, dass ihr geringere Ressourcen zugeordnet sind. Wenn die Änderung der Anwendungskapazität geringer als die Restkapazität der virtuellen Maschine mit den zugeordneten geringeren Ressourcen ist, kann die virtuelle Maschine mit den zugeordneten geringeren Ressourcen durch Wählen der Skalierungsstrategie vertikal auf die allgemein gleich konfigurierte Ressourcenzuordnung skaliert werden. Wenn die Änderung der Anwendungskapazität größer als eine Restkapazität in der virtuellen Maschine mit den zugeordneten geringeren Ressourcen ist, kann die virtuelle Maschine mit den zugeordneten geringeren Ressourcen durch Wählen der Skalierungsstrategie vertikal auf die allgemein gleich konfigurierte Ressourcenzuordnung und die Anwendung horizontal skaliert werden, was ein Implementieren einer neuen virtuellen Maschine beinhaltet, deren Ressourcenzuordnung geringer als die allgemein gleich konfigurierte Ressourcenzuordnung ist.
Zum dynamischen Wählen einer Skalierungsstrategie kann ein fortlaufendes Wählen einer Skalierungsstrategie zumindest teilweise auf der Grundlage der voraussichtlichen Arbeitslast gehören. Dem Ermitteln einer voraussichtlichen Arbeitslast können zumindest teilweise Langzeitbedarfsdaten für die Arbeitslast zugrunde gelegt werden. Das dynamische Wählen einer Skalierungsstrategie kann ein Skalieren von Ressourcen beinhalten, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind.
Gemäß einer anderen Implementierung beinhaltet ein Computerprogrammprodukt ein computerlesbares Medium mit einer Vielzahl darauf gespeicherter Anwendungen. Bei Ausführung durch einen Prozessor können die Anwendungen diesen veranlassen, Operationen auszuführen, darunter Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum. Die Anwendungen können den Prozessor auch veranlassen, eine Änderung der Anwendungskapazität für die voraussichtliche Arbeitslast zu ermitteln. Für die Änderung der Anwendungskapazität kann dynamisch eine Skalierungsstrategie gewählt werden, wobei die Skalierungsstrategie vertikales Skalieren und horizontales Skalieren beinhaltet.
Hierzu können ein oder mehrere der folgenden Merkmale gehören. Die Skalierungsstrategie kann ein Implementieren einer Vielzahl virtueller Maschinen beinhalten, auf denen die mehrschichtige Anwendung ausgeführt wird. Jeder aus der Vielzahl virtueller Maschinen können allgemein gleich konfigurierte Ressourcen zugeordnet sein. Mindestens eine virtuelle Maschine kann so implementiert sein, dass ihr geringere Ressourcen zugeordnet sind. Wenn die Änderung der Anwendungskapazität geringer als die Restkapazität der virtuellen Maschine mit den zugeordneten geringeren Ressourcen ist, können die Anweisungen zum Wählen der Skalierungsstrategie Anweisungen zum vertikalen Skalieren der virtuellen Maschine mit den zugewiesenen geringeren Ressourcen auf die allgemein gleich konfigurierte Ressourcenzuordnung beinhalten. Wenn die Änderung der Anwendungskapazität größer als eine Restkapazität der virtuellen Maschine mit den zugeordneten geringeren Ressourcen ist, können die Anweisungen zum Wählen der Skalierungsstrategie Anweisungen zum vertikalen Skalieren der virtuellen Maschine mit den zugeordneten geringeren Ressourcen auf die allgemein gleich konfigurierte Ressourcenzuordnung und zum horizontalen Skalieren der Anwendung beinhalten, was ein Implementieren einer neuen virtuellen Maschine mit einer Ressourcenzuordnung beinhaltet, die geringer als die allgemein gleich konfigurierte Ressourcenzuordnung ist.
Zu den Anweisungen zum dynamischen Wählen einer Skalierungsstrategie können Anweisungen zum fortlaufenden Wählen einer Skalierungsstrategie zumindest teilweise auf der Grundlage der voraussichtlichen Arbeitslast gehören. Dem Ermitteln einer voraussichtlichen Arbeitslast können zumindest Langzeitbedarfsdaten für die Arbeitslast zugrunde gelegt werden. Zu den Anweisungen zum dynamischen Wählen einer Skalierungsstrategie können Anweisungen zum Skalieren von Ressourcen gehören, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind.
Gemäß einer anderen Implementierung kann ein System einen Prozessor und eine mit den Prozessoren verbundene Speicherarchitektur beinhalten. Ein erstes Software-Modul kann durch den Prozessor und die Speicherarchitektur ausführbar sein. Das erste Software-Modul kann zum Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum konfiguriert sein. Durch den Prozessor und die Speicherarchitektur kann auch ein zweites Software-Modul ausführbar sein. Das zweite Software-Modul kann zum Ermitteln einer Änderung der Anwendungskapazität für die voraussichtliche Arbeitslast konfiguriert sein. Durch den Prozessor und die Speicherarchitektur kann auch ein drittes Software-Modul ausführbar sein. Das dritte Software-Modul kann zum dynamischen Wählen einer Skalierungsstrategie für die Änderung der Anwendungskapazität konfiguriert sein, wobei die Skalierungsstrategie vertikales Skalieren und horizontales Skalieren beinhaltet.
Hierzu können ein oder mehrere der folgenden Merkmale gehören. Zu der Skalierungsstrategie kann ein Implementieren einer Vielzahl virtueller Maschinen gehören, auf denen die mehrschichtige Anwendung ausgeführt wird. Jeder aus der Vielzahl virtueller Maschinen können im Allgemeinen gleich konfigurierte Ressourcen zugeordnet sein. Mindestens eine virtuelle Maschine kann so implementiert sein, dass ihr geringere Ressourcen zugeordnet sind. Wenn die Änderung der Anwendungskapazität geringer als eine Restkapazität der virtuellen Maschine mit zugeordneten geringeren Ressourcen ist, kann das dritte Software-Modul so konfiguriert sein, dass es die virtuelle Maschine mit den zugeordneten geringeren Ressourcen vertikal auf die allgemein gleich konfigurierte Ressourcenzuordnung skaliert. Wenn die Änderung der Anwendungskapazität größer als eine Restkapazität der virtuellen Maschine mit den zugeordneten geringeren Ressourcen ist, kann das dritte Software-Modul so konfiguriert sein, dass es die virtuelle Maschine mit den zugeordneten geringeren Ressourcen vertikal auf die allgemein gleich konfigurierte Ressourcenzuordnung und die Anwendung horizontal skaliert, wozu ein Implementieren einer neuen virtuellen Maschine gehört, deren Ressourcenzuordnung geringer als die allgemein gleich konfigurierte Ressourcenzuordnung ist.
Das dritte Software-Modul kann so konfiguriert sein, dass es fortlaufend eine Skalierungsstrategie zumindest teilweise auf der Grundlage der voraussichtlichen Arbeitslast wählt. Das erste Software-Modul kann so konfiguriert sein, dass es eine voraussichtliche Arbeitslast zumindest teilweise auf der Grundlage von Langzeitbedarfsdaten für die Arbeitslast ermittelt. Das dritte Software-Modul kann so konfiguriert sein, dass es Ressourcen skaliert, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind.
Gemäß einer weiteren Implementierung beinhaltet ein Skalierungsverfahren ein Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum. Für die voraussichtliche Arbeitslast wird eine Änderung der Anwendungskapazität ermittelt. Für die Änderung der Anwendungskapazität wird dynamisch eine Skalierungsstrategie gewählt. Die Skalierungsstrategie beinhaltet ein Implementieren einer Vielzahl virtueller Maschinen, auf denen die mehrschichtige Anwendung ausgeführt wird, wobei jeder aus der Vielzahl virtueller Maschinen allgemein gleich konfigurierte Ressourcen zugeordnet sein können. Die Skalierungsstrategie kann auch ein Implementieren mindestens einer virtuellen Maschine mit zugeordneten geringeren Ressourcen beinhalten.
Die Einzelheiten einer oder mehrerer Implementierungen werden in den beiliegenden Zeichnungen und der folgenden Beschreibung dargelegt. Weitere Merkmale werden aus der Beschreibung, den Zeichnungen und den Ansprüchen deutlich.
KURZBESCHREIBUNG DER ZEICHNUNGEN
1 zeigt schematisch einen Skalierungsprozess in Verbindung mit einer Cloud-Computing-Umgebung.
2 ist ein Ablaufplan eines Prozesses, der durch den Skalierungsprozess von 1 ausgeführt wird.
3 zeigt schematisch den Skalierungsprozess von 1 in Verbindung mit einem Cloud-Computing-System.
4 stellt grafisch einen Zusammenhang zwischen der Auslastung eines physischen Servers, dem Ressourcenleerlauf und den Kosten des Dienstleistungsabkommens (Service Level Agreement, SLA) dar.
DETAILLIERTE BESCHREIBUNG ANSCHAULICHER AUSFÜHRUNGSFORMEN
Dem Fachmann ist klar, dass die vorliegende Erfindung als Verfahren, System oder Computerprogrammprodukt umgesetzt werden kann. Demgemäß kann die vorliegende Erfindung die Form einer kompletten Hardwareausführungsform, einer kompletten Softwareausführungsform (darunter Firmware, residente Software, Mikrocode usw.) oder einer Ausführungsform annehmen, die Software- und Hardwareaspekte in sich vereint und die hierin sämtlich allgemein als „Schaltung”, „Modul” oder „System” bezeichnet werden können. Darüber hinaus kann die vorliegende Erfindung die Form eines Computerprogrammprodukts auf dem durch Computer verwendbaren Speichermedium mit einem in dem Medium verkörperten durch Computer verwendbaren Programmcode annehmen.
Es kann ein beliebiges durch Computer verwendbares oder computerlesbares Medium verwendet werden. Bei dem computerlesbaren Medium kann es sich um ein computerlesbares Signalmedium oder um ein computerlesbares Speichermedium handeln. Bei einem durch Computer verwendbaren oder computerlesbaren Speichermedium (darunter eine Speichereinheit, die einer Datenverarbeitungseinheit oder einer elektronischen Client-Einheit zugehörig ist) kann es sich zum Beispiel, ohne darauf beschränkt zu sein, um ein elektronisches, magnetisches, optisches, elektromagnetisches, Infrarot- oder Halbleitersystem, eine entsprechende Vorrichtung oder Einheit oder eine beliebige geeignete Kombination derselben handeln. Im Einzelnen kommen als Beispiele für das computerlesbare Medium (eine nicht erschöpfende Aufzählung) infrage: eine elektrische Verbindung mit einer oder mehreren Leitungen, eine auswechselbare Computerdiskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer, programmierbarer Nur-Lese-Speicher (EPROM oder Flash-Speicher), ein Lichtwellenleiter, ein austauschbarer Compact Disc-Nur-Lese-Speicher (CD-ROM), eine optische Speichereinheit. In Verbindung mit diesem Dokument kann es sich bei einem durch Computer verwendbaren oder computerlesbaren Speichermedium um ein beliebiges materielles Medium handeln, das ein Programm zur Verwendung durch oder in Verbindung mit dem System, der Vorrichtung oder Einheit zum Ausführen von Anweisungen enthalten oder speichern kann.
Ein computerlesbares Signalmedium kann ein sich ausbreitendes Datensignal mit einem codiert darin verkörperten computerlesbaren Programm beinhalten, zum Beispiel im Basisband oder als Teil einer Trägerwelle. Ein solches sich ausbreitendes Signal kann eine beliebige aus einer Vielfalt von Formen annehmen, darunter, ohne darauf beschränkt zu sein, elektromagnetisch, optisch oder eine beliebige geeignete Kombination derselben. Bei einem computerlesbaren Signalmedium kann es sich um ein beliebiges computerlesbares Medium handeln, das kein computerlesbares Speichermedium ist und das ein Programm zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder Einheit zum Ausführen von Anweisungen übertragen, weiterverbreiten oder transportieren kann.
Ein auf einem computerlesbaren Medium verkörperter Programmcode kann unter Verwendung eines beliebigen geeigneten Mediums übertragen werden, darunter, ohne darauf beschränkt zu sein, drahtlos, leitungsgebunden, Lichtwellenleiter, HF usw. oder eine beliebige geeignete Kombination derselben.
Ein Computerprogrammcode zum Ausführen von Operationen der vorliegenden Erfindung kann in einer objektorientierten Programmiersprache wie beispielsweise Java, Smalltalk, C++ oder dergleichen geschrieben sein. Der Computerprogrammcode zum Ausführen von Operationen der vorliegenden Erfindung kann auch in herkömmlichen prozeduralen Programmiersprachen wie beispielsweise der Programmiersprache „C” oder ähnlichen Programmiersprachen geschrieben sein. Der Programmcode kann komplett auf dem Computer eines Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Softwarepaket, teilweise auf dem Computer des Benutzers und teilweise auf einem fernen Computer oder komplett auf dem fernen Computer oder Server ausgeführt werden. Im letzteren Szenario kann der ferner Computer durch ein lokales Netzwerk (LAN) oder ein Weitverkehrsnetzwerk (WAN) mit dem Computer des Benutzers verbunden sein, oder die Verbindung kann zu einem externen Computer (zum Beispiel durch das Internet unter Verwendung eines Internet-Dienstanbieters) hergestellt werden.
Die vorliegende Erfindung wird im Folgenden unter Bezugnahme auf Ablaufpläne und/oder Blockschaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es ist klar, dass jeder Block der Ablaufpläne und/oder Blockschaubilder und Kombinationen von Blöcken in dem Ablaufplänen und/oder Blockschaubildern durch Computerprogrammanweisungen umgesetzt werden können. Diese Computerprogrammanweisungen können einem Prozessor eines Universalcomputers, eines Spezialcomputers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung zugeführt werden, um eine Maschine derart zu erzeugen, dass die durch den Prozessor des Computers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführten Anweisungen ein Mittel zum Umsetzen der in dem Block oder den Blöcken des Ablaufplans und/oder Blockschaubildes angegebenen Funktionen/Aktionen umgesetzt werden.
Diese Computerprogrammanweisungen können in einem computerlesbaren Speicher gespeichert sein, der einen Computer oder eine andere programmierbare Datenverarbeitungsvorrichtung veranlassen kann, in einer bestimmten Weise so zu funktionieren, dass die in dem computerlesbaren Speicher gespeicherten Anweisungen einen Herstellungsgegenstand erzeugen, der Anweisungen beinhaltet, die die in dem Block oder den Blöcken des Ablaufplans und/oder Blockschaltbildes angegebenen Funktionen/Aktionen umsetzen.
Die Computerprogrammanweisungen können auch auf einen Computer oder eine andere programmierbare Datenverarbeitungsvorrichtung geladen werden, um eine Folge auf dem Computer oder einer anderen programmierbaren Datenverarbeitungsvorrichtung auszuführender Arbeitsschritte zu veranlassen, um einen computergestützten Prozess derart zu erzeugen, dass die auf dem Computer oder einer anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführten Anweisungen Schritte zum Umsetzen der in dem Block oder den Blöcken des Ablaufplans und/oder der Blockschaltbilder angegebenen Funktionen/Aktionen bereitstellen.
1 zeigt einen Skalierungsprozess 10, mittels dessen die Zuordnung von Ressourcen innerhalb einer Cloud-Computing-Umgebung 12 zumindest teilweise gesteuert werden kann. Die Figur zeigt, dass die Cloud-Umgebung 12 Hardware-Ressourcen 14 und Software-Ressourcen 16 beinhalten kann. Zu den Hardware-Ressourcen 14 können, ohne darauf beschränkt zu sein, ein oder mehrere Server-Computer (z. B. die Server s1 bis sn) und eine oder mehrere Speichereinheiten (z. B. die Speichereinheiten d1 bis dn) gehören. Zu den Software-Ressourcen 16 können eine oder mehrere Cloud-gestützte Anwendungen (z. B. die Anwendungen a1 bis an) gehören. Außerdem kann zu der einen oder den mehreren Anwendungen a1 bis an eine mehrschichtige Anwendung gehören. Es ist klar, dass eine mehrschichtige Anwendung eine Vielzahl interagierender Module und/oder Komponenten oder eine Vielzahl diskreter interagierender Anwendungen enthalten kann. Zum Beispiel kann eine mehrschichtige Anwendung eine Benutzeroberflächenkomponente (die z. B. Anzeigen erzeugen und ausgeben kann, die durch Clients C1 bis Cn betrachtet werden können), eine Anwendungskomponente (die z. B. die Funktionalität von Anwendungen steuern kann) und eine Datenkomponente enthalten, (die z. B. Daten speichern und abrufen kann, die durch die Anwendungskomponente verwendet werden können). Weitere beispielhafte mehrschichtige Anwendungen können Komponenten unterschiedlicher Funktionalität enthalten, sodass das obige Beispiel nicht als Einschränkung der vorliegenden Offenbarung zu verstehen ist.
Ein Beispiel von Servern s1 bis sn (die z. B. einen oder mehrere Prozessoren und eine oder mehrere nicht gezeigte Speicherarchitekturen beinhalten können), kann einen Blade-Server (beispielsweise ein IBM BladeCenter PS704 Express), ohne darauf beschränkt zu sein, oder einen anderen Server-Computer beinhalten. Als Beispiele für Speichereinheiten d1 bis dn können, ohne darauf beschränkt zu sein, ein Festplattenlaufwerk, ein Halbleiterlaufwerk, ein optisches Laufwerk, ein Direktzugriffsspeicher, ein Nur-Lese-Speicher und dergleichen infrage kommen. Auf jedem der Server s1 bis sn kann ein geeignetes Betriebssystem wie beispielsweise Red Hat^® Linux^® ausgeführt werden, das auf einer oder mehreren Speichereinheiten d1 bis dn gespeichert sein kann. (Red Hat ist ein eingetragenes Warenzeichen von Red Hat Corporation in den Vereinigten Staaten von Amerika, anderen Ländern oder in beiden; und Linux ist ein eingetragenes Warenzeichen von Linus Torvalds in den Vereinigten Staaten von Amerika, anderen Ländern oder in beiden).
Die Cloud-Umgebung 12 kann weitere nicht gezeigte Hardware und Software beinhalten, mittels derer durch einen oder mehrere Clients (z. B. die Clients C1 bis Cn) auf Hardwareressourcen 14 und Softwareressourcen 16 zugegriffen werden kann. Solche weitere Hardware kann, ohne darauf beschränkt zu sein, z. B. Vermittlungscomputer, Brücken, Webserver und dergleichen beinhalten, mittels derer Clients C1 bis Cn auf Hardwareressourcen 14 und/oder Softwareressourcen 16 zugreifen können. Außerdem können Clients C1 bis Cn über ein oder mehrere Netzwerke, darunter, ohne darauf beschränkt zu sein, das Internet, ein lokales Netzwerk, ein Weitverkehrsnetzwerk oder ein anderes Datenverarbeitungsnetzwerk, auf Cloud-Umgebung zugreifen. Die Clients C1 bis Cn können unter Verwendung beliebiger geeigneter Datenverarbeitungseinheiten auf die Cloud-Computing-Umgebung 12 zugreifen, darunter, ohne darauf beschränkt zu sein, Arbeitsplatzcomputer, Desktop-Computer, Notebook-Computer, mobile Datenverarbeitungseinheiten (z. B. datentaugliche Mobiltelefone, Netbooks, persönliche digitale Assistenten usw.), die diverse Software wie beispielsweise Web-Browser oder anwendungsspezifische Software ausführen.
Gemäß 2 kann mittels des Skalierungsprozesses 10 in Schritt 50 eine voraussichtliche Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum ermittelt werden. Mittels des Skalierungsprozesses 10 kann in Schritt 52 ferner eine Änderung der Anwendungskapazität für die voraussichtliche Arbeitslast ermittelt werden. Ferner kann mittels des Skalierungsprozesses 10 in Schritt 54 dynamisch eine Skalierungsstrategie für die Änderung der Anwendungskapazität gewählt werden. Die Skalierungsstrategie kann vertikales Skalieren und horizontales Skalieren beinhalten.
Zum Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum in Schritt 50 können verschiedene Vorhersagemodelle verwendet werden, die z. B. für den definierten Zeitraum zu erwartende Arbeitslasten anzeigen können. Zum Beispiel können den Vorhersagemodellen zumindest teilweise Langzeitbedarfsdaten für die Arbeitslast zugrunde liegen. Zum Beispiel kann bekannt sein, dass zumindest für bestimmte Cloud-Anwendungen (z. B. Anwendung a1) der Arbeitslastbedarf zu Bedarfsspitzen neigen kann, in denen der Arbeitslastbedarf in relativ kurzer Zeit um ein Vielfaches oder um Größenordnungen zunehmen kann. Zum Beispiel kann die Anwendung a1 eine Anwendung für ein soziales Netzwerk enthalten, deren Bedarfsspitze üblicherweise am Ende eines Werktages auftritt. Gemäß einer solchen Ausführungsform kann das Vorhersagemodell eine Bedarfsspitze anzeigen, die zu einem bestimmten Zeitpunkt des Tages beginnt. Gemäß anderen Ausführungsformen kann das Vorhersagemodell zum Beispiel anzeigen, dass der Arbeitslastbedarf für die Anwendung a1 in den vergangenen fünfzehn Minuten um 20 Prozent zugenommen hat und im Lauf der nächsten Stunde letztlich (bezogen auf den anfänglichen Arbeitslastbedarf) auf einen Höchstwert von 800 Prozent steigen dürfte. Das heißt, dem Vorhersagemodell kann zumindest teilweise eine Änderungsrate des Arbeitslastbedarfs zur Ermittlung eines statistisch wahrscheinlichen Höchstwertes des Arbeitslastbedarfs für den definierten Zeitraum zugrunde liegen. Außerdem kann zumindest teilweise auf der Grundlage des Vorhersagemodells ein statistisch wahrscheinlicher Höchstwert des Arbeitslastbedarfs für die Anwendung a1 in dem definierten Zeitraum bekannt sein. Es ist einsichtig, dass verschiedene weitere/alternative Vorhersagemodelle verwendet werden können, sodass die obigen Beispiele nicht als Einschränkung der vorliegenden Offenbarung anzusehen sind.
3 zeigt das Vorhersagemodell gemäß einer Ausführungsform, das für den Skalierungsprozess 10 durch die Vorhersageeinheit 100 bereitgestellt sein kann. Die Vorhersageeinheit 100 kann eine Komponente enthalten, die Langzeitbedarfsdaten für verschiedene an die Anwendung a1 (die z. B. eine mehrschichtige Anwendung mit einer Vielfalt von Komponenten oder Modulen und/oder eine Vielzahl kooperierender Anwendungen enthalten kann) gerichteter Anforderungen bewerten und statistische Anforderungsvorhersagemodelle für voraussichtliche Arbeitslasten, Anforderungstypen, Anwendungsschichten und dergleichen erzeugen kann. Gemäß einem anschaulichen Beispiel kann die Vorhersageeinheit 100 unter Verwendung einer Polynomnäherung eine Zeitreihenanalyse auf der Grundlage einer kurzfristigen Vorhersage für die Häufigkeit eingehender Anforderungen verwenden. Es ist einsichtig, dass ebenso auch verschiedene weitere/alternative Analyseverfahren verwendet werden können.
Übereinstimmend mit dem in 3 gezeigten anschaulichen Beispiel kann die Vorhersageeinheit 100 Langzeitbedarfsdaten von einem Datenspeicher 102 empfangen. Bei einem solchen Beispiel kann der Datenspeicher 102 eine Ablage überwachter Anwendungs- und Systemparameter (die z. B. von einem oder mehreren Servern, in dem veranschaulichten Beispiel z. B. den Servern s1, s2, s3 und s4 empfangen werden können) von einem oder mehreren Servern (z. B. den Servern s1, s2, s3, s4) und Anwendungen (in dem veranschaulichten Beispiel z. B. den Anwendungen a1 und a2) enthalten, die in der Cloud (z. B. in der Cloud-Umgebung 12) ausgeführt werden. Wenn die Anwendungen (z. B. die Anwendung a1) mehrere Anforderungstypen empfangen, kann der Datenspeicher 102 die Anzahl der während eines bestimmten überwachten Zeitraums (z. B. in Intervallen von einer Minute) für jeden Anforderungstyp erfüllten Anforderungen protokollieren. Außerdem kann der Datenspeicher 102 auch Daten sammeln, darunter Parameter für die Anwendung, die die Dienstgütevereinbarung (service level agreement, SLA) betreffen. Als Beispiele von Systemparametern, die durch den Datenspeicher 102 protokolliert werden können, kommen infrage, ohne darauf beschränkt zu sein, Ressourcenberechtigungen (z. B. CPU- oder Zeitscheibenzuordnungen und RAM- und/oder Speicherplatzzuordnungen) für jede virtuelle Maschine (z. B. VM1, VM2, VM3 und VM4, auf denen die Anwendung a1 ausgeführt wird, und VM5, VM6, VM7 und VM8, auf denen die Anwendung a2 ausgeführt wird) sowie der Grad der Nutzung der Ressourcenberechtigungen durch jede virtuelle Maschine.
Der Skalierungsprozess 10 kann zumindest teilweise auf der Grundlage der in Schritt 50 ermittelten voraussichtlichen Arbeitslast für einen definierten Zeitraum in Schritt 52 eine Änderung der Anwendungskapazität für die vorhergesagte Arbeitslast ermitteln. Der Datenspeicher 102 kann wie oben erwähnt mehrere Anforderungstypen protokollieren, und die Vorhersageeinheit 100 kann ein Vorhersagemodell bereitstellen, das nicht nur die Anzahl oder die Änderung der Anforderungshäufigkeit beinhaltet, sondern die Vorhersageeinheit 100 kann auch ein Vorhersagemodell bereitstellen, das den Typ der Anforderungen anzeigt. Es ist klar, dass die erforderliche Kapazität einer Anwendung (z. B. der Anwendung a1) durch die verschiedenen Anforderungstypen sowie die Schichten der Anwendung beeinflusst werden kann, auf denen die Anforderungen unterschiedlichen Typs ausgeführt werden können.
Gemäß der veranschaulichten Ausführungsform von 3 kann mittels des Skalierungsprozesses 10 zumindest teilweise in Schritt 52 auf der Grundlage von Daten, die von der Arbeitslast-Klassifizierungseinheit 104 empfangen wurden, eine Änderung der Anwendungskapazität ermittelt werden. In der Arbeitslast-Klassifizierungseinheit 104 können Arbeitslasten in eine oder mehrere Gruppen zuvor erzeugter Arbeitslastklassen klassifiziert werden. Demgemäß kann die Arbeitslast-Klassifizierungseinheit 104 von dem Datenspeicher 102 Daten über eine Mischung von Arbeitslasten für eine Anwendung empfangen. Zu den Daten über eine Mischung von Arbeitslasten für eine Anwendung kann, ohne darauf beschränkt zu sein, eine aktuelle Verteilung von Anforderungstypen gehören. Die Mischung von Arbeitslasten kann den Umfang und die Typen der Ressourcen beeinflussen, die eine Anwendung zum Erfüllen einer bestimmten Anzahl von Anforderungen benötigt, die eine bestimmte Verteilung von Anforderungstypen aufweisen. Demgemäß kann mittels des Skalierungsprozesses 10 zumindest teilweise auf der Grundlage des durch die Vorhersageeinheit 100 bereitgestellten Vorhersagemodells und der Mischung von Arbeitslasten (und/oder der gemäß dem Vorhersagemodell vorhergesagten Mischung von Arbeitslasten), die durch die Arbeitslast-Klassifizierungseinheit 104 bereitgestellt wurde, in Schritt 52 eine Änderung der Anwendungskapazität ermittelt werden, die zum Bewältigen der voraussichtlich eintreffenden Arbeitslast erforderlich ist, die eine vorhergesagte Verteilung der Anforderungstypen aufweist.
Zumindest teilweise auf der Grundlage der in Schritt 52 ermittelten Änderung der Anwendungskapazität, die der in Schritt 50 ermittelten vorhergesagten Arbeitslast zugehörig ist, kann mittels des Skalierungsprozesses 10 in Schritt 54 dynamisch eine Skalierungsstrategie für die Änderung der Anwendungskapazität gewählt werden. Die Skalierungsstrategie kann vertikales Skalieren und horizontales Skalieren der mehrschichtigen Anwendung (z. B. der Anwendung a1) beinhalten. Die hierin angewendete vertikale Skalierung kann ein Ändern der Ressourcenzuordnung einer bestimmten virtuellen Maschine beinhalten, auf der eine Anwendung ausgeführt wird (z. B. VM1, auf der die Anwendung a1 ausgeführt wird). Zum Beispiel kann das vertikale Skalieren zum Vergrößern der Kapazität ein Erweitern der CPU-Berechtigung einer virtuellen Maschine (z. B. Erweitern der Berechtigung von 0,5 Kernen auf 0,9 Kerne), ein Erweitern der Speicherberechtigung (z. B. Erweitern der RAM-Berechtigung von 2 GB RAM auf 4 GB RAM) sowie ein Erweitern beliebiger anderer Ressourcenberechtigungen der betreffenden virtuellen Maschine beinhalten. Horizontales Skalieren kann ein Erzeugen einer oder mehrerer neuer Instanzen der virtuellen Maschine beinhalten, die eigene Ressourcenzuordnungen aufweisen, wobei die Anwendung (z. B. die Anwendung a1) auf jeder der neuen (sowie allen bereits vorhandenen) virtuellen Maschinen ausgeführt wird. Beim horizontalen Skalieren kann die Anwendung a1 gemeinsam durch jede der neuen virtuellen Maschinen sowie alle bereits vorhandenen virtuellen Maschinen ausgeführt werden, um die vorhergesagte Arbeitslast zu bewältigen und die erforderliche Änderung der Anwendungskapazität bereitzustellen.
Die in Schritt 54 dynamisch gewählte Skalierungsstrategie kann zum Beispiel beinhalten, einen Virtualisierungsmanager 106 anzuweisen, die Ressourcenzuordnung einer oder mehrerer virtueller Maschinen (z. B. VM1) zu ändern, auf denen eine Anwendung (z. B. die Anwendung a1) ausgeführt wird. Zusätzlich/alternativ kann der Virtualisierungsmanager 106 eine oder mehrere neue Instanzen von virtuellen Maschinen (z. B. VM2, VM3, VM4) erzeugen, auf denen die Anwendung a1 ausgeführt werden kann. Der Virtualisierungsmanager 106 kann einen Hypervisor wie beispielsweise den IBM PowerVM^TM enthalten, der online ein dynamisches Ändern der Größe von virtuellen Maschinen (z. B. Hinzufügen oder Verringern von CPU- oder Speicherressourcen, ohne die VM zum Neukonfigurieren herunterzufahren) sowie ein Erzeugen neuer Instanzen von virtuellen Maschinen und Konfigurationen unterstützen kann.
Zusätzlich kann mittels des Skalierungsprozesses 10 eine erforderliche Neukonfiguration der Anwendung umgesetzt werden. Wenn die Skalierungsstrategie zum Beispiel ein horizontales Aktualisieren vorsieht, kann mittels des Skalierungsprozesses 10 eine Zugangssteuereinheit/Lastausgleichseinheit 108 angewiesen werden, Hostlisten und dergleichen zu aktualisieren, sodass über einen Gateway 110 empfangene Anforderungen an die neu geschaffenen Instanzen virtueller Maschinen (VM2, VM3, VM4 sowie VM1) verteilt werden können. Eine solche Neukonfiguration der Anwendung kann erforderlich werden, um sicherzustellen, dass die Arbeitslast auf die verschiedenen virtuellen Maschinen verteilt wird, auf denen die Anwendung ausgeführt wird, oder um die Anwendungskapazität zum Bewältigen der voraussichtlichen Arbeitslast bereitzustellen.
Wenn eine vorhergesagte Arbeitslastspitze eintritt, kann die zum Bewältigen der vorhergesagten Arbeitslast erforderliche Anwendungskapazität die Kapazität der aktuell vorhandenen Instanzen virtueller Maschinen bei weitem übersteigen, sodass eine (oder mehrere) neue virtuelle Maschinen erzeugt werden müssen, auf denen die Anwendung ausgeführt wird. Gemäß einem Aspekt der vorliegenden Offenbarung kann mittels des Skalierungsprozesses 10 in Schritt 54 eine Skalierungsstrategie gewählt werden, um für die Anwendung ein Optimum von Leistungsfähigkeit und Kosten zu finden. Gemäß einem solchen Aspekt und dem in 3 gezeigten Server-Cluster kann die Skalierungsstrategie ein Implementieren einer Vielzahl virtueller Maschinen in Schritt 56 beinhalten, auf denen die mehrschichtige Anwendung ausgeführt wird. Jede aus der Vielzahl virtueller Maschinen kann allgemein gleich konfigurierte Ressourcenzuordnungen aufweisen. Mindestens eine virtuelle Maschine kann mit einer geringeren Ressourcenzuordnung implementiert sein.
Im Folgenden wird zum Beispiel eine Instanz einer virtuellen Maschine, auf der die Anwendung a1 ausgeführt wird, mit einer Konfiguration (z. B. einer Zuordnung von Prozessor-, Speicherressourcen usw.) erörtert, die für die Anwendung einen gewünschten Ausgleich zwischen Leistungsfähigkeit und Kosten bietet. Im Rahmen der folgenden Beschreibung kann eine solche Konfiguration als „optimale” Konfiguration bezeichnet werden. Es sollte jedoch einsichtig sein, dass der Begriff „optimal” einen subjektiv wünschenswerten Ausgleich zwischen Leistungsfähigkeit und Kosten der Anwendung anzeigen soll und nicht als Einschränkung der vorliegenden Offenbarung zu verstehen ist, da auch andere Leistungs/Kosten-Bilanzen vorteilhaft verwendet werden können. Für eine bestimmte erforderliche oder erwünschte Anwendungskapazität (z. B. die in Schritt 52 ermittelte Änderung der Anwendungskapazität) können mittels der in Schritt 54 dynamisch gewählten Skalierungsstrategie eine Vielzahl optimal konfigurierter virtueller Maschinen (z. B. eine Vielzahl virtueller Maschinen mit allgemein gleich konfigurierten Ressourcenzuordnungen) implementiert werden. Da es unwahrscheinlich ist, dass die in Schritt 52 ermittelte Anwendungskapazität für die voraussichtliche Arbeitslast für eine ganze Anzahl optimal konfigurierter virtueller Maschinen gleich ist, kann sich die in Schritt 54 dynamisch gewählte Skalierungsstrategie einer Vielzahl optimal konfigurierter virtueller Maschinen bedienen, um den Großteil der in Schritt 52 ermittelten Kapazität abzudecken, und eine oder mehrere virtuelle Maschinen mit einer Ressourcenzuordnung verwenden, deren Ressourcenzuordnung geringer als die der optimalen Konfiguration ist (z. B. können die eine oder die mehreren virtuellen Maschinen eine geringere CPU- oder Speicherzuordnung aufweisen).
Gemäß dem oben Gesagten kann eine in Schritt 52 ermittelte Kapazität C für die in Schritt 50 ermittelte voraussichtliche Arbeitslast auf M virtuelle Maschinen verteilt werden. Gemäß einer anschaulichen Ausführungsform können M – 1 virtuelle Maschinen mit einer Kapazität N optimal konfiguriert sein. Die virtuelle Maschine M kann eine Kapazität CM aufweisen, die sich aus der Formel ergibt: C – (M – 1)·N
Es ist einsichtig, dass gemäß anderen Ausführungsformen mehr als eine virtuelle Maschine eine Kapazität aufweisen kann, die von der Kapazität einer optimal konfigurierten virtuellen Maschine verschieden ist. Gemäß einer solchen Ausführungsform können X virtuelle Maschinen eine Kapazität aufweisen, die von der optimalen Kapazität verschieden ist. Gemäß einer solchen Implementierung kann die Gesamtkapazität der X virtuellen Maschinen durch die Formel gegeben sein: C – (M – X)·N
Gemäß einer solchen Ausführungsform kann die Gesamtkapazität der X virtuellen Maschinen je nach den Auslegungskriterien und den Benutzerwünschen gleich oder ungleich auf die X virtuellen Maschinen aufgeteilt werden.
Gemäß der obigen Beschreibung und unter Bezugnahme auf 3 sei angenommen, dass die Anwendung a1 zu Anfang nur auf einer einzigen virtuellen Maschine (VM1) installiert ist. Ferner sei angenommen, dass mittels des Skalierungsprozesses 10 auf der Grundlage der in Schritt 50 ermittelten voraussichtlichen Arbeitslast in Schritt 52 eine Änderung der voraussichtlichen Arbeitslast ermittelt werden kann, die sich auf mehr als das Dreifache der verfügbaren Kapazität einer optimal konfigurierten virtuellen Maschine beläuft, auf der die Anwendung a1 ausgeführt wird. Mittels des Skalierungsprozesses 10 kann in Schritt 54 dynamisch eine Skalierungsstrategie gewählt werden, um in Schritt 56 eine Vielzahl virtueller Maschinen (z. B. VM1, VM2, VM3) mit allgemein gleich konfigurierter Ressourcenzuordnung zu implementieren (die z. B. gemeinsam den Großteil der in Schritt 52 ermittelten Kapazitätsänderung für die vorhergesagte Arbeitslast abdecken können). Außerdem kann mittels des Skalierungsprozesses 10 in Schritt 56 eine virtuelle Maschine VM4 mit einer geringeren Ressourcenzuordnung implementiert werden, die z. B. die Differenz zwischen der in Schritt 54 ermittelten Kapazitätsänderung und der durch die virtuellen Maschinen VM1, VM2 und VM3 gemeinsam bereitgestellten Kapazität abdecken kann. Demgemäß können die virtuellen Maschinen VM1, VM2, VM3 und VM4 gemeinsam eine Kapazität bereitstellen, die zum Abdecken der in Schritt 52 ermittelten Kapazitätsänderung erforderlich ist. Demgemäß kann die obige Skalierungsstrategie vertikales Skalieren in Schritt 58 (z. B. durch Erhöhen einer anfänglich konfigurierten Ressourcenzuordnung von VM1 von einer anfänglichen suboptimalen Konfiguration auf eine optimale Konfiguration) sowie horizontales Skalieren in Schritt 60 beinhalten (z. B. durch Erzeugen zusätzlicher Instanzen virtueller Maschinen VM2, VM3, VM4). Zwar wurden in diesem Beispiel nur vier virtuelle Maschinen erörtert, jedoch ist einsichtig, dass dieses nur zur leichteren Erläuterung und Veranschaulichung dient, da die Anzahl virtueller Maschinen, die Anzahl der Server und die Vielgestaltigkeit der Cloud-Computing-Umgebung stark variieren können.
Gemäß der folgenden ausführlichen Erörterung ist einsichtig, dass sowohl horizontales Skalieren als auch vertikales Skalieren mit verschiedenen Aufwendungen, sowohl finanzieller Art als auch in Bezug auf die Systemleistung, verbunden sein kann. Ausgehend von dem Konzept einer optimal konfigurierten virtuellen Maschine und unter Bezugnahme auf 4 ist einsichtig, dass sowohl eine unzureichende Auslastung als auch eine übermäßig hohe Auslastung der Ressourcen eines physischen Servers mit Kosten verbunden sein kann. Wenn zum Beispiel ein Server wie gezeigt durch die auf dem Server ausgeführten Anwendungen (und zugehörige virtuelle Maschinen) nur unzureichend ausgelastet wird, können Ressourcen in relativ hohem Maße verschwendet werden. Das heißt, der Server ist in Bezug auf die verfügbaren Ressourcen nur gering ausgelastet. Durch Erhöhen der Auslastung des physischen Servers (z. B. vertikales Skalieren zum Erweitern der durch eine auf dem Server ausgeführte Anwendung) kann das Risiko von Ressourcenkonflikten mit anderen auf dem Server ausgeführten Anwendungen zunehmen, das Verlagern einer oder mehrerer Instanzen anderer Anwendungen von einem zu einem anderen physischen Server erforderlich machen und zur Verletzung des SLA dieser auf dem Server ausgeführten Anwendungen führen. Gemäß einer Ausführungsform kann eine wünschenswerte Auslastung eines Servers allgemein am Schnittpunkt der Kurven für verschwendete Ressourcen und der Kosten für die Verletzung des SLA liegen. Demgemäß kann es wünschenswert sein, die größtmögliche Anzahl physischer Server zu laden, um eine Auslastung der physischen Server an diesem Schnittpunkt zu erzielen.
Gemäß dem oben Gesagten können mittels des Skalierungsprozesses 10 die relativen Kosten für das Erzeugen einer neuen Instanz einer virtuellen Maschine zum Ausführen einer weiteren Instanz einer bestimmten Anwendung (z. B. der Anwendung a1) auf einem separaten Server (d. h. horizontales Aktualisieren der Anwendung a1) und das Erweitern der Ressourcenzuordnung einer virtuellen Maschine ermittelt werden, auf der eine vorhandene Instanz der Anwendung a1 (vertikales Skalieren der Anwendung a1) ausgeführt wird, was zu einer Auslastung eines physischen Servers über den Schnittpunkt der Kurve für verschwendete Ressourcen und der Kurve der Kosten für die Verletzung der SLA hinaus führt. Mittels des Skalierungsprozesses 10 können die Kosten für horizontales Skalieren der Anwendung a1 und vertikales Skalieren der Anwendung a1 zumindest teilweise anhand von Kostenmodellen 112 ermittelt werden.
Über die Kosten hinaus, die mit der Auslastung eines physischen Servers über den oben erörterten Schnittpunkt hinaus verbunden sind, ist einsichtig, dass vertikales Skalieren weiteren praktischen Einschränkungen und Kosten unterliegen kann. Gemäß dem oben Gesagten kann vertikales Skalieren einer Instanz der Anwendung a1 (z. B. Erweitern der der virtuellen Maschine zugeordneten Ressourcen, auf der die Instanz der Anwendung a1 ausgeführt wird) ein Verlagern anderer Anwendungen erfordern, um die für vertikales Skalieren der Anwendung a1 benötigten Ressourcen freizulenken (d. h., um diese Ressourcen der virtuellen Maschine zuzuordnen, auf der die Anwendung a1 ausgeführt wird). Demgemäß kann ein Grad der vertikalen Skalierung erreicht werden, bei dem durch Hinzufügen weiterer Ressourcen (z. B. zusätzlicher CPU- oder Speicherressourcen) keine größere Anwendungskapazität erzielt wird, und/oder es kann ein Zustand verringerter Effektivität erzeugt werden, in dem eine weitere Zunahme der Ressourcen für eine virtuelle Maschine zu einer geringeren Zunahme der Leistungsfähigkeit oder Anwendungskapazität (z. B. der Fähigkeit der Anwendung zum Bearbeiten von Anforderungen) führt, was entweder auf Einschränkungen seitens des physischen Servers, der Anwendungsarchitektur oder auf andere Einschränkungen zurückzuführen ist. Gemäß einer Ausführungsform kann der Punkt, an dem die maximale Leistungsfähigkeit pro zugeordnete Ressourcen erzielt wird, als optimale Kapazität der virtuellen Maschine genutzt werden. Andere Konfigurationen können natürlich andere Faktoren in Betracht ziehen und auf der Grundlage solcher Abwägungen zwischen Leistungsfähigkeit und Kosten andere Konfigurationen virtueller Maschinen mit optimaler Kapazität erzielen.
Außerdem können durch horizontales Skalieren der Anwendung (z. B. beim Erzeugen neuer Instanzen virtueller Maschinen, die die Anwendung auf weiteren Servern ausführen) verschiedene Kosten verbunden sein. Im Vergleich zum vertikalen Skalieren kann horizontales Skalieren zum Beispiel relativ langsam sein (z. B. Erzeugen von Instanzen und Konfigurieren neuer virtueller Maschinen, Aktualisieren von Hostlisten in Gateways und dergleichen erfordern). Demgemäß kann horizontales Skalieren zugehörige Leistungsverluste insofern aufweisen, als während der zum Erzeugen von Instanzen und Konfigurieren weiterer virtueller Maschinen und zum Aktualisieren von Hostlisten benötigten Zeit die (auf den vorhandenen virtuellen Maschinen ausgeführte) Anwendung nicht über die Kapazität zum Verarbeiten aller ankommenden Anforderungen verfügen kann. Außerdem können mit horizontalem Skalieren auch noch weitere Kosten wie beispielsweise Kosten für Softwarelizenzen, Ressourcenkosten für die neu erzeugten Instanzen virtueller Maschinen, die Fragmentierung usw. verbunden sein. Solche Kosten können z. B. durch Kostenmodelle 112 in den Skalierungsprozess 10 eingebracht werden.
Wenn die Änderung der Anwendungskapazität geringer als eine Restkapazität der virtuellen Maschine mit einer geringeren Ressourcenzuordnung ist, kann gemäß den obigen Erörterungen zum Wählen der Skalierungsstrategie vertikales Skalieren der Anwendung in Schritt 59 durch vertikales Skalieren der virtuellen Maschine mit der geringeren Ressourcenzuordnung gehören. Bei dem oben angegebenen Beispiel kann eine virtuelle Maschine (z. B. VM4) eine Ressourcenzuordnung beinhalten, die geringer als eine optimale Ressourcenzuordnung ist. Das heißt, innerhalb des gewünschten ausgewogenen Kosten/Leistungsverhältnisses können durch die virtuelle Maschine mehr Server-Ressourcen genutzt werden. Demgemäß kann dynamisches Wählen einer Skalierungsstrategie in Schritt 54 ein vertikales Skalieren der VM4 in Schritt 58 beinhalten, um die zusätzliche Kapazität zu bewältigen. Vertikales Skalieren der virtuellen Maschine in Schritt 58 kann ein vertikales Skalieren der virtuellen Maschine auf eine optimale Konfiguration beinhalten. Zusätzlich/alternativ kann vertikales Skalieren der virtuellen Maschine in Schritt 58 ein Skalieren der virtuellen Maschine auf eine Konfiguration mit einer Ressourcenzuordnung beinhalten, die entweder oberhalb oder unterhalb der optimalen Konfiguration liegt.
Gemäß der obigen Erörterung kann mittels des Skalierungsprozesses 10 in Schritt 52 außerdem eine der vorhergesagten Arbeitslast zugehörige Kapazitätsänderung ermittelt werden. Das Ermitteln der der vorhergesagten Arbeitslast zugehörigen Kapazitätsänderung in Schritt 52 kann zumindest teilweise auf Daten beruhen, die durch Ressourcenmodelle 114 bereitgestellt werden. Die Ressourcenmodelle 114 können profilorientierte Ressourcenmodelle enthalten, die auf Ressourcen hinweisen können, die unter bestimmten verschiedenen Skalierungskonfigurationen verwendet werden. Zum Beispiel können die Ressourcenmodelle 114 Daten über die Ressourcen (z. B. CPU-Ressourcen, Speicher und dergleichen) enthalten, die für einen bestimmten Durchsatz oder eine bestimmte Anzahl von Anforderungen oder Operationen pro Sekunde erforderlich sein können. Die Ressourcenmodelle können zumindest teilweise empirisch von Daten abgeleitet werden, die durch den Datenspeicher 102 protokolliert wurden. Zusätzlich/alternativ können die Ressourcenmodelle 114 statistische Modelle beinhalten, die zumindest teilweise auf Daten beruhen, die durch den Datenspeicher 102 protokolliert wurden.
Wenn die Änderung der Anwendungskapazität größer als eine Restkapazität der virtuellen Maschine mit der geringeren Ressourcenzuordnung ist, kann das Wählen der Skalierungsstrategie in Schritt 54 ferner ein horizontales Skalieren der Anwendung in Schritt 60 beinhalten. Gemäß den obigen Ausführungen kann das horizontale Skalieren der Anwendung in Schritt 60 ein Erzeugen zusätzlicher Instanzen virtueller Maschinen (z. B. VM2, VM3, VM4 in der anschaulichen Ausführungsform von 3) beinhalten, die die Anwendung (z. B. die Anwendung a1) ausführen. Gemäß den obigen Ausführungen kann das horizontale Skalieren der Anwendung in Schritt 60 auch ein Hinzufügen zusätzlicher virtueller Maschinen beinhalten, denen Ressourcen in unterschiedlichem Maße zugeordnet sind (z. B. optimal skalierte virtuelle Maschinen V2, V3 und die suboptimal skalierte virtuelle Maschine VM4).
Das dynamische Wählen einer Skalierungsstrategie in Schritt 54 kann ein fortlaufendes Wählen einer Skalierungsstrategie in Schritt 62 zumindest teilweise auf der Grundlage der voraussichtlichen Arbeitslast beinhalten. Das heißt, mittels des Skalierungsprozesses 10 kann in Schritt 54 eine Skalierungsstrategie für sich ändernde Bedingungen gewählt werden. Zum Beispiel kann mittels des Skalierungsprozesses 10 zumindest teilweise auf der Grundlage der in Schritt 50 vorhergesagten Arbeitslasten (die sich z. B. im Lauf der Zeit ändern können) und entsprechender in Schritt 52 ermittelter Änderungen der Anwendungskapazität für die voraussichtlichen Arbeitslasten die in Schritt 54 gewählte Skalierungsstrategie geändert werden, wenn sich zum Beispiel die voraussichtliche Arbeitslast ändert. Demgemäß kann mittels des Skalierungsprozesses 10 in Schritt 54 eine Skalierungsstrategie ständig und adaptiv gewählt werden, sowie sich die Bedingungen und die vorhergesagten Arbeitslasten ändern. Das ständige Ändern einer Skalierungsstrategie in Schritt 62 kann darin bestehen, dass an der gewählten Skalierungsstrategie fortlaufend in Echtzeit Anpassungen vorgenommen werden. Zusätzlich/alternativ kann das ständige Wählen einer Skalierungsstrategie in Schritt 62 durch periodisches (z. B. in vorgegebenen Zeitintervallen oder auf der Grundlage einer Änderung der Bedingungen wie beispielsweise der Leistungsfähigkeit der Anwendung oder der vorhergesagten Arbeitslast) Wählen einer Skalierungsstrategie in Schritt 54 erfolgen (darunter durch Korrigieren einer gewählten Gesamtstrategie).
Das dynamische Wählen einer Skalierungsstrategie in Schritt 54 kann ein Skalieren von Ressourcen in Schritt 64 beinhalten, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind. Gemäß den obigen Ausführungen kann die Anwendung a1 zum Beispiel eine Vielzahl von Modulen oder Komponenten beinhalten (die z. B. eine Vielzahl miteinander kooperierender Anwendungen enthalten). Die Anwendung a1 kann mehrere Anforderungstypen empfangen, deren Verarbeitung oder auszuführende Aktionen durch verschiedene Schichten der Anwendung a1 erfolgen sollen. Ferner können die Verarbeitung oder auszuführenden Aktionen unter Nutzung verschiedener Ressourcen (z. B. können für bestimmte Verarbeitungen oder Aktionen ein größerer RAM, für andere Verarbeitungen oder Aktionen hingegen größere CPU-Zuordnungen erforderlich sein) erfolgen und/oder durch Module oder Komponenten ausgeführt werden (die z. B. eine oder mehrere interagierende Anwendungen beinhalten), die durch verschiedene virtuelle Maschinen ausgeführt werden können. Demgemäß kann das dynamische Wählen einer Skalierungsstrategie in Schritt 54 ein Skalieren von Ressourcen in Schritt 64 (beispielsweise CPU-Zuordnungen, RAM-Zuordnungen oder einzelne oder Gruppen von virtuellen Maschinen), die einer bestimmten Schicht einer mehrschichtigen Anwendung zugehörig sind, zumindest teilweise auf der Grundlage einer in Schritt 50 vorhergesagten Arbeitslast und einer in Schritt 52 ermittelten Änderung der Anwendungskapazität in verschiedenen Schichten einer mehrschichtigen Anwendung beinhalten. In bestimmten Fällen können in Schritt 64 Ressourcen skaliert werden, die allen Schichten einer mehrschichtigen Anwendung zugehörig sind, jedoch kann sich das Skalieren (z. B. in Bezug auf den Skalierungsgrad; die Konfiguration virtueller Maschinen; die zugeordneten Ressourcen; Skalierungstyp und Grad des Skalierungstyps wie beispielsweise vertikales und horizontales Skalieren; und dergleichen) für verschiedene Schichten der mehrschichtigen Anwendung voneinander unterscheiden.
Der Ablaufplan und die Blockschaubilder in den Figuren veranschaulichen die Architektur, die Funktionalität und die Arbeitsweise möglicher Implementierungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. Demgemäß kann jeder Block in dem Ablaufplan oder den Blockschaubildern ein Modul, ein Segment oder einen Abschnitt eines Codes darstellen, der eine oder mehrere ausführbare Anweisungen zum Umsetzen der angegebenen logischen Funktion(en) aufweist. Zu beachten ist auch, dass bei bestimmten alternativen Implementierungen die in dem Block angegebenen Funktionen in einer von den Figuren abweichenden Reihenfolge vorkommen können. Zum Beispiel können zwei nacheinander gezeigte Blöcke je nach vorgesehener Funktionalität tatsächlich im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können mitunter in der umgekehrten Reihenfolge ausgeführt werden. Ferner wird darauf hingewiesen, dass jeder Block der Blockschaubilder und/oder des Ablaufplans und Kombinationen von Blöcken in den Blockschaubildern und/oder dem Ablaufplan durch spezialisierte Hardwaresysteme, die die angegebenen Funktionen oder Aktionen ausführen, oder Kombinationen von spezialisierter Hardware und Computeranweisungen umgesetzt werden können.
Die hierin gebrauchten Begriffe dienen lediglich dem Beschreiben einzelner Ausführungsformen und sind nicht als Einschränkung der Erfindung zu verstehen. Die hierin gebrauchten Einzahlformen „ein”, „eine” und „der, die, das” sollen gleichermaßen auch die Mehrzahlformen beinhalten, sofern aus dem Zusammenhang nicht anderes hervorgeht. Ferner ist klar, dass die Begriffe „weist auf” und/oder „aufweisend” bei Verwendung in dieser Beschreibung das Vorhandensein angegebener Merkmale, Ganzzahlen, Schritte, Operationen, Elemente und/oder Komponenten bezeichnen, jedoch nicht das Vorhandensein oder Hinzukommen eines oder mehrerer anderer Merkmale, Ganzzahlen, Schritte, Operationen, Elemente, Komponenten und/oder deren Gruppen ausschließen.
Die entsprechenden Strukturen, Materialien, Aktionen und gleichwertigen Entsprechungen aller Mittel oder Schritte zuzüglich Funktionselemente in den folgenden Ansprüchen sollen alle Strukturen, Materialien oder Aktionen zum Ausführen der Funktion in Verbindung mit anderen ausdrücklich beanspruchten Elementen beinhalten. Die Beschreibung der vorliegenden Erfindung ist mit dem Ziel der Veranschaulichung und Beschreibung vorgelegt worden, erhebt jedoch nicht den Anspruch auf Vollständigkeit oder Einschränkung auf die Erfindung in der offenbarten Form. Dem Fachmann sind viele Modifikationen und Varianten offensichtlich, ohne vom Schutzumfang und Wesensgehalt der Erfindung abzuweichen. Die Ausführungsform wurde gewählt und beschrieben, um die Grundgedanken der Erfindung und deren praktische Anwendung bestmöglich zu erläutern und anderen Fachleuten das Verständnis der Erfindung für verschiedene Ausführungsformen mit verschiedenen Modifikationen zu ermöglichen, die für die jeweils vorgesehene Verwendung geeignet sind.
Aus der solchermaßen ausführlich und unter Bezugnahme auf deren Ausführungsformen beschriebenen Erfindung wird offensichtlich, dass Modifikationen und Varianten möglich sind, ohne vom Schutzumfang der Erfindung abzuweichen, der in den beiliegenden Ansprüchen definiert ist.

Claims

Verfahren zum Skalieren, das aufweist: Ermitteln einer vorhergesagten Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum durch eine Datenverarbeitungseinheit; Ermitteln einer Änderung der Anwendungskapazität für die vorhergesagte Arbeitslast durch die Datenverarbeitungseinheit; und dynamisches Wählen einer Skalierungsstrategie für die Änderung der Anwendungskapazität durch die Datenverarbeitungseinheit, wobei die Skalierungsstrategie ein vertikales Skalieren und ein horizontales Skalieren beinhaltet.
Verfahren nach Anspruch 1, wobei die Skalierungsstrategie ein Implementieren einer Vielzahl virtueller Maschinen, die die mehrschichtige Anwendung ausführen, wobei jede aus der Vielzahl virtueller Maschinen allgemein gleich konfigurierte Ressourcenzuordnungen aufweist, und ein Implementieren mindestens einer virtuellen Maschine beinhaltet, die eine geringere Ressourcenzuordnung aufweist.
Verfahren nach Anspruch 2, wobei das Wählen der Skalierungsstrategie ein vertikales Skalieren der virtuellen Maschine mit der geringeren Ressourcenzuordnung auf die allgemein gleich konfigurierte Ressourcenzuordnung beinhaltet, wenn die Änderung der Anwendungskapazität kleiner als eine Restkapazität der virtuellen Maschine mit einer geringeren Ressourcenzuordnung ist.
Verfahren nach Anspruch 3, wobei das Wählen der Skalierungsstrategie ein vertikales Skalieren der virtuellen Maschine mit der geringeren Ressourcenzuordnung auf die allgemein gleich konfigurierte Ressourcenzuordnung und ein horizontales Skalieren der Anwendung beinhaltet, das ein Implementieren einer neuen virtuellen Maschine mit einer Ressourcenzuordnung beinhaltet, die kleiner als die allgemein gleich konfigurierte Ressourcenzuordnung ist, wenn die Änderung der Anwendungskapazität größer als eine Restkapazität der virtuellen Maschine mit der geringeren Ressourcenzuordnung ist.
Verfahren nach einem der vorhergehenden Ansprüche, wobei das dynamische Wählen einer Skalierungsstrategie ein fortlaufendes Wählen einer Skalierungsstrategie zumindest teilweise auf der Grundlage der vorhergesagten Arbeitslast beinhaltet.
Verfahren nach einem der Ansprüche 1 bis 4, wobei das Ermitteln einer vorhergesagten Arbeitslast zumindest teilweise auf Langzeitbedarfsdaten der Arbeitslast beruht.
Verfahren nach einem der Ansprüche 1 bis 4, wobei das dynamische Wählen einer Skalierungsstrategie ein Skalieren von Ressourcen beinhaltet, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind.
Computerprogrammprodukt, das ein computerlesbares Medium mit einer Vielzahl darauf gespeicherter Anweisungen beinhaltet, die bei Ausführung durch einen Prozessor diesen zum Ausführen von Operationen veranlassen, die aufweisen: Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum; Ermitteln einer Änderung der Anwendungskapazität für die voraussichtliche Arbeitslast; und dynamisches Wählen einer Skalierungsstrategie für die Änderung der Anwendungskapazität, wobei die Skalierungsstrategie ein vertikales Skalieren und ein horizontales Skalieren beinhaltet.
Computerprogrammprodukt nach Anspruch 8, wobei die Skalierungsstrategie ein Implementieren einer Vielzahl virtueller Maschinen, die die mehrschichtige Anwendung ausführen, wobei jede aus der Vielzahl virtueller Maschinen allgemein gleich konfigurierte Ressourcenzuordnungen aufweist, und ein Implementieren mindestens einer virtuellen Maschine aufweist, die eine geringere Ressourcenzuordnung aufweist.
Computerprogrammprodukt nach Anspruch 9, wobei die Anweisungen zum Wählen der Skalierungsstrategie Anweisungen zum vertikalen Skalieren der virtuellen Maschine mit der geringeren Ressourcenzuordnung auf die allgemein gleich konfigurierte Ressourcenzuordnung aufweist, wenn die Änderung der Anwendungskapazität kleiner als eine Restkapazität der virtuellen Maschine mit einer geringeren Ressourcenzuordnung ist.
Computerprogrammprodukt nach Anspruch 10, wobei die Anweisungen zum Wählen der Skalierungsstrategie Anweisungen zum vertikalen Skalieren der virtuellen Maschine mit der geringeren Ressourcenzuordnung auf die allgemein gleich konfigurierte Ressourcenzuordnung und zum horizontalen Skalieren der Anwendung beinhalten, was ein Implementieren einer neuen virtuellen Maschine mit einer Ressourcenzuordnung beinhaltet, die kleiner als die allgemein gleich konfigurierte Ressourcenzuordnung ist, wenn die Änderung der Anwendungskapazität größer als eine Restkapazität der virtuellen Maschine mit der geringeren Ressourcenzuordnung ist.
Computerprogrammprodukt nach einem der vorhergehenden Ansprüche, wobei die Anweisungen zum Wählen einer Skalierungsstrategie Anweisungen zum ständigen Wählen einer Skalierungsstrategie zumindest teilweise auf der Grundlage der vorhergesagten Arbeitslast beinhalten.
Computerprogrammprodukt nach einem der Ansprüche 8 bis 11, wobei das Ermitteln einer vorhergesagten Arbeitslast zumindest teilweise auf Langzeitbedarfsdaten der Arbeitslast beruht.
Computerprogrammprodukt nach einem der Ansprüche 8 bis 11, wobei die Anweisungen zum dynamischen Wählen einer Skalierungsstrategie Anweisungen zum Skalieren von Ressourcen beinhalten, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind.
System, das aufweist: einen Prozessor; eine mit den Prozessoren verbundene Speicherarchitektur; ein erstes durch den Prozessor und die Speicherarchitektur ausführbares Software-Modul, wobei das erste Software-Modul so konfiguriert ist, dass es eine vorhergesagte Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum ermittelt; ein zweites durch den Prozessor und die Speicherarchitektur ausführbares Software-Modul, wobei das zweite Software-Modul so konfiguriert ist, dass es eine Änderung der Anwendungskapazität für die vorhergesagte Arbeitslast ermittelt; und ein drittes durch den Prozessor und die Speicherarchitektur ausführbares Software-Modul, wobei das dritte Software-Modul so konfiguriert ist, dass es dynamisch eine Skalierungsstrategie für die Änderung der Anwendungskapazität wählt, wobei die Skalierungsstrategie ein vertikales Skalieren und ein horizontales Skalieren beinhaltet.
System nach Anspruch 15, wobei die Skalierungsstrategie ein Implementieren einer Vielzahl virtueller Maschinen, die die mehrschichtige Anwendung ausführen, wobei jede aus der Vielzahl virtueller Maschinen allgemein gleich konfigurierte Ressourcenzuordnungen aufweist, und ein Implementieren mindestens einer virtuellen Maschine beinhaltet, die eine geringere Ressourcenzuordnung aufweist.
System nach Anspruch 16, wobei das dritte Software-Modul so konfiguriert ist, dass es die Skalierungsstrategie wählt, und ferner so konfiguriert ist, dass es die virtuelle Maschine mit der geringeren Ressourcenzuordnung vertikal auf die allgemein gleich konfigurierte Ressourcenzuordnung skaliert, wenn die Änderung der Anwendungskapazität kleiner als eine Restkapazität der virtuellen Maschine mit einer geringeren Ressourcenzuordnung ist.
System nach Anspruch 17, wobei das dritte Software-Modul so konfiguriert ist, dass es die Skalierungsstrategie wählt, und ferner so konfiguriert ist, dass es die virtuelle Maschine mit der geringeren Ressourcenzuordnung vertikal auf die allgemein gleich konfigurierte Ressourcenzuordnung skaliert und die Anwendung horizontal skaliert, was ein Implementieren einer neuen virtuellen Maschine mit einer Ressourcenzuordnung beinhaltet, die kleiner als die allgemein gleich konfigurierte Ressourcenzuordnung ist, wenn die Änderung der Anwendungskapazität größer als eine Restkapazität der virtuellen Maschine mit der geringeren Ressourcenzuordnung ist.
System nach einem der vorhergehenden Ansprüche, wobei das zum dynamischen Wählen einer Skalierungsstrategie konfigurierte dritte Software-Modul ferner so konfiguriert ist, dass es fortlaufend eine Skalierungsstrategie zumindest teilweise auf der Grundlage der vorhergesagten Arbeitslast wählt.
System nach einem der Ansprüche 15 bis 18, wobei das zum Ermitteln einer voraussichtlichen Arbeitslast konfigurierte erste Software-Modul so konfiguriert ist, dass es eine voraussichtliche Arbeitslast zumindest teilweise auf der Grundlage von Langzeitbedarfsdaten für die Arbeitslast ermittelt.
System nach einem der Ansprüche 15 bis 18, wobei das zum dynamischen Wählen einer Skalierungsstrategie konfigurierte dritte Software-Modul ferner so konfiguriert ist, dass es Ressourcen skaliert, die einer bestimmten Schicht der mehrschichtigen Anwendung zugehörig sind.
Skalierungsverfahren, das aufweist: Ermitteln einer voraussichtlichen Arbeitslast einer mehrschichtigen Anwendung für einen definierten Zeitraum durch eine Datenverarbeitungseinheit; Ermitteln einer Änderung der Anwendungskapazität für die voraussichtliche Arbeitslast durch die Datenverarbeitungseinheit; und dynamisches Wählen einer Skalierungsstrategie für die Änderung der Anwendungskapazität durch die Datenverarbeitungseinheit, wobei die Skalierungsstrategie ein Implementieren einer Vielzahl virtueller Maschinen, die die mehrschichtige Anwendung ausführen, wobei jede aus der Vielzahl virtueller Maschinen allgemein gleich konfigurierte Ressourcenzuordnungen aufweist, und ein Implementieren mindestens einer virtuellen Maschine beinhaltet, die eine geringere Ressourcenzuordnung aufweist.