WO2012152804A1 - Verfahren zum betrieb mindestens einer datenbank auf einem hardwarepool - Google Patents

Verfahren zum betrieb mindestens einer datenbank auf einem hardwarepool Download PDF

Info

Publication number
WO2012152804A1
WO2012152804A1 PCT/EP2012/058478 EP2012058478W WO2012152804A1 WO 2012152804 A1 WO2012152804 A1 WO 2012152804A1 EP 2012058478 W EP2012058478 W EP 2012058478W WO 2012152804 A1 WO2012152804 A1 WO 2012152804A1
Authority
WO
WIPO (PCT)
Prior art keywords
database
elements
configuration
hardware pool
resources
Prior art date
Application number
PCT/EP2012/058478
Other languages
English (en)
French (fr)
Inventor
Dieter Weiler
Original Assignee
Dieter Weiler
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dieter Weiler filed Critical Dieter Weiler
Publication of WO2012152804A1 publication Critical patent/WO2012152804A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning

Definitions

  • Hardware Pool deals with the operation of at least one database on a hardware pool.
  • Databases are used to manage very different data sets in different industries.
  • the data stocks may be, for example, customer and order data in the sales area as well as data stocks such as a library or the like.
  • the database exceeds a certain size, the number of queries from the database is relatively high and / or the number of new data to be included in the database is high, it is not easy to operate the database efficiently.
  • the existing resources of the hardware pool are not optimally utilized, that the time required to query data in the database becomes relatively high, or that not enough queries can be processed simultaneously or at short time intervals one after the other.
  • the subject of the present invention is a method for operating at least one database on a hardware pool comprising a plurality of resources with resources comprising the following steps:
  • the database is operated in a first configuration utilizing at least a first portion of the resources on at least a first portion of the elements of the hardware pool;
  • a hardware pool comprising a plurality of elements or data processing units is understood as meaning, for example, a computer network or a computer having a multiplicity of processors and memory areas.
  • An element of the hardware pool is understood in particular to mean a unit that can perform calculations.
  • an element comprises at least one processor, in particular single-core or multi-core processors, preferably a plurality of processors and corresponding memory hardware.
  • the term resource refers to the parts of the hardware pool on which invoices can be carried out or on which data can be stored.
  • a resource may therefore include a processor, in particular a processor (Graphics Processing Unit, GPU) usually used as graphics processor or a processor (Central Processing Unit, CPU) usually used as the main processor, a communication processor (CCP), a memory module (FIG. Random access memory, RAM), cache memory in GPUs or CPUs, a reversibly operable storage medium, in particular a hard disk, an SSD hard disk, internal and external hard disks, hard disk servers (storages), a data line, in particular inside a computer or a computer Network connection, or the like understood.
  • a processor Graphics Processing Unit, GPU
  • CPU Central Processing Unit
  • CPU Central Processing Unit
  • RAM memory module
  • RAM reversibly operable storage medium
  • storage medium in particular a hard disk, an SSD hard disk, internal and external hard disks, hard disk servers (storages), a data line, in particular inside a computer or a computer Network connection, or the like understood.
  • the configuration of the database is understood to mean the manner in which it is operated and on which elements of the hardware pool it is operated, in particular taking into account the selected elements and the individual resources of the elements, which are referred to below as element resources.
  • element resources which are referred to below as element resources.
  • the hardware pool resources When monitoring the parameter i. (the hardware pool resources), for example, monitors which states have the individual resources of the hardware pool, for example, whether certain storage areas are used, whether certain resources are intact or defective, how many free resources are available, if a processor is busy with the corresponding tasks which power consumption is available for the individual resources of the hardware pool, which transmission times are available for data transfer between individual resources of the hardware pool, etc.
  • the element resources of the individual elements of the hardware pool are also included in the monitoring so that, for example, the status of a specific memory block of a specific element of the hardware pool can be monitored.
  • monitoring parameter iii. the degree of utilization of the elements of the hardware pool
  • monitoring parameter iv. the availability of the elements of the hardware pool
  • monitoring the parameter iv. the availability of the elements of the hardware pool
  • the check as to whether the database can be operated better in another configuration takes place according to the invention in such a way that first of all a specific criterion is set which is to be fulfilled.
  • a criterion may be that the power consumption during operation of the database should be smaller or that a certain average access time for the queries of the database should be ensured or that the necessary for all possible individual queries times should be minimized.
  • the database is transferred to a second configuration.
  • the entire data set, including all requests made so far, if necessary with statistics about the requests, in particular taking into account the manner of the last and the most frequent requests, is transferred to the second configuration.
  • the database in the second configuration it is checked whether the database in the second configuration, considering the at least one parameter and fulfillment of the predetermined criterion is operable. For example, it could be determined that the power consumption when operating the database in the second configuration is lower than in the first configuration. In this case, the database can be migrated from the first configuration to the second configuration and then operated there.
  • the check can be controlled by a supervisor who has access to the database and the hardware pool.
  • the supervisor may be a software that performs the method according to the invention.
  • the supervisor may run on part of the hardware pool, alternatively the supervisor may be deployed on hardware outside the hardware pool.
  • the database is migrated to the second configuration and further operated in the second configuration, if the database in the second configuration is operable to meet the criterion.
  • the migration can be performed automatically if a certain criterion is met, for example, the power consumption for operating the database drops by more than 30% or the memory requirement drops by 40% or more.
  • the different configurations can be tested and maintained so that a user can decide in which configuration the database should be operated.
  • the criterion is specified with regard to at least one of the following variables: A. the power consumption required to operate the database;
  • F a sum of the times of all possible individual queries.
  • the specification of a criterion with regard to the power consumption required for operating the database can in particular have the aim of minimizing the power consumption for operating the database.
  • the criterion in relation to the time required to perform certain calculations in or with the database computing time can be taken into account in particular that z.
  • a criterion with regard to the input or output time in or out of the database for a predefinable data quantity it can be taken into account which data quantities are normally or usually queried. Again, the historical behavior of the database can be considered. Furthermore, a criterion with regard to the space required for operating the database can be specified.
  • the space required for operating the database can be on the one hand to the size of Database and on the other hand to the size of the memory to be held for this purpose. In particular, in the construction of the memory of individual elements of different storage capacity, it is possible to achieve an optimization of the real storage space requirement.
  • a single query is preferably an atomic information request, so in particular a query in which a criterion is queried.
  • the scope and formulation of the atomic information query is defined by the respective query language.
  • one or more second configurations can be maintained and then applied by rules. These rules can intervene automatically, for example, if the storage space becomes smaller by a factor of 2, the second configuration will continue to operate instead of the first, or else the change will be triggered by an operator.
  • the elements comprise processors.
  • a processor is understood to mean a hardware component which can perform calculations of a specific type.
  • a processor is understood to mean a component or software that can process input to output.
  • processors are understood to mean microprocessors.
  • such processors have one or more processor cores.
  • At least one of the following elements comprises:
  • the hardware pool as a whole may include memory, but may also include elements that include elemental memory.
  • the hardware pool can be constructed both from a common processor pool and a shared memory pool as well as alternatively or additionally from individual elements in each case comprising processors and memory.
  • processors and memory may be dynamically expand by, for example, in the case of a greater need for computing power and / or storage capacity, additional elements with memory and processors can be added, which are used in other load situations for other activities.
  • the steps a. to c. repeatedly, according to at least one of the following schemes:
  • the method according to the invention is possible to run the method according to the invention at predeterminable times.
  • the resources must be allocated in accordance with the specifiable criteria and, if appropriate, maintenance work on the unneeded elements at these times of the hardware pool.
  • the inventive Process steps also take place in predeterminable time intervals, for example every 10 days, every 20 hours or the like.
  • one or more of the parameters i. to v. and that the criterion may also be set in relation to one or more of the variables A. to F. For example, it may be attempted to simultaneously reduce the power required to operate the database and the input or output time to or from the database for a predefinable amount of data.
  • the single figure shows schematically a hardware pool for operating a database.
  • the hardware pool 1 is composed of several elements 2. A part of the elements 2 is designed as a computer 3. Each of the computers 3 comprises at least one processor 4, which may also be a multi-core processor, and memory 5.
  • the memory 5 may comprise both volatile memory, for example RAM or also hard disk memory.
  • the hardware pool comprises a memory 5 which is switchable, but which can not be assigned to a specific computer 3. This may be, for example, a hard disk storage or the like. Further, further processors 4 are formed, which are switchable and which are also not assigned to a specific computer 2.
  • the separate memory 5 is part of a computer 3 which in itself is not part of the hardware pool 1, but whose memory can be used if necessary.
  • the processors 4 which are not part of a computer 3 of the hardware pool 1.
  • the database is currently operated in a first configuration 6 on at least a first part of the elements 2.
  • the first configuration 6 thus comprises resources, in particular computer 3, processors 4 and memory 5.
  • a supervisor 7. This is a program that runs on hardware that may be part of the hardware pool 1, however may also be formed separately from this.
  • the supervisor 7 monitors the database and the hardware pool and executes the method according to the invention in a controlling manner.
  • a real test of the database takes place.
  • criteria are checked which are based on or from the at least one parameter i. to v, relate or result from these.
  • a first second configuration 8 and a second second configuration 9 are shown. These in each case comprise other elements 2 of the hardware pool 1.
  • supervision of the supervisor 7 now checks whether, for example, the power consumption in the first second configuration 8 is smaller than in the first configuration 6 or if the required memory space for operating the database in the second second configuration 9 is smaller than in the first configuration 6 or the first second configuration 8. Then, a migration of the database in the first second configuration 8 - which then becomes the first configuration - or in the second second configuration 9 done. In this case, the migration can be triggered automatically if a specifiable criterion is met, for example, the storage space is smaller by a factor of 2 than in the first configuration 6.
  • these second configurations 8, 9 can also be kept on call or taking into account the historical behavior of the database a migration done.
  • the historical behavior of the database is understood to be monitored by the supervisor, whether certain times (times of day, times on a particular day of the week, times at a specific event such as the end of the month or the middle of the month, ...) required certain requirements for the hardware pool 1 to operate the database.
  • times of day times of day, times on a particular day of the week, times at a specific event such as the end of the month or the middle of the month, ...) required certain requirements for the hardware pool 1 to operate the database.
  • the method according to the invention advantageously permits efficient operation of the database on the hardware pool 1. Particularly in the case of very large or very query-intensive databases and in databases in which the query volume and / or the database size vary over time, the method according to the invention is advantageous.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Das erfindungsgemässe Verfahren zum Betrieb mindestens einer Datenbank auf einem Hardwarepool aus mehreren Elementen mit Ressourcen, umfassend die folgenden Schritte: a) die Datenbank wird in einer ersten Konfiguration unter Ausnutzung zumindest eines ersten Teils der Ressourcen auf zumindest einem ersten Teil der Elemente des Hardwarepools betrieben, b) mindestens einer der folgenden Parameter wird überwacht: i) die Ressourcen des Hardwarepools; ii) elementindividuelle Elementressourcen der Elemente des Hardwarepools; iii) der Auslastungsgrad der Elemente des Hardwarepools; iv) die Verfügbarkeit der Elemente des Hardwarepools; und v) ein historisches Verhalten der Datenbank, c) wobei für die mindestens eine Datenbank überprüft wird, ob die Datenbank in einer zweiten Konfiguration unter Ausnutzung zumindest eines zweiten Teils der Ressourcen des Hardwarepools auf zumindest einem zweiten Teil der Elemente des Hardwarepools unter Erfüllung eines vorgebbaren Kriteriums mit dem mindestens einen Parameter betreibbar ist, zeichnet sich dadurch aus, dass in Schritt 1.c. die Übertragung der mindestens einen Datenbank auf die zweite Konfiguration erfolgt und diese dort betrieben wird.

Description

Verfahren zum Betrieb mindestens einer Datenbank auf einem
Hardwarepool Die vorliegende Erfindung beschäftigt sich mit dem Betrieb mindestens einer Datenbank auf einem Hardwarepool.
Datenbanken werden zur Verwaltung ganz unterschiedlicher Datenbestände in unterschiedlichen Branchen eingesetzt. Bei den Datenbeständen kann es sich beispielsweise um Kunden- und Bestellungsdaten im Verkaufsbereich handeln als auch um Datenbestände beispielsweise einer Bibliothek oder ähnliches. Insbesondere dann, wenn die Datenbank eine gewisse Größe überschreitet, die Zahl der Abfragen aus der Datenbank relativ hoch ist und/oder die Zahl der neu in die Datenbank aufzunehmenden Daten hoch ist, ist es nicht einfach, die Datenbank effizient zu betreiben. Dies bedeutet insbesondere, dass die vorhandenen Ressourcen des Hardwarepools nicht optimal ausgenutzt werden, dass die Zeit für die Abfrage von Daten in der Datenbank relativ hoch wird oder dass nicht genügend Abfragen gleichzeitig oder in kurzen Zeitintervallen hintereinander bearbeitet werden können.
Insbesondere dann, wenn die Datenbanken dynamisch sind, das heißt, sehr viele Daten regelmäßig in die Datenbank aufgenommen oder aus dieser entfernt werden oder sich das Abfragevolumen mit der Zeit oder in Zeitintervallen signifikant ändert, haben sich die bisher aus dem Stand der Technik bekannten Ansätzen zur Optimierung solcher Datenbanken als unbefriedigend erwiesen.
Hiervon ausgehend liegt der vorliegenden Erfindung die Aufgabe zugrunde, ein Verfahren zum Betrieb mindestens einer Datenbank anzugeben, bei welchem die aus dem Stand der Technik bekannten Probleme zumindest teilweise überwunden werden und insbesondere ein effizienter Betrieb einer dynamischen Datenbank im obigen Sinne möglich ist. Diese Aufgabe wird gelöst durch ein Verfahren mit den Merkmalen des unabhängigen Anspruchs. Abhängige Ansprüche sind auf vorteilhafte Weiterbildungen gerichtet.
Die in den Ansprüchen einzeln aufgeführten Merkmale sind in beliebiger, technologisch sinnvoller Weise miteinander kombinierbar und können durch erläuternde Sachverhalte aus der Beschreibung ergänzt werden, wobei weitere Ausführungsvarianten der Erfindung aufgezeigt werden.
Gegenstand der vorliegenden Erfindung ist ein Verfahren zum Betrieb mindestens einer Datenbank auf einem Hardwarepool aus mehreren Elementen mit Ressourcen umfassen die folgenden Schritte:
a. die Datenbank wird in einer ersten Konfiguration unter Ausnutzung zumindest eines ersten Teils der Ressourcen auf zumindest einem ersten Teil der Elemente des Hardwarepools betrieben,
b. mindestens einer der folgenden Parameter wird überwacht:
i. die Ressourcen des Hardwarepools;
ii. individuelle Elementressourcen der Elemente des Hardwarepools;
in. der Auslastungsgrad der Elemente des Hardwarepools;
iv. die Verfügbarkeit der Elemente des Hardwarepools; und v. ein historisches Verhalten der Datenbank;
c. wobei für die mindestens eine Datenbank überprüft wird, ob die Datenbank in einer zweiten Konfiguration unter Ausnutzung zumindest eines zweiten Teils der Ressourcen des Hardwarepools auf zumindest einem zweiten Teil der Elemente des Hardwarepools unter Erfüllung eines vorgebbaren Kriteriums mit dem mindestens Parameter betreibbar ist,
wobei in Schritt c. die Übertragung der mindestens einen Datenbank auf die zweite Konfiguration erfolgt und die mindestens eine Datenbank dort in der zweiten Konfiguration betrieben wird. Unter einem Hardwarepool aus einer Mehrzahl von Elementen oder Datenverarbeitungseinheiten wird beispielsweise ein Rechnernetzwerk oder ein Rechner mit einer Vielzahl von Prozessoren und Speicherbereichen verstanden. Unter einem Element des Hardwarepools wird insbesondere eine Einheit verstanden, die Berechnungen durchführen kann. Ein Element umfasst insbesondere mindestens einen Prozessor, insbesondere Ein- oder Mehrkernprozessoren, bevorzugt mehrere Prozessoren und entsprechende Speicherhardware. Unter dem Begriff Ressource werden die Teile des Hardwarepools verstanden, auf denen Rechnungen durchgeführt werden können oder auf denen Daten abgelegt werden können. Unter einer Ressource kann also ein Prozessor, insbesondere ein üblicherweise als Grafikprozessor eingesetzter Prozessor (Graphics Processing Unit, GPU) oder ein üblicherweise als Hauptprozessor eingesetzter Prozessor (Central Processing Unit, CPU), ein Kommunikationsprozessor (Communication Control Processor, CCP), ein Speicherbaustein (Random Access Memory, RAM), Cache Speicher in GPUs oder CPUs, ein reversibel betreibbares Speichermedium, insbesondere eine Festplatte, eine SSD-Festplatte, interne und externe Festplatten, Festplatten-Server (Storages), eine Datenleitung, insbesondere im Inneren eines Rechners oder eine Netzwerkverbindung, oder ähnliches verstanden werden.
Unter der Konfiguration der Datenbank wird die Art und Weise verstanden, in der diese betrieben wird und auf welchen Elementen des Hardwarepools sie betrieben wird, insbesondere unter Berücksichtigung der gewählten Elemente und der einzelnen Ressourcen der Elemente, die im Folgenden als Elementressourcen bezeichnet werden. So ist es beispielsweise möglich, die Datenbank in einer ersten Konfiguration mit einer ersten Gruppe von Elementen zu betreiben, die jeweils individuelle Elementressourcen aufweisen, während die Datenbank auch in einer zweiten Konfiguration mit einer anderen Gruppe von Elementen mit anderen Elementressourcen betreibbar ist. So ist beispielsweise denkbar, dass für Zustände oder Betriebsmodi, in denen eine hohe Rechenleistung benötigt wird, Elemente mit vielen Prozessoren oder als Elemente Prozessoren hoher Rechenleistung ausgewählt werden, während für Zustände, in denen weniger Rechenkapazität aber hohe Speicherkapazität und gegebenenfalls hohe Datenaustauschraten benötigt werden, die Datenbank in einer Konfiguration mit Elementen betrieben wird, bei denen hohe Datenaustauschraten in und aus großen Speicherbereiche realisiert werden können.
Bei der Überwachung des Parameters i. (der Ressourcen des Hardwarepools) wird beispielsweise überwacht, welche Stati die einzelnen Ressourcen des Hardwarepools aufweisen also beispielsweise ob bestimmte Speicherbereiche genutzt werden, ob bestimmte Ressourcen intakt oder defekt sind, wie viele freie Ressourcen verfügbar sind, ob ein Prozessor mit den entsprechenden Aufgaben ausgelastet ist, welcher Stromverbrauch für die einzelnen Ressourcen des Hardwarepools vorliegt, welche Übertragungszeiten beim Datentransfer zwischen einzelnen Ressourcen des Hardwarepools vorliegen etc.
Bei Überwachung des Parameters ii. (der elementindividuellen Elementressourcen der Elemente des Hardwarepools) werden insbesondere auch die Elementressourcen der einzelnen Elemente des Hardwarepools in die Überwachung mit einbezogen, so dass beispielsweise der Status eines bestimmten Speicherbausteins eines bestimmten Elements des Hardwarepools überwacht werden kann.
Bei der Überwachung des Parameters iii. (des Auslastungsgrads der Elemente des Hardwarepools) wird überwacht, ob und wenn ja in welchem Maße die einzelnen Elemente und insbesondere die Prozessoren der Elemente ausgelastet sind, wie hoch der Auslastungsgrad der eingesetzten Speicherbausteine ist, wie hoch die zu übertragende Datenmenge beim Betrieb der Datenbank ist usw. Bei der Überwachung des Parameters iv. (der Verfügbarkeit der Elemente des Hardwarepools) wird insbesondere überwacht, ob die einzelnen Elemente funktionsfähig und einsatzbereit sind, ob sie gegebenenfalls für andere Aufgaben eingesetzt werden usw.
Bei der Überwachung des Parameters v. (des historischen Verhaltens der Datenbank) wird insbesondere überprüft, wie die Datenbank in der Vergangenheit betrieben wurde und welche Parameter der Parameter i. bis iv. dort relevant waren. So ist es beispielsweise möglich, anhand des historischen Verhaltens zu ermitteln, zu welchen Wochentagen und Tageszeiten besondere Zugriffsdichten oder besondere Aktionen ausgeführt wurden usw. So kann beispielsweise bei der Verwaltung einer Datenbank für Fußballergebnisse analysiert werden, dass insbesondere vor und an Spieltagen der Fußballbundesliga eine besonders hohe Zahl von Abfragen durchgeführt wurde. Dies kann dann bei der entsprechenden Festlegung der Konfiguration berücksichtigt werden, in dem beispielsweise für solche Stoßzeiten eine Konfiguration gewählt wird, die den hohen zu erwartenden Anfragedichten genüge tut. Die Überprüfung, ob die Datenbank in einer anderen Konfiguration besser betreibbar ist, erfolgt erfindungsgemäß so, dass zunächst ein bestimmtes Kriterium aufgestellt wird, welches erfüllt werden soll. Beispielsweise kann ein solches Kriterium lauten, dass der Stromverbrauch beim Betrieb der Datenbank kleiner werden soll oder dass eine bestimmte mittlere Zugriffszeit für die Abfragen der Datenbank gewährleistet werden soll oder auch, dass die für alle möglichen Einzelabfragen notwendigen Zeiten minimiert werden sollen. Dann wird die Datenbank in eine zweite Konfiguration übertragen. Es wird dabei der gesamte Datenbestand, inklusive aller bis dahin durchgeführten Anfragen, gegebenenfalls mit einer Statistik über die Anfragen, insbesondere unter Berücksichtigung der Art und Weise der letzten und der häufigsten Anfragen) auf die zweite Konfiguration übertragen. In der zweiten Konfiguration wird geprüft, ob die Datenbank in der zweiten Konfiguration unter Berücksichtigung des mindestens einen Parameters und Erfüllung des vorgegebenen Kriteriums betreibbar ist. So könnte beispielsweise festgestellt werden, dass der Stromverbrauch bei Betrieb der Datenbank in der zweiten Konfiguration geringer ist als in der ersten Konfiguration. In diesem Falle kann die Datenbank aus der ersten Konfiguration in die zweite Konfiguration migriert und dann in dieser betrieben werden.
Durch die Übertragung der Datenbank in die zweite Konfiguration ist es möglich, nicht nur eine theoretische Optimierung der Datenbank vorzunehmen, sondern auch unter realen Bedingungen das Kriterium oder die entsprechenden Kriterien zu überprüfen.
Die Überprüfung kann dabei durch einen Supervisor geregelt werden, der Zugriff auf die Datenbank und den Hardwarepool hat. Bei dem Supervisor kann es sich um eine Software handeln, die das erfindungsgemäße Verfahren durchführt. Der Supervisor kann auf einem Teil des Hardwarepools ablaufen, alternativ kann der Supervisor auch auf einer Hardware außerhalb des Hardwarepools bereitgestellt werden.
Gemäß einer vorteilhaften Ausgestaltung des erfindungsgemäßen Verfahrens wird die Datenbank in die zweite Konfiguration migriert und in der zweiten Konfiguration weiter betrieben, wenn die Datenbank in der zweiten Konfiguration unter Erfüllung des Kriteriums betreibbar ist.
Hierbei kann die Migration beispielsweise automatisch ausgeführt werden, wenn ein bestimmtes Kriterium erfüllt wird, beispielsweise der Stromverbrauch zum Betrieb der Datenbank um mehr als 30% sinkt oder der Speicherbedarf um 40 % und mehr sinkt. Alternativ können die unterschiedlichen Konfigurationen getestet und vorgehalten werden, so dass ein Benutzer entscheiden kann, in welcher Konfiguration die Datenbank betrieben werden soll.
Gemäß einer weiteren vorteilhaften Ausgestaltung des erfindungsgemäßen Verfahrens wird das Kriterium in Bezug auf mindestens eine der folgenden Größen vorgegeben: A. den zum Betrieb der Datenbank notwendigen Stromverbrauch;
B. die zum Durchführen bestimmter Berechnungen in oder mit der Datenbank notwendige Rechenzeit;
C. die Ein- oder Ausgabezeit in oder aus der Datenbank für eine vorgebbare Datenmenge;
D. ein zum Betrieb der Datenbank notwendiger Speicherplatz;
E. eine zur Durchführung einer Einzelabfrage notwendige Zeit; und
F. eine Summe der Zeiten aller möglichen Einzelabfragen. Die Vorgabe eines Kriteriums in Bezug auf den zum Betrieb der Datenbank notwendigen Stromverbrauch kann insbesondere eine Minimierung des Stromverbrauchs zum Betrieb der Datenbank zum Ziel haben. Bei der Vorgabe des Kriteriums in Bezug auf die zum Durchführen bestimmter Berechnungen in oder mit der Datenbank notwendige Rechenzeit kann insbesondere berücksichtigt werden, dass z. B. regelmäßig (ggf. einmal wöchentlich, einmal im Monat oder einmal täglich) bestimmte Operationen durchgeführt werden, die sich beispielsweise aus dem historischen Verhalten der Datenbank ergeben und dann auf die notwendige Rechenzeit für diese Operation abgestellt werden. So ist es beispielsweise möglich, dass bestimmte Operationen deutlich höhere Prozessorkapazität oder größere Datentransferraten benötigen als im üblichen Betrieb der Datenbank vorzuhalten sind. So kann es vorteilhaft sein, dann, wenn solche Abfragen zu erwarten sind, eine entsprechende Konfiguration mit höherer Rechenkapazität und/oder Datentransf errate vorzusehen.
Bei der Vorgabe eines Kriteriums in Bezug auf die Ein- oder Ausgabezeit in oder aus der Datenbank für eine vorgebbare Datenmenge kann berücksichtigt werden, welche Datenmengen normalerweise oder üblicherweise abgefragt werden. Auch hier kann erneut das historische Verhalten der Datenbank berücksichtigt werden. Weiterhin kann ein Kriterium in Bezug auf den zum Betrieb der Datenbank notwendigen Speicherplatz vorgegeben werden. Bei dem zum Betrieb der Datenbank notwendigen Speicherplatz kann es sich einerseits um die Größe der Datenbank handeln und andererseits um die Größe des dafür vorzuhaltenden Speichers. Insbesondere beim Aufbau des Speichers aus einzelnen Elementen unterschiedlicher Speicherkapazität ist es so möglich, eine Optimierung des realen Speicherplatzbedarfs zu erreichen.
Unter einer Einzelabfrage wird bevorzugt eine atomare Informationsanfrage, also insbesondere eine Abfrage, bei dem ein Kriterium abgefragt wird. Insbesondere wird Umfang und Formulierung der atomaren Informationsabfrage durch die jeweilige Abfragesprache definiert.
Grundsätzlich können eine oder mehrere zweite Konfigurationen vorgehalten werden und dann anhand von Regeln angewendet werden. Diese Regeln können automatisch eingreifen, beispielsweise falls der Speicherplatz um den Faktor 2 kleiner wird, wird die zweite Konfiguration statt der ersten weiter betrieben oder aber der Wechsel durch eine Bedienperson ausgelöst werden.
Gemäß einer vorteilhaften Ausgestaltung des erfindungsgemäßen Verfahrens umfassen die Elemente Prozessoren. Unter einem Prozessor wird ein Hardwarebauteil verstanden, welches Berechnungen bestimmter Art durchführen kann. Allgemein wird unter einem Prozessor ein Bauteil oder eine Software verstanden, die Input zu Output verarbeiten kann. Insbesondere werden unter Prozessoren Mikroprozessoren verstanden. Bevorzugt weisen solche Prozessoren einen oder mehrere Prozessorkerne auf.
Gemäß einer weiteren Ausgestaltung des erfindungsgemäßen Verfahrens umfasst mindestens eines der folgenden Elemente:
i) die Ressourcen des Hardwarepools; und
ii) die elementindividuellen Elementressourcen;
Speicher. Folglich kann der Hardwarepool als Ganzes Speicher umfassen, er kann jedoch auch Elemente umfassen, die elementindividuellen Speicher umfassen. Der Hardwarepool kann sowohl aus einem gemeinsamen Prozessorpool und einem gemeinsamen Speicherpool als auch alternativ oder ergänzend aus einzelnen Elementen jeweils umfassend Prozessoren und Speicher aufgebaut sein. So ist es grundsätzlich auch möglich, den Hardwarepool dynamisch zu erweitern, indem beispielsweise im Falle eines höheren Bedarfs für Rechenleistung und/oder Speicherkapazität weitere Elemente mit Speicher und Prozessoren zugeschaltet werden können, die in anderen Lastsituationen für andere Tätigkeiten eingesetzt werden.
Gemäß einer weiteren vorteilhaften Ausgestaltung des erfindungsgemäßen Verfahrens laufen die Schritte a. bis c. wiederholt ab, nach mindestens einem der folgenden Schemata:
I. kontinuierlich;
II. zu vorgebbaren Zeitpunkten; und
III. in vorgebbaren Zeitintervallen. So ist es möglich, das erfindungsgemäße Verfahren kontinuierlich ablaufen zu lassen, also ständig nach einer besseren Konfiguration in Bezug auf mindestens ein vorgebbares Kriterium zu suchen, wobei es beispielsweise auch möglich ist, die Kriterien zu ändern, beispielsweise auch unter Berücksichtigung des historischen Verhaltens der Datenbank.
Alternativ oder zusätzlich ist es möglich, das erfindungsgemäße Verfahren zu vorgebbaren Zeitpunkten ablaufen zu lassen. So ist es beispielsweise denkbar, zu bestimmten Zeiten in einer Woche oder einem Monat, von denen bekannt ist, dass relativ geringes Rechen- oder Abfragenaufkommen notwendig ist, die Ressourcen entsprechend den vorgebbaren Kriterien zu belegen und gegebenenfalls zu diesen Zeiten Wartungsarbeiten an den nicht benötigten Elementen des Hardwarepools durchzuführen. Weiterhin können die erfindungsgemäßen Verfahrensschritte auch in vorgebbaren Zeitintervallen erfolgen, beispielsweise alle 10 Tage, alle 20 Stunden oder ähnliches.
Grundsätzlich ist festzuhalten, dass einer oder mehrere der Parameter i. bis v. überwacht werden, und dass das Kriterium auch in Bezug auf eine oder mehrere der Größen A. bis F. festgelegt werden kann. Es kann also beispielsweise versucht werden, gleichzeitig den zum Betrieb der Datenbank notwendigen Strom und die Ein- oder Ausgabezeit in oder aus der Datenbank für eine vorgebbare Datenmenge zu reduzieren.
Im Folgenden soll die Erfindung unter Verweis auf die beigefügte Figur näher erläutert werden, ohne auf die dort gezeigten Details und Ausführungsbeispiele beschränkt zu sein. Die einzige Figur zeigt schematisch einen Hardwarepool zum Betrieb einer Datenbank.
Der Hardwarepool 1 setzt sich aus mehreren Elementen 2 zusammen. Ein Teil der Elemente 2 ist als Computer 3 ausgeführt. Jeder der Computer 3 umfasst mindestens einen Prozessor 4, der auch ein Mehrkernprozessor sein kann, und Speicher 5. Der Speicher 5 kann sowohl flüchtigen Speicher, beispielsweise RAM oder auch Festplattenspeicher umfassen. Weiterhin umfasst der Hardwarepool einen Speicher 5, der zuschaltbar ist, der aber nicht einem bestimmten Computer 3 zuordenbar ist. Hierbei kann es sich beispielsweise um einen Festplattenspeicher oder ähnliches handeln. Ferner sind weitere Prozessoren 4 ausgebildet, die zuschaltbar sind und die ebenfalls nicht einem bestimmten Computer 2 zuzuordnen sind.
Es ist beispielsweise möglich, dass der getrennte Speicher 5 Teil eines Computers 3 ist, der an sich nicht Teil des Hardwarepools 1 ist, dessen Speicher aber im Bedarfsfall genutzt werden kann. Gleiches gilt für die Prozessoren 4 die nicht Teil eines Computers 3 des Hardwarepools 1 sind. Auch diese können in anderen Computer 3 verbaut sein, die an und für sich nicht Teil des Hardwarepools 1 sind, deren Prozessoren aber im Bedarfsfall für den Hardwarepool 1 genutzt werden können. Die Datenbank wird im Moment in einer ersten Konfiguration 6 auf zumindest einem ersten Teil der Elemente 2 betrieben. Die erste Konfiguration 6 umfasst damit Ressourcen und zwar insbesondere Computer 3, Prozessoren 4 und Speicher 5. Weiterhin gezeigt ist ein Supervisor 7. Hierbei handelt es sich um ein Programm, welches auf einer Hardware abläuft, die Teil des Hardwarepools 1 sein kann, die jedoch auch getrennt von diesem ausgebildet sein kann. Der Supervisor 7 überwacht die Datenbank und den Hardwarepool und führt das erfindungsgemäße Verfahren steuernd aus. Das heißt insbesondere, dass in der ersten Konfiguration mindestens einer der Parameter i. bis v. überwacht und veranlasst wird, dass die Datenbank auf eine zweite Konfiguration übertragen und betrieben wird. Es erfolgt also in der anderen - zweiten - Konfiguration ein Realtest der Datenbank. Hierbei werden erfindungsgemäß Kriterien überprüft, die sich auf oder aus dem mindestens einen Parameter i. bis v, beziehen beziehungsweise sich aus diesen ergeben. Beispielhaft ist eine erste zweite Konfiguration 8 und eine zweite zweite Konfiguration 9 gezeigt. Diese umfassen jeweils andere Elemente 2 des Hardwarepools 1. Im Realtest wird nun unter Überwachung des Supervisors 7 überprüft, ob beispielsweise der Stromverbrauch in der ersten zweiten Konfiguration 8 kleiner ist als in der ersten Konfiguration 6 oder ob der benötigte Speicherplatz zum Betrieb der Datenbank in der zweiten zweiten Konfiguration 9 kleiner ist als in der ersten Konfiguration 6 oder der ersten zweiten Konfiguration 8. Dann kann eine Migration der Datenbank in die erste zweite Konfiguration 8 - die dann zur ersten Konfiguration wird - oder in die zweite zweite Konfiguration 9 erfolgen. Hierbei kann die Migration automatisch ausgelöst werden, wenn ein vorgebbares Kriterium erfüllt ist, beispielsweise der Speicherplatz um den Faktor 2 kleiner ist als in der ersten Konfiguration 6. Es können aber auch diese zweiten Konfigurationen 8, 9 vorgehalten werden und auf Abruf oder unter Berücksichtigung des historischen Verhaltens der Datenbank eine Migration erfolgen. Unter dem historischen Verhalten der Datenbank wird hier insbesondere verstanden, dass durch den Supervisor überwacht wird, ob es bestimmte Zeiten (Tageszeiten, Zeiten an einem bestimmten Wochentag, Zeiten an einem bestimmten Ereignis wie beispielsweise am Monatsende oder zur Monatsmitte, ...) bestimmte Anforderungen an den Hardwarepool 1 zum Betrieb der Datenbank notwendig waren. Diese können bei der Festlegung der Kriterien herangezogen werden oder auch bei der Bildung der entsprechenden zweiten Konfiguration 8, 9.
Das erfindungsgemäße Verfahren erlaubt in vorteilhafter Weise einen effizienten Betrieb der Datenbank auf dem Hardwarepool 1. Insbesondere bei sehr großen oder sehr abfrageintensiven Datenbanken und bei Datenbanken, bei denen das Abfragevolumen und/oder die Datenbankgröße mit der Zeit variieren, ist das erfindungsgemäße Verfahren vorteilhaft.
Bezugszeichenliste 1 Hardwarepool
2 Element
3 Computer
4 Prozessor
5 Speicher
6 erste Konfiguration
7 Supervisor
8 erste zweite Konfiguration
9 zweite zweite Konfiguration

Claims

Patentansprüche
Verfahren zum Betrieb mindestens einer Datenbank auf einem Hardwarepool aus mehreren Elementen mit Ressourcen, umfassend die folgenden Schritte:
a. die Datenbank wird in einer ersten Konfiguration unter Ausnutzung zumindest eines ersten Teils der Ressourcen auf zumindest einem ersten Teil der Elemente des Hardwarepools betrieben,
b. mindestens einer der folgenden Parameter wird überwacht: i. die Ressourcen des Hardwarepools;
ii. elementindividuelle Elementressourcen der Elemente des Hardwarepools;
in. der Auslastungsgrad der Elemente des Hardwarepools; iv. die Verfügbarkeit der Elemente des Hardwarepools; und v. ein historisches Verhalten der Datenbank,
c. wobei für die mindestens eine Datenbank überprüft wird, ob die Datenbank in einer zweiten Konfiguration unter Ausnutzung zumindest eines zweiten Teils der Ressourcen des Hardwarepools auf zumindest einem zweiten Teil der Elemente des Hardwarepools unter Erfüllung eines vorgebbaren Kriteriums mit dem mindestens einen Parameter betreibbar ist, dadurch gekennzeichnet, dass in Schritt c die Übertragung der mindestens einen Datenbank auf die zweite Konfiguration erfolgt und diese dort betrieben wird.
Verfahren nach Anspruch 1, bei dem die Datenbank in die zweite Konfiguration migriert und in der zweiten Konfiguration weiter betrieben wird, wenn die Datenbank in der zweiten Konfiguration unter Erfüllung des Kriteriums betreibbar ist. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Kriterium in Bezug auf mindestens eine der folgenden Größen vorgegeben wird:
A. den zum Betrieb der Datenbank notwendigen Stromverbrauch;
B. die zum Durchführen bestimmter Berechnungen in oder mit der Datenbank notwendige Rechenzeit;
C. die Ein- oder Ausgabezeit in oder aus der Datenbank für eine vorgebbare Datenmenge;
D. ein zum Betrieb der Datenbank notwendiger Speicherplatz;
E. eine zur Durchführung einer Einzelabfrage notwendige Zeit; und
F. eine Summe der Zeiten aller möglichen Einzelabfragen.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Elemente Prozessoren umfassen.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem mindestens eines der folgenden Elemente:
i) die Ressourcen des Hardwarepools; und
ii) die elementindividuellen Elementressourcen
Speicher umfasst.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Schritte a. bis c. wiederholt ablaufen nach mindestens einem der folgenden Schemata:
I. kontinuierlich;
II. zu vorgebbaren Zeitpunkten; und
III. in vorgebbaren Zeitintervallen.
PCT/EP2012/058478 2011-05-09 2012-05-09 Verfahren zum betrieb mindestens einer datenbank auf einem hardwarepool WO2012152804A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102011100969A DE102011100969A1 (de) 2011-05-09 2011-05-09 Verfahren zum Betrieb mindestens einer Datenbank auf einem Hardwarepool
DE102011100969.1 2011-05-09

Publications (1)

Publication Number Publication Date
WO2012152804A1 true WO2012152804A1 (de) 2012-11-15

Family

ID=46085929

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2012/058478 WO2012152804A1 (de) 2011-05-09 2012-05-09 Verfahren zum betrieb mindestens einer datenbank auf einem hardwarepool

Country Status (2)

Country Link
DE (1) DE102011100969A1 (de)
WO (1) WO2012152804A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103149982A (zh) * 2013-03-07 2013-06-12 佟小龙 数据处理方法及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113448962B (zh) * 2021-06-02 2022-10-28 中科驭数(北京)科技有限公司 数据库数据管理方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005116871A1 (en) * 2004-05-28 2005-12-08 Pattern Recognition Systems As Method and apparatus for tuning database configuration parameters usnig multivariate analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005116871A1 (en) * 2004-05-28 2005-12-08 Pattern Recognition Systems As Method and apparatus for tuning database configuration parameters usnig multivariate analysis

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Database and Expert Systems Applications", vol. 1873, 1 January 2000, SPRINGER BERLIN HEIDELBERG, Berlin, Heidelberg, ISBN: 978-3-54-067978-3, article PATRICK MARTIN ET AL: "Dynamic Reconfiguration Algorithm: Dynamically Tuning Multiple Buffer Pools", pages: 92 - 101, XP055036785 *
PAPADOMANOLAKIS S ET AL: "AutoPart: automating schema design for large scientific databases using data partitioning", SCIENTIFIC AND STATISTICAL DATABASE MANAGEMENT, 2004. PROCEEDINGS. 16T H INTERNATIONAL CONFERENCE ON SANTORINI ISLAND, GREECE 21-23 JUNE 2004, PISCATAWAY, NJ, USA,IEEE, 21 June 2004 (2004-06-21), pages 383 - 392, XP010707923, ISBN: 978-0-7695-2146-6, DOI: 10.1109/SSDM.2004.1311234 *
WEIKUM G ET AL: "The comfort automatic tuning project", INFORMATION SYSTEMS, PERGAMON PRESS, OXFORD, GB, vol. 19, no. 5, 1 July 1994 (1994-07-01), pages 381 - 432, XP024234586, ISSN: 0306-4379, [retrieved on 19940701], DOI: 10.1016/0306-4379(94)90004-3 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103149982A (zh) * 2013-03-07 2013-06-12 佟小龙 数据处理方法及系统

Also Published As

Publication number Publication date
DE102011100969A1 (de) 2012-11-15

Similar Documents

Publication Publication Date Title
DE102007016060B4 (de) Computerarbeitslastneuverteilung
DE3852997T2 (de) Rechnersystem und Verfahren für die Überwachung von nichtstationären Datenstrukturen in einem Rechnersystem.
DE68924954T2 (de) Übertragungssystem für verteilte Datenbanken.
DE112012000797B4 (de) Mehrfach-Modellierungsparadigma für eine Vorhersageanalytik
DE102020113347A1 (de) Ausführung von containerisierten prozessen innerhalb der beschränkungen der verfügbaren host-knoten
DE112011103497T5 (de) Informationsverarbeitungssystem, Informationsverarbeitungsvorrichtung, Lastausgleichsverfahren, Planungsverfahren für die Datenbankbereitstellung und Programm zum Durchführen der Verbindungsverteilung für den Lastausgleich in einer verteilten Datenbank
EP1711892B1 (de) Verfahren zum bestimmen eines übernahmeszenarios der softwareeinheiten bei einem rechnerausfall in einer serverfarm
EP2500823A1 (de) Betrieb eines Datenverarbeitungsnetzes mit mehreren geografisch beabstandeten Datenzentren
DE10234138A1 (de) Verwalten einer Speicherkonkurrenz bei automatisierten Speichersystemen
DE112014000340T5 (de) Vorablesezugriff auf Daten für einen Chip mit einem übergeordneten Kern und einem Scout-Kern
DE102009004726A1 (de) Systeme und Verfahren zum Verfolgen von Befehlszeigern und Datenzugriffen
DE102009056282A1 (de) Technik zum Steuern von Verarbeitungsressourcen
DE3650160T2 (de) Sonderzweckprozessor zur Übernahme vieler Betriebssystemfunktionen in einem grossen Datenverarbeitungssystem.
DE112019005043T5 (de) Streamzuweisung unter verwendung von stream-guthaben
DE102020214951A1 (de) Verfahren zum dynamischen Zuweisen von Speicherbandbreite
DE102006046717A1 (de) Dynamisch migrierende Kanäle
WO2012152804A1 (de) Verfahren zum betrieb mindestens einer datenbank auf einem hardwarepool
DE102013205739A1 (de) Programmgestütztes lastbasiertes verwalten der prozessorbelegung
DE102007055138B4 (de) System zum Zugreifen auf einen Einzelport-Mehrwege-Cache
DE102018123563B4 (de) Verfahren zur Zwischenkernkommunikation in einem Mehrkernprozessor
EP3705993B1 (de) System und verfahren zum auffinden und identifizieren von rechenknoten in einem netzwerk
DE102013114451B4 (de) Verfahren zum Verteilen einer Prozessorlast auf Echtzeit-Prozessorthreads
DE60037972T2 (de) Verfahren und Gerät zum Anbieten von Betriebsmitteln in einem Internet-Gerät
DE102016206490A1 (de) Elektronische steuereinheit
DE602004011757T2 (de) Datenverarbeitungssystem zur Zuweisung von Objekten an Verarbeitungseinheiten

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12721474

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12721474

Country of ref document: EP

Kind code of ref document: A1