WO2000063789A2 - Method for prognosing the course of a data sequence and device for carrying out said method - Google Patents

Method for prognosing the course of a data sequence and device for carrying out said method Download PDF

Info

Publication number
WO2000063789A2
WO2000063789A2 PCT/EP2000/002784 EP0002784W WO0063789A2 WO 2000063789 A2 WO2000063789 A2 WO 2000063789A2 EP 0002784 W EP0002784 W EP 0002784W WO 0063789 A2 WO0063789 A2 WO 0063789A2
Authority
WO
WIPO (PCT)
Prior art keywords
influencing variables
course
neural network
forecast
data
Prior art date
Application number
PCT/EP2000/002784
Other languages
German (de)
French (fr)
Other versions
WO2000063789A3 (en
Inventor
Martin Kuehrer
Original Assignee
Siemens Ag Österreich
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Ag Österreich filed Critical Siemens Ag Österreich
Priority to AU42916/00A priority Critical patent/AU4291600A/en
Publication of WO2000063789A2 publication Critical patent/WO2000063789A2/en
Publication of WO2000063789A3 publication Critical patent/WO2000063789A3/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming

Definitions

  • the invention relates to a method for predicting the course of a data series, this forecast being determined from the course of suspected influencing variables by means of a neural network.
  • a fundamental problem when using neural networks is that they can only take into account a limited number of influencing variables.
  • the selection of the influencing variables therefore essentially determines the accuracy of an automatic forecasting system.
  • the invention is therefore based on the object of specifying a method of the type mentioned at the outset which leads to forecast values which are as accurate as possible.
  • this is done with a method for forecasting the course of a data series, this forecast being determined by means of a neural network from the course of suspected influencing variables with the following method steps: - Using a data filter, the set of suspected influencing variables recorded in a database is converted into a sentence with a limited number selected by influencing factors;
  • the neural network is trained with the selected influencing variables and part of the known course of the data series; - The forecast accuracy of the trained network is checked on the remaining part of the known course of the data series and assigned a value number;
  • a set of influencing variables is determined in an iterative process for which the value number reaches a minimum
  • the set of influencing variables with the minimum number of values is used to forecast the further course of the data series.
  • the method according to the invention also leads to very good prognosis results for data series with a large number of influencing variables.
  • the average forecast error of the neural network is determined both for the training data and for the check data and the larger value of the two is defined as the number of values.
  • the assessment of the "fitness”, i.e. the quality of a solution, is essential for the accuracy of a genetic algorithm.
  • the assessment of the fitness according to the invention requires comparatively little calculation effort and leads to good results.
  • the neural network is trained and checked for several different sets of influencing variables simultaneously.
  • the processes mentioned take up a lot of computing time. They are therefore executed in parallel, i.e. A neural network is set up on several computers, the selected sentences are distributed to these neural networks for testing, and the results are combined for further evaluation.
  • a device for carrying out the method, in which a plurality of computers are provided which work together using both the TCP and the DCOM protocol in such a way that one of the computers acts as a TCP server and DCOM Client and the other computers work as DCOM servers and TCP clients in accordance with the relevant standards.
  • the course of a data series is to be predicted for the future.
  • the history of the data series in the past and the corresponding values of presumed influencing variables are known. This data is in one
  • N is in the range
  • T in the range of a few 100.
  • Perceptron principle should have this N input neurons and 1 output neuron.
  • the number h e N. the "hidden" neurons of the intermediate layers can be freely selected.
  • G (K + 1) • h.
  • K is the number of input neurons, in this case equal to N.
  • the neural network is trained over the time axis, the maximum number of available training examples T and in the exemplary embodiment is an order of magnitude smaller than G. This network is overdetermined and therefore not realizable.
  • the aim now is to make the number of free parameters G smaller than that To keep the number of training examples 7, if possible by an entire order of magnitude: (K + ⁇ ) - h ⁇ T.
  • a set of K influencing variables x n (t) ... x fl ⁇ _ (t), l ⁇ n ] ... n ⁇ ⁇ N is to be selected on the basis of which the neural network determines an optimal prognosis.
  • this selection is made in an iterative process using a genetic algorithm. It is a search algorithm that mimics the biological processes of mutation, recombination and selection. The calculation of these processes is relatively complex, but leads to very good results.
  • the genetic algorithm and the neural network work together in such a way that a limited number of influencing variables are selected by means of the genetic algorithm and the neural network is trained and tested with these influencing variables and the corresponding values of the data series to be predicted.
  • the results are called the genetic fitness Algorithm fed back and used to determine further sets of influencing variables.
  • the set of influencing variables with the best fitness is then used to forecast the future course of the data series.
  • a filter is defined, the transfer function of which describes the selection process.
  • the filter comprises the database and a vector with K elements (n, ..., n ⁇ ) from which the input vector for the neural network is calculated.
  • the "transfer function" of this filter is therefore
  • the accuracy of the prognosis of the neural network for this input data is determined and defined as fitness.
  • the assessment of the "fitness”, i.e. the quality of a solution, is essential for the accuracy of a genetic algorithm.
  • the assessment of the fitness according to the invention requires comparatively little calculation effort and leads to good results.
  • new sentences are determined by recombination: two sentences are combined by exchanging the parameters, e.g.: from (n ,,, ..., n x ⁇ ) and # ⁇ - p ..., / ⁇ 2je becomes ( n 2l , n 22 , n u , n u , ..., n ⁇ _, n 2 ⁇ ).
  • the newly created sets of influencing variables are changed in a random manner by mutation. Then the fitness values of the neural network are again calculated for these sets.
  • the determination of a fitness value g requires relatively high computing power or computing time, mainly because the training process of the neural network requires a lot of effort. Therefore, according to the invention, several sets of influencing variables are processed in parallel on different computers.
  • the data records to be processed are queued and from there distributed to the individual computers for calculations.
  • This queue is executed on the computer on which the genetic algorithm is also calculated.
  • This computer is set up as a TCP server, in accordance with the “Transmission Control Protocol / Internet Protocol (TCP / IP). "A de facto
  • TCP / IP Transmission Control Protocol / Internet Protocol
  • IP is the agreement on how the individual data packets are formulated and sent.
  • the TCP then takes over the connection establishment and the secure delivery of the , g. / Data packet.
  • the name of TCP / IP is based on the two most used protocols, but they are basically dozens of different protocols. (Log collection). Many of these work invisibly to the user, but address the enormous problems of network access and the cooperation of various networks and routing methods that occur in such a diverse and heterogeneous network as the Internet.
  • the TCP / IP protocols can be roughly divided into four operating levels: network access, network, transport, application.
  • the other computers are set up as TCP clients.
  • conventional TCP servers cannot actively establish a connection, but can only react passively to requests. Therefore, the TCP server is executed using a different protocol (DCOM) as a client, whereby a TCP server / DCOM client TCP client / DCOM server architecture of the computer system.
  • DCOM protocol
  • a connection is set up as follows:
  • - DCOM client (computer 1) starts DCOM server on another computer (computer 2)
  • - DCOM server (computer 2) starts TCP client (computer 2) and

Abstract

The invention relates to a method for prognosing the course of a data sequence. Said prognosis is made by means of a neuronal network on the basis of the course of presumed influencing variables. A set of influencing variables is selected from the presumed influencing variables by applying a genetic algorithm. Said set of influencing variables constitutes the input values of the neuronal network for the prognosis of the further course of the data sequence.

Description

Verfahren zur Prognose des Verlaufes von Datenreihen und Vorrichtung zur Durchführung des VerfahrensMethod for forecasting the course of data series and device for carrying out the method
Die Erfindung betrifft ein Verfahren zur Prognose des Verlaufes einer Datenreihe, wobei diese Prognose mittels neuronalem Netz aus dem Verlauf vermuteter Einflußgrößen ermittelt wird.The invention relates to a method for predicting the course of a data series, this forecast being determined from the course of suspected influencing variables by means of a neural network.
Für die optimale Nutzung und Bereitstellung von Resourcen wie zB. elektrischer Energie sind fundierte Aussagen über den Bedarf von höchster Bedeutung. Dies gilt auch für die Resource Kapital, für deren optimale Veranlagung die Entwicklung der Finanzmärkte möglichst zutreffend prognostiziert werden muß.For the optimal use and provision of resources such as. electrical energy are well-founded statements about the need of the highest importance. This also applies to resource capital, for the optimal investment of which the development of the financial markets must be forecast as accurately as possible.
Diese Prognosen werden zunehmend mittels neuronalen Netzen erstellt.These forecasts are increasingly being created using neural networks.
Ein grundlegendes Problem beim Einsatz neuronaler Netze besteht nun darin, daß diese nur eine begrenzte Zahl von Einflußgrößen berücksichtigen können. Die Auswahl der Einflußgrößen bestimmt daher wesentlich die Treffsicherheit eines automatischen Prognosesystemes.A fundamental problem when using neural networks is that they can only take into account a limited number of influencing variables. The selection of the influencing variables therefore essentially determines the accuracy of an automatic forecasting system.
Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren der eingangs genannten Art anzugeben, welches zu möglichst treffsicheren Prognosewerten führt.The invention is therefore based on the object of specifying a method of the type mentioned at the outset which leads to forecast values which are as accurate as possible.
Dies geschieht erfindungsgemäß mit einem Verfahren zur Prognose des Verlaufes einer Datenreihe, wobei diese Prognose mittels neuronalem Netz aus dem Verlauf vermuteter Einflußgrößen ermittelt wird mit folgenden Verfahrensschritten: - mittels Datenfilter wird aus der in einer Datenbasis erfaßten Gesamtheit der vemuteten Einflußgrößen ein Satz mit einer begrenzten Zahl von Einflußgrößen ausgewählt;According to the invention, this is done with a method for forecasting the course of a data series, this forecast being determined by means of a neural network from the course of suspected influencing variables with the following method steps: - Using a data filter, the set of suspected influencing variables recorded in a database is converted into a sentence with a limited number selected by influencing factors;
- mit den ausgewählten Einflußgrößen und einem Teil des bekannten Verlaufes der Datenreihe wird das neuronale Netz trainiert; - die Prognosegenauigkeit des trainierten Netzes wird an dem restlichen Teil des bekannten Verlaufes der Datenreihe überprüft und mit einer Wertzahl belegt;- The neural network is trained with the selected influencing variables and part of the known course of the data series; - The forecast accuracy of the trained network is checked on the remaining part of the known course of the data series and assigned a value number;
- unter Zuhilfenahme eines genetischen Algorithmus wird in einem iterativen Prozeß ein Satz von Einflußgrößen ermittelt, für den die Wertzahl ein Minimum erreicht- With the aid of a genetic algorithm, a set of influencing variables is determined in an iterative process for which the value number reaches a minimum
- der Satz von Einflußgrößen mit der minimalen Wertzahl wird zur Prognose des weiteren Verlaufes der Datenreihe herangezogen. Wie anhand von Beipielen, wie z.B. der Entwicklung von Finanzmärkten gezeigt werden konnte, führt das erfindungsgemäße Verfahren auch bei Datenreihen mit sehr vielen Einflußgrößen zu sehr guten Prognoseerfolgen.- The set of influencing variables with the minimum number of values is used to forecast the further course of the data series. As could be shown on the basis of examples, such as the development of financial markets, the method according to the invention also leads to very good prognosis results for data series with a large number of influencing variables.
Vorteilhaft ist es, wenn zur Bestimmung der Wertzahl der mittlere Prognosefehler des neuronalen Netzes sowohl zu den Trainingsdaten wie auch zu den Überprüfungsdaten ermittelt und der größere Wert der beiden als Wertzahl festgelegt wird. Die Einschätzung der „Fitness" , d.h. der Qualität einer Lösung ist wesentlich für die Treffsicherheit eines genetischen Algorithmus. Die erfindungsgemäße Beurteilung der Fitness erfordert vergleichsweise geringen Berechnungsaufwand und führt zu guten Ergebnissen.It is advantageous if, in order to determine the number of values, the average forecast error of the neural network is determined both for the training data and for the check data and the larger value of the two is defined as the number of values. The assessment of the "fitness", i.e. the quality of a solution, is essential for the accuracy of a genetic algorithm. The assessment of the fitness according to the invention requires comparatively little calculation effort and leads to good results.
Vorteilhaft ist es weiterhin, wenn bei der Auswahl der Einflußgrößen eine vorgegebene Anzahl von Sätzen zufällig ausgewählt wird, daß aus diesen die Sätze ausgewählt werden, für welche die Wertzahl der Prognosegenauigkeit ein Minimum erreicht und daß aus jeweils zwei der ausgewählten Sätze durch Austausch einzelnerIt is also advantageous if, when selecting the influencing variables, a predetermined number of sentences is selected randomly, that from these the sentences are selected for which the value of the forecast accuracy reaches a minimum and that from two of the selected sentences by exchanging individual ones
Einflußgrößen neue Sätze gewonnen und diese in zufälliger Weise wieder verändert werden.Influencing factors won new sentences and changed them again in a random way.
Günstig ist es auch, wenn Training und Überprüfung des neuronalen Netzes für mehrere unterschiedlichen Sätze von Einflußgrößen gleichzeitig erfolgen. Die genannten Vorgänge nehmen sehr viel Rechenzeit in Anspruch. Sie werden daher parallel ausgeführt, d.h. auf mehrerem Computern wird jeweils ein neuronales Netz eingerichtet, die ausgewählten Sätze werden zum Testen auf diese neuronalen Netze aufgeteilt und die Ergebnisse zur weiteren Auswertung zusammengeführt.It is also expedient if the neural network is trained and checked for several different sets of influencing variables simultaneously. The processes mentioned take up a lot of computing time. They are therefore executed in parallel, i.e. A neural network is set up on several computers, the selected sentences are distributed to these neural networks for testing, and the results are combined for further evaluation.
Vorteilhaft ist es weiterhin, wenn zur Durchführung der Verfahren eine Vorrichtung vorgesehen ist, bei der mehrere Computer vorgesehen sind, welche unter Verwendung sowohl des TCP- als auch des DCOM-Protokolls in der Weise zusammenarbeiten, daß einer der Computer als TCP-Server und DCOM Client und die weiteren Computer als DCOM-Server und TCP-Client entsprechend den diesbezüglichen Standards arbeiten.It is also advantageous if a device is provided for carrying out the method, in which a plurality of computers are provided which work together using both the TCP and the DCOM protocol in such a way that one of the computers acts as a TCP server and DCOM Client and the other computers work as DCOM servers and TCP clients in accordance with the relevant standards.
Die Erfindung wird anhand eines Ausführungsbeispieles näher erläutertThe invention is explained in more detail using an exemplary embodiment
Bei dem Ausführungsbeispiel ist der Verlauf einer Datenreihe für die Zukunft zu prognostizieren. Bekannt ist der Verlauf der Datenreihe in der Vergangenheit und die damit korrespondierenden Werte von vermuteten Einflußgrößen. Diese Daten sind in einerIn the exemplary embodiment, the course of a data series is to be predicted for the future. The history of the data series in the past and the corresponding values of presumed influencing variables are known. This data is in one
Datenbasis l ≤ t ≤ T enthalten. N liegt beim Ausführungsbeispiel im BereichDatabase l ≤ t ≤ T included. In the exemplary embodiment, N is in the range
Figure imgf000005_0001
von einigen 1000, T im Bereich von wenigen 100.
Figure imgf000005_0001
of a few 1000, T in the range of a few 100.
Zur Erfassung all dieser Daten mittels neuronalem Netz nach dem Multi-Layer-To collect all this data using a neural network according to the multi-layer
Perceptron-Prinzip müßte dieses N Input Neuronen und 1 Output Neuron aufweisen. Die Anzahl h e N . der „versteckten" Neuronen der Zwischenschichten ist dabei frei wählbar. Daraus ergibt sich die Zahl G der freien Parameter (Gewichte) gemäß G = (K + 1) • h . K ist die Zahl der Input Neuronen, in diesem Fall gleich N. Da das neuronale Netz über die Zeitachse trainiert wird, ist die maximale Anzahl der verfügbaren Trainingsbeispiele T und im Ausführungsbeispiel um eine Größenordnung kleiner als G. Dieses Netz ist überbestimmt und damit nicht realisierbar. Ziel ist es nun, die Zahl der freien Parameter G kleiner als die Zahl der Trainingsbeispiele 7 zu halten, nach Möglichkeit um eine ganze Größenordnung: (K + ϊ) - h < T .Perceptron principle should have this N input neurons and 1 output neuron. The number h e N. the "hidden" neurons of the intermediate layers can be freely selected. This gives the number G of free parameters (weights) according to G = (K + 1) • h. K is the number of input neurons, in this case equal to N. Da the neural network is trained over the time axis, the maximum number of available training examples T and in the exemplary embodiment is an order of magnitude smaller than G. This network is overdetermined and therefore not realizable. The aim now is to make the number of free parameters G smaller than that To keep the number of training examples 7, if possible by an entire order of magnitude: (K + ϊ) - h <T.
Bei einer sinnvollen Anzahl von versteckten Neuronen h « 10 ergibt sich eine Maximaizahl von ebenfalls etwa 10 Inputneuronen. Es ist also eine Menge von K Einflußgrößen xn (t)...xflι_ (t) , l ≤ n] ...nκ ≤ N auszuwählen, auf deren Basis das neuronale Netz eine optimale Prognose ermittelt.With a reasonable number of hidden neurons h «10, the maximum number is also about 10 input neurons. A set of K influencing variables x n (t) ... x flι _ (t), l ≤ n ] ... n κ ≤ N is to be selected on the basis of which the neural network determines an optimal prognosis.
Erfindungsgemäß erfolgt diese Auswahl in einem iterativen Prozeß mittels genetischem Algorithmus. Dabei handelt es sich um einen Suchalgorithmus, der die biologischen Prozesse von Mutation, Rekombination und Selektion nachahmt. Die Berechnung dieser Vorgänge ist relativ aufwendig, führt aber zu sehr guten Ergebnissen.According to the invention, this selection is made in an iterative process using a genetic algorithm. It is a search algorithm that mimics the biological processes of mutation, recombination and selection. The calculation of these processes is relatively complex, but leads to very good results.
Genetischer Algorithmus und neuronales Netz wirken dabei in der Weise zusammen, daß mittels genetischem Algorithmus eine begrenzte Zahl von Einflußgrößen ausgewählt und das neuronale Netz mit diesen Einflußgrößen und den damit korrespondierenden Werten der zu prognostizierenden Datenreihe trainiert und getestet wird. Die Ergebnisse werden als sogenannte Fitness dem genetischen Algorithmus wieder zugeführt und zur Ermittlung weiterer Sätze von Einflußgrößen herangezogen. Der Satz von Einflußgrößen mit der besten Fitness wird dann zur Prognose des künftigen Verlaufes der Datenreihe herangezogen.The genetic algorithm and the neural network work together in such a way that a limited number of influencing variables are selected by means of the genetic algorithm and the neural network is trained and tested with these influencing variables and the corresponding values of the data series to be predicted. The results are called the genetic fitness Algorithm fed back and used to determine further sets of influencing variables. The set of influencing variables with the best fitness is then used to forecast the future course of the data series.
Zur Durchführung des Verfahrens wird ein Filter definiert, dessen Übertragungsfunktion den Auswahlvorgang beschreibt. Nach dem Ausführungsbeispiel umfaßt das Filter die Datenbasis und einen Vektor mit K Elementen (n ,...,nκ ) aus denen der Inputvektor für das Neuronale Netz errechnet wird. Die „Übertragungsfunktion" dieses Filters ist daherTo carry out the method, a filter is defined, the transfer function of which describes the selection process. According to the exemplary embodiment, the filter comprises the database and a vector with K elements (n, ..., n κ ) from which the input vector for the neural network is calculated. The "transfer function" of this filter is therefore
Figure imgf000006_0001
Figure imgf000006_0001
Danach wird die Prognosegenauigkeit des neuronalen Netzes für diese Eingangsdaten bestimmt und als Fitness festgelegt. . Die Einschätzung der „Fitness" , d.h. der Qualität einer Lösung ist wesentlich für die Treffsicherheit eines genetischen Algorithmus. Die erfindungsgemäße Beurteilung der Fitness erfordert vergleichsweise geringen Berechnungsaufwand und führt zu guten Ergebnissen.Then the accuracy of the prognosis of the neural network for this input data is determined and defined as fitness. . The assessment of the "fitness", i.e. the quality of a solution, is essential for the accuracy of a genetic algorithm. The assessment of the fitness according to the invention requires comparatively little calculation effort and leads to good results.
Dabei ist nicht nur die Genauigkeit der Prognose während der Trainingsphase von Interesse, sondern das Ergebnis an einem Fall, den das Netz noch nicht „gesehen" hat. Zu diesem Zweck wird die Datenmenge der ausgewählten Einflußgrößen und der zugehörigen Ergebnisse in 2 Teilmengen zerlegt; eine Trainingsmenge, welche etwa 80% der Daten umfaßt und eine Validierungsmenge. Das Netz wird nun mit der Trainingsmenge trainiert und danach wird der mittlere Prognosefehler eτ,evfür beide Teilmengen getrennt ermittelt.It is not only the accuracy of the prognosis that is of interest during the training phase, but also the result of a case that the network has not "seen" yet Training set, which comprises about 80% of the data and a validation set. The network is now trained with the training set and then the mean forecast error e τ , e v is determined separately for both subsets.
Die Prognosegenauigkeit des neuronalen Netzes, ergibt sich daraus gemäß g = max(eτ,ev) .The accuracy of the prediction of the neural network results from this according to g = max (e τ , e v ).
Zur Ermittlung jener Filterparameter (Einflußgrößen) für welche die Fitness ein Minimum aufweist, also mm(g(ni ,...,nκ )) mit l ≤ n, ...nκ ≤ N , das ergibt N mögliche Lösungen wird in einem ersten Schritt eine Menge von P zufällig gewählten Sätzen von Einflußgrößen ausgewählt, und dazu die jeweilige Fitness des neuronalen NetzesTo determine those filter parameters (influencing variables) for which fitness has a minimum, i.e. mm (g (n i , ..., n κ )) with l ≤ n, ... n κ ≤ N, this results in N possible solutions in a first step a set of P randomly selected sets of Influencing factors selected, and the respective fitness of the neural network
ermittelt:
Figure imgf000007_0001
determined:
Figure imgf000007_0001
Danach werden aus der Menge von P gewählten Sätzen von Einflußgrößen jene ausgewählt, welche den geringsten Betrag der Fitness ergeben. Mit diesen ausgewählten Sätzen werden durch Rekombination neue Sätze ermittelt: jeweils zwei Sätze werden durch Austausch der Parameter kombiniert, z.B.: aus(n, , ,..., n ) und #ι-p...,/ι2jewird (n2l,n22,nu,nu,...,nικ_ ,n).Then from the set of P selected sets of influencing variables, those are selected which give the smallest amount of fitness. With these selected sentences, new sentences are determined by recombination: two sentences are combined by exchanging the parameters, e.g.: from (n ,,, ..., n ) and # ι- p ..., / ι 2je becomes ( n 2l , n 22 , n u , n u , ..., n ικ _, n ).
In einem weiteren Schritt werden die neu entstandenen Sätzen von Einflußgrößen durch Mutation in zufälliger Weise verändert. Danach werden wiederum die Fitnesswerte des neuronalen Netzes für diese Sätze berechnet.In a further step, the newly created sets of influencing variables are changed in a random manner by mutation. Then the fitness values of the neural network are again calculated for these sets.
Dieser Prozeß wird über mehrere Iterationen fortgeführt, bis eine optimale Prognose erreicht ist.This process continues over several iterations until an optimal forecast is reached.
Die Ermittlung eines Fitnesswertes g(...) beansprucht verhältnismäßig hohe Rechenleitung bzw. Rechenzeit, vor allem deswegen, weil der Trainingsvorgang des neuronalen Netzes hohen Aufwand erfordert. Deshalb werden erfindungsgemäß mehrere Sätze von Einflußgrößen parallel auf verschiedenen Rechnern bearbeitet.The determination of a fitness value g (...) requires relatively high computing power or computing time, mainly because the training process of the neural network requires a lot of effort. Therefore, according to the invention, several sets of influencing variables are processed in parallel on different computers.
Dazu werden die zu bearbeitenden Datensätze in einer Warteschlange (Queue) gereiht, und von da aus zur Berechnungen auf die einzelnen Computer verteilt. Diese Queue wird auf jenem Rechner ausgeführt, auf dem auch der genetische Algorithmus berechnet wird. Dieser Rechner wird als TCP-Server eingerichtet, entsprechend dem „Transmission Control Protocol / Internet Protocol (TCP/IP). „ einem de-facto-For this purpose, the data records to be processed are queued and from there distributed to the individual computers for calculations. This queue is executed on the computer on which the genetic algorithm is also calculated. This computer is set up as a TCP server, in accordance with the “Transmission Control Protocol / Internet Protocol (TCP / IP). "A de facto
Industriestandard der weltweit immer mehr an Bedeutung gewinnt und aus der End-zu- End-Kommunikation in heterogenen Netzumgebungen nicht mehr wegzudenken ist.Industry standard that is becoming increasingly important worldwide and is an integral part of end-to-end communication in heterogeneous network environments.
TCP/IP (Transmission Control Protocol/Internet Protocol) ist zuständig für denTransport der Datenpaketen innerhalb des Internets. IP ist dabei die Vereinbarung, wie die einzelnen Datenpakete formuliert und versendet werden. Anschließend übernimmt das TCP dann den Verbindungsaufbau und die sichere Zustellung des . g . / Datenpakets. Die Benennung von TCP/IP gründet auf den zwei am meisten benutzten Protokollen, jedoch handelt es sich im Grunde um Dutzende verschiedener Protokolle. (Protokollsammlung). Viele davon arbeiten für den Benutzer unsichtbar, greifen aber die enormen Probleme des Netzzugriffs und der Zusammenarbeit verschiedener Netze und Routingmethoden auf, die in einem derart vielgestaltigen und heterogenen Netz wie dem Internet auftreten.TCP / IP (Transmission Control Protocol / Internet Protocol) is responsible for the transport of data packets within the Internet. IP is the agreement on how the individual data packets are formulated and sent. The TCP then takes over the connection establishment and the secure delivery of the , g. / Data packet. The name of TCP / IP is based on the two most used protocols, but they are basically dozens of different protocols. (Log collection). Many of these work invisibly to the user, but address the enormous problems of network access and the cooperation of various networks and routing methods that occur in such a diverse and heterogeneous network as the Internet.
Die TCP/IP-Protokolle können grob in vier Betriebsebenen gegliedert werden: Netzzugriff, Netzwerk, Transport, Anwendung.The TCP / IP protocols can be roughly divided into four operating levels: network access, network, transport, application.
Die weiteren Computer werden als TCP-Client eingerichtet. Herkömmliche TCP- Server können allerdings nicht aktiv eine Verbindungen aufbauen, sondern nur passiv auf Anfragen reagieren. Daher wird der TCP-Server unter Anwendung eines anderen Protokolls (DCOM) als Client ausgeführt wodurch eine TCP-Server/DCOM-Client TCP-Client/DCOM-Server Architektur des Rechnersystemes.The other computers are set up as TCP clients. However, conventional TCP servers cannot actively establish a connection, but can only react passively to requests. Therefore, the TCP server is executed using a different protocol (DCOM) as a client, whereby a TCP server / DCOM client TCP client / DCOM server architecture of the computer system.
Der Aufbau einer Verbindung geht hierbei folgendermaßen vor sich:A connection is set up as follows:
- TCP-Server und DCOM-Client werden instantiiert (Rechner 1),- TCP server and DCOM client are instantiated (computer 1),
- DCOM-Client (Rechner 1) startet DCOM-Server auf einem anderen Rechner (Rechner 2), - DCOM-Server (Rechner 2) startet TCP-Client (Rechner 2) und- DCOM client (computer 1) starts DCOM server on another computer (computer 2), - DCOM server (computer 2) starts TCP client (computer 2) and
- TCP-Client (Rechner 2) verbindet sich mit dem TCP-Server (Rechner 1 ). Danach kann der Datenaustausch beginnen.- TCP client (computer 2) connects to the TCP server (computer 1). The data exchange can then begin.
Sind alle Parameterkombinationen ausgewertet, werden die Ergebnisse an den GA zurückgegeben, der dann mit der nächsten Iteration fortsetzen kann.. Once all parameter combinations have been evaluated, the results are returned to the GA, who can then continue with the next iteration.

Claims

Patentansprücheclaims
1) Verfahren zur Prognose des Verlaufes einer Datenreihe, wobei diese Prognose mittels neuronalem Netz aus dem Verlauf vermuteter Einflußgrößen ermittelt wird, mit folgenden Verfahrensschritten: mittels Datenfilter wird aus der in einer Datenbasis erfaßten Gesamtheit der vemuteten Einflußgrößen ein Satz mit einer begrenzten Zahl von Einflußgrößen ausgewählt; mit den ausgewählten Einflußgrößen und einem Teil des bekannten Verlaufes der1) Method for forecasting the course of a data series, this forecast being determined by means of a neural network from the course of suspected influencing variables, with the following procedural steps: using a data filter, a set with a limited number of influencing variables is selected from the totality of suspected influencing variables recorded in a database ; with the selected influencing factors and part of the known course of the
Datenreihe wird das neuronale Netz trainiert; die Prognosegenauigkeit des trainierten Netzes wird an dem restlichen Teil des bekannten Verlaufes der Datenreihe überprüft und mit einer Wertzahl belegt; unter Zuhilfenahme eines genetischen Algorithmus wird in einem iterativen Prozeß ein Satz von Einflußgrößen ermittelt, für den die Wertzahl ein Minimum erreicht der Satz von Einflußgrößen mit der minimalen Wertzahl wird zur Prognose des weiteren Verlaufes der Datenreihe herangezogen.The neural network is trained; the accuracy of the forecast of the trained network is checked on the remaining part of the known course of the data series and assigned a value number; With the aid of a genetic algorithm, a set of influencing variables for which the value number reaches a minimum is determined in an iterative process. The set of influencing variables with the minimum value number is used to predict the further course of the data series.
2) Verfahren nach Anspruchl , dadurch gekennzeichnet, daß zur Bestimmung der Wertzahl der mittlere Prognosefehler des neuronalen Netzes sowohl zu den Trainingsdaten wie auch zu den Überprüfungsdaten ermittelt und der größere Wert der beiden als Wertzahl festgelegt wird.2) Method according to claim 1, characterized in that for determining the value number, the mean forecast error of the neural network is determined both for the training data and for the check data, and the larger value of the two is defined as the value number.
3) Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, daß bei der Auswahl der Einflußgrößen eine vorgegebene Anzahl von Sätzen zufällig ausgewählt wird, daß aus diesen die Sätze ausgewählt werden, für welche die Wertzahl der Prognosegenauigkeit ein Minimum erreicht und daß aus jeweils zwei der ausgewählten Sätze durch Austausch einzelner Einflußgrößen neue Sätze gewonnen und diese in zufälliger Weise wieder verändert werden.3) Method according to one of claims 1 or 2, characterized in that in the selection of the influencing variables, a predetermined number of sentences is selected randomly, that from these the sentences are selected for which the value of the forecast accuracy reaches a minimum and that from each two of the selected sentences are obtained by exchanging individual influencing variables and these are changed again in a random manner.
4) Verfahren nach einem der Ansprüche 1 bis 3 dadurch gekennzeichnet, daß Training und Überprüfung des neuronalen Netzes für mehrere unterschiedlichen4) Method according to one of claims 1 to 3, characterized in that training and checking the neural network for several different
Sätze von Einflußgrößen gleichzeitig erfolgen.Sets of influencing variables occur simultaneously.
5) Vorrichtung zur Durchführung der Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß mehrere Computer vorgesehen sind, welche unter Verwendung sowohl des TCP- als auch des DCOM-Protokolls in der Weise zusammenarbeiten, daß einer der Computer als TCP-Server und DCOM Client und die weiteren Computer als DCOM-Server und TCP-Client entsprechend den diesbezüglichen Standards arbeiten. 5) Device for performing the method according to one of claims 1 to 4, characterized in that several computers are provided which work together using both the TCP and the DCOM protocol in such a way that one of the computers as a TCP server and DCOM Client and the other computers work as DCOM servers and TCP clients in accordance with the relevant standards.
PCT/EP2000/002784 1999-04-16 2000-03-30 Method for prognosing the course of a data sequence and device for carrying out said method WO2000063789A2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU42916/00A AU4291600A (en) 1999-04-16 2000-03-30 Method for prognosing the course of a data sequence and device for carrying out said method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT68499 1999-04-16
ATA684/99 1999-04-16

Publications (2)

Publication Number Publication Date
WO2000063789A2 true WO2000063789A2 (en) 2000-10-26
WO2000063789A3 WO2000063789A3 (en) 2001-03-22

Family

ID=3497097

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2000/002784 WO2000063789A2 (en) 1999-04-16 2000-03-30 Method for prognosing the course of a data sequence and device for carrying out said method

Country Status (2)

Country Link
AU (1) AU4291600A (en)
WO (1) WO2000063789A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10242407B1 (en) 2013-09-24 2019-03-26 Innovative Market Analysis, LLC Financial instrument analysis and forecast

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0528399A2 (en) * 1991-08-19 1993-02-24 Toyoda Koki Kabushiki Kaisha Method and apparatus for learning of neural network
WO1996024033A1 (en) * 1995-01-31 1996-08-08 Matsushita Electric Industrial Co., Ltd. Proportion predicting system and method of making mixture
US5727128A (en) * 1996-05-08 1998-03-10 Fisher-Rosemount Systems, Inc. System and method for automatically determining a set of variables for use in creating a process model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0528399A2 (en) * 1991-08-19 1993-02-24 Toyoda Koki Kabushiki Kaisha Method and apparatus for learning of neural network
WO1996024033A1 (en) * 1995-01-31 1996-08-08 Matsushita Electric Industrial Co., Ltd. Proportion predicting system and method of making mixture
US5727128A (en) * 1996-05-08 1998-03-10 Fisher-Rosemount Systems, Inc. System and method for automatically determining a set of variables for use in creating a process model

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FURUHASHI T ET AL: "Evolutionary fuzzy modeling using fuzzy neural networks and genetic algorithm" PROCEEDINGS OF IEEE INTERNATIONAL CONFERENCE ON EVOLUTIONARY COMPUTATION, 13. April 1997 (1997-04-13), XP002115857 *
HINES J W ET AL: "Signal validation using an adaptive neural fuzzy inference system" NUCLEAR TECHNOLOGY,US,AMERICAN NUCLEAR SOCIETY, LA GRANGE PARK, IL, Bd. 119, Nr. 2, August 1997 (1997-08), Seiten 181-193, XP002115856 ISSN: 0029-5450 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10242407B1 (en) 2013-09-24 2019-03-26 Innovative Market Analysis, LLC Financial instrument analysis and forecast

Also Published As

Publication number Publication date
AU4291600A (en) 2000-11-02
WO2000063789A3 (en) 2001-03-22

Similar Documents

Publication Publication Date Title
DE60301202T2 (en) METHOD AND DEVICE FOR TRANSPORTING A WEB FARM
DE3236832A1 (en) METHOD AND DEVICE FOR VOICE ANALYSIS
DE112016005266T5 (en) Fast pattern detection for log analysis
DE2949582A1 (en) METHOD AND ARRANGEMENT FOR DETERMINING TONE HEIGHT IN HUMAN LANGUAGE
DE60124122T2 (en) COMMUNICATION NETWORK DESIGN
DE1915819A1 (en) Method and arrangement for adaptive character recognition
DE10220521A1 (en) Method and system for processing voice data and classifying conversations
EP1470459B1 (en) Early prognosis of the reliability of a technical arrangement
WO2000063789A2 (en) Method for prognosing the course of a data sequence and device for carrying out said method
EP1953654A1 (en) Method for determining at least two similar websites
EP3812949A1 (en) Configurable digital twin
DE19703964C1 (en) Process for transforming a fuzzy logic used to simulate a technical process into a neural network
DE10220522A1 (en) Method and system for processing voice data using voice recognition and frequency analysis
WO2001065421A1 (en) Method and arrangement for modelling a system
DE60110619T2 (en) METHOD AND DEVICE FOR TRAFFIC PRIORITY WITH A NEURONAL NETWORK
EP0643353B1 (en) Data processing system and method
DE19811352C2 (en) System and method for searching on networked computers with information stocks using software agents
DE102020134185A1 (en) Process for routing service requests and real-time computer for implementing the process for routing service requests
DE19540859A1 (en) Removing unwanted speech components from mixed sound signal
EP3074935A1 (en) Platform device for providing quantitative collective knowledge
WO2021249941A1 (en) Method and apparatus for automatically investigating a behavior of a technical device
EP0591259B1 (en) Method of processing uncertainties in input data in neuronal networks
EP1137218A1 (en) Method and system for testing telecommunication devices
EP3507943A1 (en) Method for communication in a communication network
DE202022101927U1 (en) An author-strain-independent scoring system to measure scientific independence

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AU CA JP MX NO RU US

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
AK Designated states

Kind code of ref document: A3

Designated state(s): AU CA JP MX NO RU US

AL Designated countries for regional patents

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP