-
HINTERGRUND
-
Einige Techniken sind verwendet worden zum
Modellieren von mehrdimensionalen Daten durch Abbilden mehrdimensionaler
Eingangswerte auf mehrdimensionale Ausgangswerte. Solche Modelle
werden häufig
verwendet zum Erkennen versteckter vorhersagbarer Muster in einem
Datensatz. Die Art der Probleme, für die solche Modelle verwendet
werden können,
schließen
Gruppieren, Klassifizieren und Abschätzen von Daten in dem Datensatz ein.
Es gibt einige Arten von Modellen, die gewöhnlich verwendet werden wie
z. B. probabilistische neuronalen Netze, neuronale Netze verallgemeinerter Regression,
Gaus'sche radiale
Grundfunktionen, Entscheidungsbäume
(wie z. B. K-D Bäume,
neuronale Bäume
und Klassifizierungs- und Regressionsbäume), neuronale Netze, Kohonen-Netze
und assoziative Algorithmen.
-
Die meisten Modelliertechniken sind
prozedural aber nicht erläuternd.
Mit anderen Worten, ein Modell bildet Eingangswerte auf Ausgangswerte
ab. Diese Abbildung vermittelt nicht die tatsächliche Bedeutung oder Signifikanz.
bezüglich
der Tätigkeit
des Modells, d. h. seinem Verhalten. Es ist schwierig, vorauszusagen,
wie das Modell sich ansprechend auf neue Eingangsgrößen verhalten
wird oder welche Dimensionen der Eingangsgrößen am relevantesten sind für das Verhalten
des Modells.
-
Dieses Problem tritt auf, wenn die
Eingangsdaten eine große
Zahl von Dimensionen einschließen.
Um sicherzustellen, dass ein Modell auf relevanten Eingangsdimensionen
beruht, werden verschiedene Statistiktechniken verwendet zum Analysieren
eines Datensatzes, der zum Erstellen eines Modells verwendet wird,
jene Dimensionen zu identifizieren, die für das zu modellierende Problem
herausragend sind. Ein Modell wird erstellt unter Verwendung nur
der herausragenden Dimensionen für die
Eingangsgröße. Beispiele
statistischer Techniken zum Identifizieren dieser herausragenden
Dimensionen schließen
automatische CHI2-Interaktionserfassung
(CHAID), Korrelation, Prinzipkomponentenanalyse und Empfindlichkeitsanalyse
ein. Empfindlichkeitsanalyse ist beispielsweise in der internationalen Anmeldung,
die veröffentlicht
worden ist, unter PCT WO 94/25933, angemeldet am 10. November 1994, beschrieben.
WO 94/25933 beschreibt ein System und Verfahren zum verbessern des
Modells eines Systems (z. B. einer Industrieanlage) und demnach die
Optimierung seiner Steuerung. Es wird ein konventionelles neuronales
Dreischichtennetz verwendet.
-
Das System erfordert bereitzustelle
Eingabenvariablen, wobei jede Variable in ihrer eigenen Domäne definiert
ist. Das Modell (z. B. das neuronale Netz) produziert entsprechende
Ausgangswerte. Eine Empfindlichkeitsanalyse wird an dem Modell ausgeführt zum
Erzielen eines Empfindlichkeitsprofils auf der Eingangsvariablen,
wobei die Empfindlichkeitsmessungen partiell abgeleiteten Funktionen der
Ausgangswerte basieren in Bezug auf die Eingangswerte. Obwohl WO
94/25933 suggeriert, den Eingangsraum in mindestens zwei Unterräume zu unterteilen,
von denen einer Eingangsvariablen einschließt, die als "empfindlich" identifiziert sind
in dem Empfindlichkeitsprofil, wird die Empfindlichkeitsanalyse
nicht für
jeden der Subräume
wiederholt zum Erstellen eines Empfindlichkeitsprofils für jeden
der Subräume.
-
Solche Techniken zum Identifizieren
der herausragenden Dimensionen, die zum Erstellen eines Modells
verwendet werden, stellen noch keine Erläuterung des Verhaltens des
erstellten Modells bereit. Insbesondere können einige Dimensionen nur
herausragend sein in einem Subraum der Eingangsdaten und haben demnach
einen Einfluss auf das Verhältnis
des Modells nur in diesem Subraum. Um dem Verständnis des Verhaltens eines
Modells zu dienen, wird häufig
eine andere Art statistischer Technik verwendet, die Regel-Induktion
genannt wird. Regelinduktion wird beispielsweise in C4.5: Programme
für Maschinenlernen
(Programs for Machine Learning), von J. Ross Quinlan, Morgan Kauf
man Publishers, 1993 beschrieben. Ein Computerprogramm mit demselben
Namen ("C4.5") ist auch verfügbar von
dem Autor und Herausgeber. Dieses Programm verwendet Daten direkt
zum Herleiten von Regeln. Andere Regelinduktionstechniken verwenden
ein Modell zum Herleiten von Regeln. Diese Techniken stellen eine
Baumstruktur bereit, die das Verhalten eines Modells als eine Regelsammlung
erläutert.
Obwohl diese Regeln für
das Erläutern
des Modellverhaltens hilfreich sein können, sind diese Regeln häufig zu umfangreich
und zu komplex, um von einem Menschen so leicht interpretiert zu
werden, wie man es wünschen
würde.
Es ist auch schwierig, aus diesen Regeln eine Erklärung zu
extrahieren, welche der Eingangswerte wichtig sind in jedem Subraum
der Eingangsdaten, die den Baum definieren.
-
RESUMÉ
-
Die vorliegende Erfindung stellt
eine Beschreibung des Verhaltens eines Modells bereit, das die Empfindlichkeit
des Modells in jedem Subraum des Eingangsraums anzeigt, wie in den
beiliegenden Patentansprüchen
dargelegt. Beispielsweise kann die Beschreibung anzeigen, welche
Dimension oder Dimensionen von Eingangsdaten herausragend sind im
Subraum des Eingangsraums. Durch Implementierung dieser Beschreibung unter
Verwendung eines Entscheidungsbaums werden die Subräume und
ihre herausragenden Dimensionen sowohl beschrieben als auch hierarchisch
bestimmt.
-
Demgemäss ist ein Aspekt ein computerimplementierter
Prozess zum Erstellen einer Beschreibung des Verhaltens eines Modells,
die indikativ ist bezüglich
der Empfindlichkeit des Modells in Subräumen eines Eingangsraums des
Modells. Die Empfindlichkeitsanalyse wird durchgeführt an dem
Modell zum Bereitstellen eines Empfindlichkeitsprofils des Eingangsraums
des Modells in Übereinstimmung
mit der Empfindlichkeit von Ausgängen
des Modells zu Reaktionen im Dateneingang zu dem Modell. Der Eingangsraum
wird aufgeteilt in mindestens zwei Unterräume gemäß dem Empfindlichkeitsprofil.
Eine Empfindlichkeitsanalyse wird an dem Modell durchgeführt zum
Bereitstellen eines Empfindlichkeitsprofils jedes der Unterräume in Übereinstimmung
der Empfindlichkeit der Ausgänge
des Modells auf Variationen im Dateneingang zu dem Modell.
-
Ein anderer Aspekt ist ein Computersystem zum
Erstellen einer Beschreibung des Verhaltens eines Modells, das die
Empfindlichkeit des Modells in Subräumen eines Eingangsraums des
Modells anzeigt. Empfindlichkeitsanalyse wird an dem Modell durchgeführt zum
Bereitstellen eines Empfindichkeitsprofils des Eingangsraums des
Modells in Übereinstimmung
mit der Empfindlichkeit der Ausgänge des
Modells zu Variationen im Dateneingang zu dem Modell. Der Eingangsraum
ist aufgeteilt in mindestens zwei Subräume gemäß dem Empfindlichkeitsprofil.
Eine Empfindlichkeitsanalyse wird. an dem Modell durchgeführt zum
Bereitstellen eines Empfindlichkeitsprofils für jeden der Subräume gemäß der Empfindlichkeit
der Ausgänge
des Modells auf Variationen im Dateneingang zu dem Modell.
-
In einem anderen Aspekt schließt ein Computersystem
zum Erstellen einer Beschreibung des Verhaltens eines Modells, die
die Empfindlichkeit des Modells in Subräumen eines Eingangsraums des Modells
anzeigt ein Empfindlichkeitsanalysemodul und einen Datenaufteiler
ein. Das Empfindlichkeitsanalysemodul stellt eine Anzeige eines
Empfindlichkeitsprofils des Eingangsraums des Modells in Übereinstimmung
mit der Empfindlichkeit der Ausgänge des
Modells auf Variationen im Dateneingang zu dem Modell bereit. Der
Datenaufteiler hat einen ersten Eingang zum Empfangen eines Eingangsdatensatzes
und einen zweiten Eingang zum Empfangen der Anzeige des Empfindlichkeitsprofils,
die von dem Empfindlichkeitsanalysemodul ausgegeben worden ist,
und hat einen Ausgang zum Bereitstellen von mindestens zwei Subräumen des
Eingangsraums in Übereinstimmung
mit einer Segmentierung, die in Übereinstimmung
mit dem durch das Empfindlichkeitsanalysemodul angezeigten Empfindlichkeitsprofil
durchgeführt
worden ist.
-
In einer Ausführungsform ist das Empfindlichkeitsprofil
eine Rangordnung von Dimensionen des Eingangsraums. Der Eingangsraum
kann demnach aufgeteilt sein in Übereinstimmung
mit der Dimension, zu welcher die Ausgänge des Modells am empfindlichsten
sind.
-
KURZBESCHREIBUNG
DER ZEICHNUNG
-
In den Zeichnungen zeigt:
-
1 ein
Blockdiagramm einer Ausführungsform
eines Systems, welche einen Eingangsdatensatz in mindestens zwei
Subräume
aufteilt;
-
2 ein
Flussdiagramm der Verwendung des in 1 gezeigten
Systems;
-
3 ein
Blockdiagramm zum Darstellen, dass das in 1 gezeigte System kaskadiert werden kann
zum Generieren eines Entscheidungsbaums;
-
4 ein
detaillierteres Blockdiagramm einer Ausführungsform des Datenaufteilungsmoduls der 1; und
-
5 ein
Flussdiagramm zum detaillierteren Beschreiben des Betriebs der 4.
-
DETAILIERTE
BESCHREIBUNG
-
Die folgende detaillierte Beschreibung
sollte in Verbindung mit den beiliegenden Zeichnungen gelesen werden,
in welchen ähnliche
Bezugszeichen ähnliche
Strukturen kennzeichnen. Alle hierin zitierten Druckschriften sind
hierdurch ausdrücklich
durch Bezugnahme aufgenommen.
-
1 ist
ein Blockdiagramm zum Zeigen des Datenflusses einer Ausführungsform
eines Systems zum Generieren einer Beschreibung des Verhaltens eines
Modells, das die Empfindlichkeit des Modells in Subräumen des
Eingangsraums anzeigt, welches die Beschreibung unter Verwendung
eines Entscheidungsbaums implementiert. Andere Bäume, Graphiken, Regeln oder ähnliche
Darstellungen können auch
verwendet werden. Ein Modell 11 wird üblicherweise durch Auswählen einer
Art von für
eine Art von Problem geeignetem Modell erstellt. Bei einer gegebenen
Art eines Problems und einer gegebenen Art eines Modells sind Eingangsfelder,
die die Lösung
zu dem definierten Problem beeinträchtigen, identifiziert und
standardisiert. Irgendwelche Zielausgangsfelder werden auch identifiziert
und standardisiert. Ein Trainingsdatensatz, der zu verwenden ist
zum Generieren oder Trainieren des Modells wird dann vorbereitet.
Der Trainingsdatensatz ist üblicherweise
ein Sub-Satz einer Datenbank oder eines anderen großen Datensatzes.
Jeder Datenwert in einem Datensatz ist üblicherweise definiert durch
einen Vektor von einer oder mehreren Dimensionen entsprechend den
ausgewählten
Eingangsfeldern und von einer oder mehrerer Ausgangsdimensionen
entsprechend den ausgewählten
Ausgangsfeldern. Der Trainingsdatensatz wird allgemein unter Verwendung
geschichteter Abtastung eines großen Datensatzes erstellt. Beispielsweise
kann eine große
Kundendatenbank, die über
einige Millionen Aufzeichnungen enthält, abgetastet werden zum Erstellen
eines Trainingssatzes von näherungsweise
einige Tausend Einträgen,
die allgemein die Gesamtkundendatenbank repräsentieren. Der Trainingsdatensatz
wird dann auf das Modell unter Verwendung einer Trainingsprozedur
angewendet und ein Modell 11 wird erstellt.
-
Nachdem das Modell 11 erstellt
worden ist, kann eine Beschreibung des Verhaltens des Modells generiert
werden. Ein Eingangsdatensatz 10 wird zu diesem Zweck ausgewählt. Der
Eingangsdatensatz 10 kann der Trainingssatz sein, kann
ein Sub-Satz des Trainingsatz sein, kann eine andere geschichtete Abtastung
der Datenbank oder eines großen
Datensatzes sein oder kann ein Satz von Werten sein, die bei zufälliger Benutzung
des Modells generiert worden sind und die Minimum- und Maximumwerte
von jeder Eingangsdimension von dem Trainingssatz.
-
Der Eingangsdatensatz wird angegeben
in ein Empfindlichkeitsanalysemodul 12, das Empfindlichkeitsmessungen 14 bestimmt
in Übereinstimmung
mit typischen Techniken. Solche Techniken sind beispielsweise beschrieben
in "DateMining Techniques" von Michael Berry
und Gordon Linoff, Johl Wiley and Sons, June 1997.
-
In einer Ausführungsform wendet das Empfindlichkeitsanalysemodul
Eingangstestdaten 15 auf das Modell 11 an und
empfängt
Ausgangsdaten 17 von dem Modell.
-
Die Eingangstestdaten werden aus
den Daten des Eingangsdatensatzes 10 erstellt. Insbesondere
wird für
jeden Datenwert im Eingangsdatensatz ein Eingangstestdatenwert erstellt
durch Variieren des Wertes des Datenwertes für jede Dimension. Die Variation
für jede
Dimension wird definiert durch einen Wert, der beispielsweise "h" genannt wird, welcher zu dem Wert der
Dimension für
jeden Datenwert hinzuaddiert wird und von ihm subtrahiert wird.
Diese variierten Eingangsdaten werden auf das Modell angewendet
zum Erhalten der Ausgangsdaten 17, aus welchen eine partielle
Ableitung berechnet werden kann im Eingangsraum bei jedem Datenwert
für jede Dimension
des Datenwertes. Diese Berechnung wird allgemein eine Baumpunktableitung
genannt. Die Berechnung der partiellen Ableitungen, die verwendet
wird zum Bestimmen der Empfindlichkeitsmessungen kann einmal für den Eingangsdatensatz
ausgeführt
werden. Die Verarbeitung nachfolgender Unterräume erfordert keine Neuberechnung
dieser partiellen Ableitungen. Jedoch werden die Empfindlichkeitsmessungen
für jeden
Subraum neu berechnet unter Verwendung der partiellen Ableitungen
nur von den Daten im Subraum.
-
Der Wert "h" ist
problemabhängig
und kann demnach benutzerdefiniert werden. Ein typischer Wert ist ½% bis
5% des Bereichs im Eingangsdatensatz des Wertes für diese
Dimension. Wenn die Werte im Eingangsdatensatz genormt sind, beispielsweise
unter Verwendung eines z-Wertes, dann liegt ein geeigneter Wert
von "h" üblicherweise im Bereich von
0,005 bis 0,05.
-
Die Quadrate der partiellen Ableitungen
für jede
Dimension werden über
den Eingangsdatensatz gesammelt zum Erhalten der Empfindlichkeitsmaße 14.
Beispielsweise kann die Summe über
den Eingangsdatensatz der quadrierten partiellen Ableitungen für jede Dimension
berechnet werden. Diese Empfindlichkeitsmessungen stellen ein Empfindlichkeitsprofil
des Eingangsraums des Modells bereit. Von diesem Empfindlichkeitsprofil
können
eine oder mehrere Dimensionen des Eingangsdatensatz identifiziert
werden, zu welchen der Ausgang bezüglich Variation am empfindlichsten
ist.
-
Beispielsweise können die Empfindlichkeitsmaße der Dimensionen
in einer Rangordnung angeordnet werden und die Dimension mit der
höchsten Empfindlichkeit
kann ausgewählt
werden.
-
Das Berechnen der partiellen Ableitungen, das
beim Bestimmen der Empfindlichkeitsmaße verwendet wird, kann parallelisiert
werden. Eine Kopie des analysierten Modells und ein Empfindlichkeitsanalysemodul
können
vorgesehen sein für
jeden der Vielzahl von Prozessoren. Der Eingangsdatensatz kann partitioniert
sein und jede Partition der Daten kann einem separaten Prozessor
zur Verfügung
gestellt werden. Das Berechnen partiellen Ableitungen für jeden
Datenwert kann parallel durchgeführt
werden an jeder Partition durch jeden Prozessor.
-
In 1 empfängt ein
Datenaufteilmodul 16 den Eingangsdatensatz 10 und
die Empfindlichkeitsmaße 14 und
teilt den Eingangsdatensatz in Unterräume 18 und 19 auf
entsprechend dem durch die Empfindlichkeitsmaße 14 definierten
Empfindlichkeitsprofil. Die Aufteilung kann von der Dimension sein,
die am herausragendsten ist, oder kann entlang einer Achse in zwei-
oder mehr Dimensionen sein, die am herausragendsten sind. Die Aufteilung
wird derart durchgeführt,
dass ein Subraum die Eingangsdaten enthält, für welche der Wert der ausgewählten Dimension
kleiner ist als (oder gleich) ein ausgewählter Schwellwert; der andere
Subraum enthält
die Eingangsdaten, für
welche der Wert in der ausgewählten Dimension
größer ist
als (oder gleich) der Schwellwert. Jede Seite der Aufteilung kann
programmiert werden, um Daten mit einem Wert gleich dem Schwellwert
zu empfangen.
-
Der Schwellwert kann auf viele Arten
ausgewählt
werden. Beispiel-Schwellwerte enthalten die Durchschnitts-, Medial- oder häufigsten
werte in den Eingangsdaten für
die ausgewählte
Dimension, oder eine Funktion der Empfindlichkeitsmaße oder
eine Funktion der Werte, die verwendet werden zum Berechnen der
Empfindlichkeitsmaße.
In einer Ausführungsform
wird der Schwellwert berechnet durch Bringen des Eingangsdatensatzes
in eine Reihenfolge in Übereinstimmung
mit den Werten der ausgewählten
Dimension. Insbesondere wenn jeder Eingangsdatenwert x
i nummeriert
ist als x
1, x
2,
..., x
N ϵ [x
min,
x
max] UND wenn die Eingangsdaten x
i vom Minimum zum Maximum geordnet sind,
mit x
1 als Datenwert mit dem kleinsten Wert
einer ausgewählten
Dimension und x
N als dem Datum mit dem größten Wert der
ausgewählten
Dimension, dann ist ein Wert der ausgewählten Dimension des Datenwertes
x
m der am nächsten zur Mitte des Satzes
{x
i, ..., x
N} in
Bezug auf die Empfindlichkeitsmaße liegt, ein geeigneter Schwellwert.
Das heißt,
der Schwellwert ist der Wert der ausgewählten Dimension des Datenwertes
x
m derart, dass
so nahe wie möglich bei
liegt.
-
Jeder der Subräume, die durch Aufteilen der Eingangsdaten
in dieser Weise erhalten werden, kann ferner aufgeteilt werden auf
dieselbe Weise bis eine vorbestimmte Anzahl von Subräumen oder
eine vorbestimmte Größe eines
Subraums erreicht worden sind. Durch rekursives Aufteilen jedes
Subraums kann jede Aufteilung, die durch ein Datenaufteilmodul 16 definiert
wird, durch einen Entscheidungsbaum repräsentiert werden. Jeder Knoten
des Entscheidungsbaums speichert einen Indikator der Dimension,
welche am Herausragendsten ist für
die Eingangsdaten und den Schwellwert, der durch den Knoten verwendet
worden ist zum Aufteilen der Eingangsdaten in Subräume. Der
Entscheidungsbaum definiert demnach hierarchisch für jeden
Subraum des Eingangsraums die Dimension und den Schwellwert, der
zum Erstellen des Subraums verwendet wird und die Dimension, die
in diesem Subraum am herausragendsten ist.
-
Ein Flussdiagramm, das den Betrieb
der in 1 gezeigten Ausführungsform
beschreibt, wird nun in Verbindung mit 2 beschrieben. Insbesondere wird Empfindlichkeitsanalyse
durchgeführt
an dem Modell 11 unter Verwendung des Eingangsdatensatzes 10 im
Schritt 20. Der Eingangsdatensatz 10 wird aufgeteilt,
beispielsweise durch das Datenaufteilmodul 16, im Schritt 22 der
herausragendsten Dimension. Der Prozess der 2 wird rekursiv auf den Subräumen durchgeführt, d.
h. Subräume 18 und 19,
resultierend von dem Schritt 22, wie in Schritten 24 und 26 gezeigt.
Schritte 24 und 26 können seriell ausgeführt werden
oder können
parallel auf separaten Prozessoren ausgeführt werden. Wie oben erwähnt kann
die Berechnung der zum Bestimmen der Empfindlichkeitsmaße verwendeten
partiellen Ableitungen einmal für
den gesamten Eingangsdatensatz durchgeführt werden. Die Verarbeitung
von nachfolgenden Subräumen
erfordert keine Neuberechnung dieser partiellen Ableitungen. Jedoch
werden die Empfindlichkeitsmaße
für jeden
Subraum neu berechnet unter Verwendung der partiellen Ableitungen nur
für die
Daten in dem Subraum.
-
Das Aufteilen von Subräumen kann
auch durchgeführt
werden parallel und in einer pipelineweise wie in 3 gezeigt. Insbesondere können das
Empfindlichkeitsanalysemodul 12 und das Datenaufteilmodul 16 der 1 als Datenaufteiler 30, wie
er in 3 gezeigt ist,
betrachtet werden. Das Modell 11 ist in dieser Figur nicht
gezeigt, weil es als in einem Vorverarbeitungsschritt zum Generieren
der partiellen Ableitungen, von welchen die Empfindlichkeitsmaße berechnet
werden, verwendet angesehen werden kann. Ein Datenaufteiler 30 empfängt Eingangsdaten 31 und
generiert Ausgangssubräume 32 und 33.
Zusätzliche
Datenaufteiler 34 und 36 können vorgesehen sein zum Parallelarbeiten
an den Ausgangssubräumen 32 und 33 zum
Bereitstellen zusätzlicher
Subräume.
-
Ein detaillierteres Blockdiagramm
eines Datenaufteilmoduls 16 der 1 in einer Ausführungsform wird nun in Verbindung
mit 4 beschrieben. In 4 werden die Empfindlichkeitsmaße von einem
Dimensionsauswahlmodul 40 verwendet zum Identifizieren
einer Dimension 42, auf der der Eingangsdatensatz 10 aufgeteilt
werden wird. Ein Schwellwert 48 wird durch ein Schwellwertauswahlmodul 46 für die ausgewählte Dimension 42 ausgewählt. Diese
Auswahl kann unter Verwendung des Eingangsdatensatzes 10 durchgeführt werden,
beispielsweise durch Identifizieren der Durchschnitts-, Medial-
oder häufigsten
Werte oder eine andere Funktion der Werte in dieser Dimension im
Eingangsdatensatz. Der Schwellwert 48 wird in einen Komparator 49 eingegeben.
Jeder Eingangsdatenwert wird auch in den Komparator 49 eingegeben,
um mit dem Schwellwert verglichen zu werden. Das Ergebnis dieses
Vergleichs stellt ein Auswahlsignal 45 bereit, welches
an einen Steuereingang eines Multiplexers 47 angelegt wird.
Der Multiplexer 47 richtet den Eingangsdatenwert an einen
eines ersten Ausgangs oder eines zweiten Ausgangs abhängig von
dem Auswahlsignal 45. Die von dem Multiplexer 47 ausgegebenen
Daten fallen demnach in einen der beiden Subräume, wie durch den Komparator
spezifiziert.
-
Das Flussdiagramm der 5 beschreibt detaillierter
den Betrieb der Schaltung der 4.
Zuerst wird eine Dimension basierend auf den Empfindlichkeitsmaßen ausgewählt, wie
in einem Schritt 50 angezeigt. Ein Schwellwert der ausgewählten Dimension
wird in Schritt 52 aus dem Eingangsdatensatz bestimmt.
Für jeden
Eingangsdatenwert wird, wie in Schritt 54 angezeigt, der
Wert der ausgewählten
Dimension in Schritt 56 mit dem bestimmten Schwellwert
verglichen. In Übereinstimmung
mit dem Vergleich wird der Datenwert in einem angemessenen Subraum
platziert in Schritt 58. Die Schritte 56 und 58 werden
für jeden
Eingangsdatenwert wiederholt, wie in Schritten 54 und 59 angezeigt.
-
Die Beschreibung des Verhaltens des
Modells kann einem Benutzer beispielsweise von einer Computeranzeige
oder einem Ausdruck in einer Anzahl von Formaten präsentiert
werden. Durch Wiedergeben der Beschreibung unter Verwendung eines Entscheidungsbaums
kann jeder Knoten des Baums beschrieben werden unter Verwendung
einer Regel in einer Vorhersagerechnung erster Ordnung. Der Benutzer
kann den Baum durchlaufen und interaktiv jeden Knoten expandieren
oder kontrahieren zum Betrachten der Beschreibung für jeden
Knoten des Baumes.
-
Ein Universalrechnersystem kann zur
Implementierung des oben gezeigten Systems unter Verwendung eines
Computerprogramms verwendet werden. Ein solches Computersystem enthält üblicherweise
eine Haupteinheit, die sowohl mit einer Ausgabeeinrichtung verbunden
ist, welche Information für
einen Benutzer anzeigt als auch mit einer Eingabeeinrichtung, die
Eingangsgrößen von
einem Benutzer empfängt.
Die Haupteinheit schließt
allgemein einen Prozessor ein, damit ein Speichersystem über einen
Verbindungsmechanismus verbunden ist. Auch die Eingangseinrichtung
und die Ausgabeeinrichtung sind über
den Zwischenverbindungsmechanismus mit dem Prozessor und dem Speichersystem verbunden.
-
Es sollte verstanden werden, dass
eine oder mehre Ausgabeeinrichtungen mit dem Computersystem verbunden
sein können.
Beispielhafte Ausgabeeinrichtungen können eine Kathodenstrahlröhrenanzeige
(CRT), eine Flüssigkristallanzeige
(LCD), Drucker, Kommunikationseinrichtungen wie ein Modem und Audioausgangseinrichtungen
sein. Es sollte auch verstanden werden, dass eine oder mehrere Eingabeeinrichtungen
mit dem Computersystem verbunden sein können. Beispielhafte Eingabeeinrichtungen
schließen
eine Tastatur, ein Tastenfeld, einen Track-Ball, eine Maus, eine
Stift-Tablett-Kombination, eine Kommunikationseinrichtung und eine
Dateneingabeeinrichtung wie z. B. Sensoren ein. Es sollte verstanden
werden, dass die Erfindung nicht auf die speziellen Eingabe- oder
Ausgabeeinrichtungen beschränkt
ist, die in Kombination mit dem Computersystem verwendet werden
oder auf jene hier beschriebenen.
-
Das Computersystem kann ein Universalrechnersystem
sein, welches programmierbar ist unter der Verwendung einer Computerprogrammiersprache
wie z. B. "C++", JAVA oder einer
anderen Sprache wie z. B. einer Schreibsprache oder selbst Assembler-Sprache.
Das Computersystem kann auch aus einer speziell programmierten Spezialanwendungshardware
bestehen. In einem Universalcomputersystem ist der Prozessor üblicherweise
ein kommerziell verfügbarer
Prozessor von den Serie-x86 und Pentium Prozessoren, die von Intel
verfügbar
sind, und ähnliche
Einrichtungen, die von AMD und Cyrix verfügbar sind, der 680X0 Serienmikroprozessor,
der von Motorola verfügbar
ist, der PowerPC Mikroprozessor von IBM und die Alphaserienprozessoren
von Digital Equipment Corporation sind Beispiele. Viele andere Prozessoren
sind verfügbar. Solch
ein Mikroprozessor führt
ein Programm aus, das Betriebssystem genannt wird, von welchem Windows
NT, Linux, UNIX, System 7, DOS, VMS und OS8 Beispiele sind, welche
das Ausführen
anderer Computerprogramme steuern und Planung, Debugging, Eingabe/Ausgabe-Steuerung,
Buchung, Compilierung, Speicherzuordnung, Datenmanagement und Speichermanagement
und Kommunikationssteuerung und zugehörige Dienste bereitstellen.
Der Prozessor und das Betriebssystem definieren eine Computerplattform,
für welche
Anwendungsprogramme in Programmierhochsprachen beschrieben werden.
Eine Parallelverarbeitungsbetriebsumgebung kann auch verwendet werden
wie z. B. die "Orchestrate
parallel operating shell" von
Torrent Systems, Inc. aus Cambridge, Massachusetts.
-
Das Speichersystem enthält üblicherweise ein
computerlesbares und beschreibbares nicht flüchtiges Speichermedium, von
welchen eine Magnetscheibe, ein Flashspeicher und ein Band Beispiele
sind. Die Scheibe kann entfernbar sein, bekannt als eine Floppy
Disk, oder permanent, bekannt als Festplatte. Eine Scheibe kann
eine Anzahl von Spuren haben, in welchen Signale gespeichert sind, üblicherweise
in Binärform,
d. h. einer Form, die aus einer Folge von Einsen und Nullen interpretiert
wird. Solche Signale können
ein Anwendungsprogramm, das durch den Mikroprozessor auszuführen ist,
definieren oder eine Information, die auf der Platte gespeichert
ist, um verarbeitet zu werden durch das Anwendungsprogramm. Üblicherweise
veranlasst der Prozessor im Betrieb aus dem nicht flüchten Aufzeichnungsmedium
zu lesende Daten in ein Speicherelement in Form einer integrierten
Schaltung geschrieben zu werden, welches üblicherweise ein flüchtiger
Speicher wahlfreien Zugriffs ist, wie z. B. ein dynamischer Speicher
wahlfreien Zugriffs (DRAM) oder ein statischer Speicher (SRAM).
Das Speicherelement in Form einer integrierten Schaltung ermöglicht einen
schnelleren Zugriff auf die Information durch den Prozessor, als
es die Scheibe tut. Der Prozessor manipuliert im allgemein die Daten innerhalb
des Speichers in Form einer integrierten Schaltung und kopiert dann
die Daten zu der Platte, wenn die Verarbeitung abgeschlossen ist.
Eine Vielzahl von Mechanismen sind bekannt zum Organisieren von
Datenbewegung zwischen der Platte und dem Speicherelement in Form
einer integrierten Schaltung und die Erfindung ist nicht darauf
beschränkt.
Es sollte auch verstanden werden, dass die Erfindung nicht auf ein
spezielles Speichersystem beschränkt
ist.
-
Es sollte auch verstanden werden,
dass die Erfindung nicht auf eine spezielle Computerplattform, einen
speziellen Prozessor oder spezielle Programmierhochsprachen beschränkt ist.
Zudem kann das Computersystem ein Mehrcomputersystem sein oder kann
mehrere Computer einschließen,
die über
ein Computernetz verbunden sind. Es sollte verstanden werden, dass
jedes Modul separate Module eines Computerprogramms sein kann oder
separate Computerprogramme sein kann. Solche Module können betreibbar
sein auf separaten Computern oder Prozessoren und können parallel
oder seriell ausgeführt werden.
-
Nachdem nun einige Ausführungsformen
beschrieben worden sind, sollte Fachleuten ersichtlich sein, dass
das Vorangegangene bloß erläuternd ist und
nicht beschränkend
und nur als Beispiel präsentiert
worden ist.