DE69908360T2

DE69908360T2 - Rechnersystem und verfahren zur erklärung des verhaltens eines modelles das eingangsdaten auf ausgangdaten abbildet

Info

Publication number: DE69908360T2
Application number: DE69908360T
Authority: DE
Inventors: Anthony Passera
Original assignee: Torrent Systems Inc
Current assignee: International Business Machines Corp
Priority date: 1998-06-22
Filing date: 1999-06-22
Publication date: 2004-04-22
Anticipated expiration: 2019-06-23
Also published as: WO1999067602A1; DE69908360D1; EP1090275A1; ATE241828T1; AU4707099A; US6272449B1; WO1999067602A8; EP1090275B1

Description

HINTERGRUND
Einige Techniken sind verwendet worden zum Modellieren von mehrdimensionalen Daten durch Abbilden mehrdimensionaler Eingangswerte auf mehrdimensionale Ausgangswerte. Solche Modelle werden häufig verwendet zum Erkennen versteckter vorhersagbarer Muster in einem Datensatz. Die Art der Probleme, für die solche Modelle verwendet werden können, schließen Gruppieren, Klassifizieren und Abschätzen von Daten in dem Datensatz ein. Es gibt einige Arten von Modellen, die gewöhnlich verwendet werden wie z. B. probabilistische neuronalen Netze, neuronale Netze verallgemeinerter Regression, Gaus'sche radiale Grundfunktionen, Entscheidungsbäume (wie z. B. K-D Bäume, neuronale Bäume und Klassifizierungs- und Regressionsbäume), neuronale Netze, Kohonen-Netze und assoziative Algorithmen.
Die meisten Modelliertechniken sind prozedural aber nicht erläuternd. Mit anderen Worten, ein Modell bildet Eingangswerte auf Ausgangswerte ab. Diese Abbildung vermittelt nicht die tatsächliche Bedeutung oder Signifikanz. bezüglich der Tätigkeit des Modells, d. h. seinem Verhalten. Es ist schwierig, vorauszusagen, wie das Modell sich ansprechend auf neue Eingangsgrößen verhalten wird oder welche Dimensionen der Eingangsgrößen am relevantesten sind für das Verhalten des Modells.
Dieses Problem tritt auf, wenn die Eingangsdaten eine große Zahl von Dimensionen einschließen. Um sicherzustellen, dass ein Modell auf relevanten Eingangsdimensionen beruht, werden verschiedene Statistiktechniken verwendet zum Analysieren eines Datensatzes, der zum Erstellen eines Modells verwendet wird, jene Dimensionen zu identifizieren, die für das zu modellierende Problem herausragend sind. Ein Modell wird erstellt unter Verwendung nur der herausragenden Dimensionen für die Eingangsgröße. Beispiele statistischer Techniken zum Identifizieren dieser herausragenden Dimensionen schließen automatische CHI²-Interaktionserfassung (CHAID), Korrelation, Prinzipkomponentenanalyse und Empfindlichkeitsanalyse ein. Empfindlichkeitsanalyse ist beispielsweise in der internationalen Anmeldung, die veröffentlicht worden ist, unter PCT WO 94/25933, angemeldet am 10. November 1994, beschrieben. WO 94/25933 beschreibt ein System und Verfahren zum verbessern des Modells eines Systems (z. B. einer Industrieanlage) und demnach die Optimierung seiner Steuerung. Es wird ein konventionelles neuronales Dreischichtennetz verwendet.
Das System erfordert bereitzustelle Eingabenvariablen, wobei jede Variable in ihrer eigenen Domäne definiert ist. Das Modell (z. B. das neuronale Netz) produziert entsprechende Ausgangswerte. Eine Empfindlichkeitsanalyse wird an dem Modell ausgeführt zum Erzielen eines Empfindlichkeitsprofils auf der Eingangsvariablen, wobei die Empfindlichkeitsmessungen partiell abgeleiteten Funktionen der Ausgangswerte basieren in Bezug auf die Eingangswerte. Obwohl WO 94/25933 suggeriert, den Eingangsraum in mindestens zwei Unterräume zu unterteilen, von denen einer Eingangsvariablen einschließt, die als "empfindlich" identifiziert sind in dem Empfindlichkeitsprofil, wird die Empfindlichkeitsanalyse nicht für jeden der Subräume wiederholt zum Erstellen eines Empfindlichkeitsprofils für jeden der Subräume.
Solche Techniken zum Identifizieren der herausragenden Dimensionen, die zum Erstellen eines Modells verwendet werden, stellen noch keine Erläuterung des Verhaltens des erstellten Modells bereit. Insbesondere können einige Dimensionen nur herausragend sein in einem Subraum der Eingangsdaten und haben demnach einen Einfluss auf das Verhältnis des Modells nur in diesem Subraum. Um dem Verständnis des Verhaltens eines Modells zu dienen, wird häufig eine andere Art statistischer Technik verwendet, die Regel-Induktion genannt wird. Regelinduktion wird beispielsweise in C4.5: Programme für Maschinenlernen (Programs for Machine Learning), von J. Ross Quinlan, Morgan Kauf man Publishers, 1993 beschrieben. Ein Computerprogramm mit demselben Namen ("C4.5") ist auch verfügbar von dem Autor und Herausgeber. Dieses Programm verwendet Daten direkt zum Herleiten von Regeln. Andere Regelinduktionstechniken verwenden ein Modell zum Herleiten von Regeln. Diese Techniken stellen eine Baumstruktur bereit, die das Verhalten eines Modells als eine Regelsammlung erläutert. Obwohl diese Regeln für das Erläutern des Modellverhaltens hilfreich sein können, sind diese Regeln häufig zu umfangreich und zu komplex, um von einem Menschen so leicht interpretiert zu werden, wie man es wünschen würde. Es ist auch schwierig, aus diesen Regeln eine Erklärung zu extrahieren, welche der Eingangswerte wichtig sind in jedem Subraum der Eingangsdaten, die den Baum definieren.
RESUMÉ
Die vorliegende Erfindung stellt eine Beschreibung des Verhaltens eines Modells bereit, das die Empfindlichkeit des Modells in jedem Subraum des Eingangsraums anzeigt, wie in den beiliegenden Patentansprüchen dargelegt. Beispielsweise kann die Beschreibung anzeigen, welche Dimension oder Dimensionen von Eingangsdaten herausragend sind im Subraum des Eingangsraums. Durch Implementierung dieser Beschreibung unter Verwendung eines Entscheidungsbaums werden die Subräume und ihre herausragenden Dimensionen sowohl beschrieben als auch hierarchisch bestimmt.
Demgemäss ist ein Aspekt ein computerimplementierter Prozess zum Erstellen einer Beschreibung des Verhaltens eines Modells, die indikativ ist bezüglich der Empfindlichkeit des Modells in Subräumen eines Eingangsraums des Modells. Die Empfindlichkeitsanalyse wird durchgeführt an dem Modell zum Bereitstellen eines Empfindlichkeitsprofils des Eingangsraums des Modells in Übereinstimmung mit der Empfindlichkeit von Ausgängen des Modells zu Reaktionen im Dateneingang zu dem Modell. Der Eingangsraum wird aufgeteilt in mindestens zwei Unterräume gemäß dem Empfindlichkeitsprofil. Eine Empfindlichkeitsanalyse wird an dem Modell durchgeführt zum Bereitstellen eines Empfindlichkeitsprofils jedes der Unterräume in Übereinstimmung der Empfindlichkeit der Ausgänge des Modells auf Variationen im Dateneingang zu dem Modell.
Ein anderer Aspekt ist ein Computersystem zum Erstellen einer Beschreibung des Verhaltens eines Modells, das die Empfindlichkeit des Modells in Subräumen eines Eingangsraums des Modells anzeigt. Empfindlichkeitsanalyse wird an dem Modell durchgeführt zum Bereitstellen eines Empfindichkeitsprofils des Eingangsraums des Modells in Übereinstimmung mit der Empfindlichkeit der Ausgänge des Modells zu Variationen im Dateneingang zu dem Modell. Der Eingangsraum ist aufgeteilt in mindestens zwei Subräume gemäß dem Empfindlichkeitsprofil. Eine Empfindlichkeitsanalyse wird. an dem Modell durchgeführt zum Bereitstellen eines Empfindlichkeitsprofils für jeden der Subräume gemäß der Empfindlichkeit der Ausgänge des Modells auf Variationen im Dateneingang zu dem Modell.
In einem anderen Aspekt schließt ein Computersystem zum Erstellen einer Beschreibung des Verhaltens eines Modells, die die Empfindlichkeit des Modells in Subräumen eines Eingangsraums des Modells anzeigt ein Empfindlichkeitsanalysemodul und einen Datenaufteiler ein. Das Empfindlichkeitsanalysemodul stellt eine Anzeige eines Empfindlichkeitsprofils des Eingangsraums des Modells in Übereinstimmung mit der Empfindlichkeit der Ausgänge des Modells auf Variationen im Dateneingang zu dem Modell bereit. Der Datenaufteiler hat einen ersten Eingang zum Empfangen eines Eingangsdatensatzes und einen zweiten Eingang zum Empfangen der Anzeige des Empfindlichkeitsprofils, die von dem Empfindlichkeitsanalysemodul ausgegeben worden ist, und hat einen Ausgang zum Bereitstellen von mindestens zwei Subräumen des Eingangsraums in Übereinstimmung mit einer Segmentierung, die in Übereinstimmung mit dem durch das Empfindlichkeitsanalysemodul angezeigten Empfindlichkeitsprofil durchgeführt worden ist.
In einer Ausführungsform ist das Empfindlichkeitsprofil eine Rangordnung von Dimensionen des Eingangsraums. Der Eingangsraum kann demnach aufgeteilt sein in Übereinstimmung mit der Dimension, zu welcher die Ausgänge des Modells am empfindlichsten sind.
KURZBESCHREIBUNG DER ZEICHNUNG
In den Zeichnungen zeigt:
1 ein Blockdiagramm einer Ausführungsform eines Systems, welche einen Eingangsdatensatz in mindestens zwei Subräume aufteilt;
2 ein Flussdiagramm der Verwendung des in 1 gezeigten Systems;
3 ein Blockdiagramm zum Darstellen, dass das in 1 gezeigte System kaskadiert werden kann zum Generieren eines Entscheidungsbaums;
4 ein detaillierteres Blockdiagramm einer Ausführungsform des Datenaufteilungsmoduls der 1; und
5 ein Flussdiagramm zum detaillierteren Beschreiben des Betriebs der 4.
DETAILIERTE BESCHREIBUNG
Die folgende detaillierte Beschreibung sollte in Verbindung mit den beiliegenden Zeichnungen gelesen werden, in welchen ähnliche Bezugszeichen ähnliche Strukturen kennzeichnen. Alle hierin zitierten Druckschriften sind hierdurch ausdrücklich durch Bezugnahme aufgenommen.
1 ist ein Blockdiagramm zum Zeigen des Datenflusses einer Ausführungsform eines Systems zum Generieren einer Beschreibung des Verhaltens eines Modells, das die Empfindlichkeit des Modells in Subräumen des Eingangsraums anzeigt, welches die Beschreibung unter Verwendung eines Entscheidungsbaums implementiert. Andere Bäume, Graphiken, Regeln oder ähnliche Darstellungen können auch verwendet werden. Ein Modell 11 wird üblicherweise durch Auswählen einer Art von für eine Art von Problem geeignetem Modell erstellt. Bei einer gegebenen Art eines Problems und einer gegebenen Art eines Modells sind Eingangsfelder, die die Lösung zu dem definierten Problem beeinträchtigen, identifiziert und standardisiert. Irgendwelche Zielausgangsfelder werden auch identifiziert und standardisiert. Ein Trainingsdatensatz, der zu verwenden ist zum Generieren oder Trainieren des Modells wird dann vorbereitet. Der Trainingsdatensatz ist üblicherweise ein Sub-Satz einer Datenbank oder eines anderen großen Datensatzes. Jeder Datenwert in einem Datensatz ist üblicherweise definiert durch einen Vektor von einer oder mehreren Dimensionen entsprechend den ausgewählten Eingangsfeldern und von einer oder mehrerer Ausgangsdimensionen entsprechend den ausgewählten Ausgangsfeldern. Der Trainingsdatensatz wird allgemein unter Verwendung geschichteter Abtastung eines großen Datensatzes erstellt. Beispielsweise kann eine große Kundendatenbank, die über einige Millionen Aufzeichnungen enthält, abgetastet werden zum Erstellen eines Trainingssatzes von näherungsweise einige Tausend Einträgen, die allgemein die Gesamtkundendatenbank repräsentieren. Der Trainingsdatensatz wird dann auf das Modell unter Verwendung einer Trainingsprozedur angewendet und ein Modell 11 wird erstellt.
Nachdem das Modell 11 erstellt worden ist, kann eine Beschreibung des Verhaltens des Modells generiert werden. Ein Eingangsdatensatz 10 wird zu diesem Zweck ausgewählt. Der Eingangsdatensatz 10 kann der Trainingssatz sein, kann ein Sub-Satz des Trainingsatz sein, kann eine andere geschichtete Abtastung der Datenbank oder eines großen Datensatzes sein oder kann ein Satz von Werten sein, die bei zufälliger Benutzung des Modells generiert worden sind und die Minimum- und Maximumwerte von jeder Eingangsdimension von dem Trainingssatz.
Der Eingangsdatensatz wird angegeben in ein Empfindlichkeitsanalysemodul 12, das Empfindlichkeitsmessungen 14 bestimmt in Übereinstimmung mit typischen Techniken. Solche Techniken sind beispielsweise beschrieben in "DateMining Techniques" von Michael Berry und Gordon Linoff, Johl Wiley and Sons, June 1997.
In einer Ausführungsform wendet das Empfindlichkeitsanalysemodul Eingangstestdaten 15 auf das Modell 11 an und empfängt Ausgangsdaten 17 von dem Modell.
Die Eingangstestdaten werden aus den Daten des Eingangsdatensatzes 10 erstellt. Insbesondere wird für jeden Datenwert im Eingangsdatensatz ein Eingangstestdatenwert erstellt durch Variieren des Wertes des Datenwertes für jede Dimension. Die Variation für jede Dimension wird definiert durch einen Wert, der beispielsweise "h" genannt wird, welcher zu dem Wert der Dimension für jeden Datenwert hinzuaddiert wird und von ihm subtrahiert wird. Diese variierten Eingangsdaten werden auf das Modell angewendet zum Erhalten der Ausgangsdaten 17, aus welchen eine partielle Ableitung berechnet werden kann im Eingangsraum bei jedem Datenwert für jede Dimension des Datenwertes. Diese Berechnung wird allgemein eine Baumpunktableitung genannt. Die Berechnung der partiellen Ableitungen, die verwendet wird zum Bestimmen der Empfindlichkeitsmessungen kann einmal für den Eingangsdatensatz ausgeführt werden. Die Verarbeitung nachfolgender Unterräume erfordert keine Neuberechnung dieser partiellen Ableitungen. Jedoch werden die Empfindlichkeitsmessungen für jeden Subraum neu berechnet unter Verwendung der partiellen Ableitungen nur von den Daten im Subraum.
Der Wert "h" ist problemabhängig und kann demnach benutzerdefiniert werden. Ein typischer Wert ist ½% bis 5% des Bereichs im Eingangsdatensatz des Wertes für diese Dimension. Wenn die Werte im Eingangsdatensatz genormt sind, beispielsweise unter Verwendung eines z-Wertes, dann liegt ein geeigneter Wert von "h" üblicherweise im Bereich von 0,005 bis 0,05.
Die Quadrate der partiellen Ableitungen für jede Dimension werden über den Eingangsdatensatz gesammelt zum Erhalten der Empfindlichkeitsmaße 14. Beispielsweise kann die Summe über den Eingangsdatensatz der quadrierten partiellen Ableitungen für jede Dimension berechnet werden. Diese Empfindlichkeitsmessungen stellen ein Empfindlichkeitsprofil des Eingangsraums des Modells bereit. Von diesem Empfindlichkeitsprofil können eine oder mehrere Dimensionen des Eingangsdatensatz identifiziert werden, zu welchen der Ausgang bezüglich Variation am empfindlichsten ist.
Beispielsweise können die Empfindlichkeitsmaße der Dimensionen in einer Rangordnung angeordnet werden und die Dimension mit der höchsten Empfindlichkeit kann ausgewählt werden.
Das Berechnen der partiellen Ableitungen, das beim Bestimmen der Empfindlichkeitsmaße verwendet wird, kann parallelisiert werden. Eine Kopie des analysierten Modells und ein Empfindlichkeitsanalysemodul können vorgesehen sein für jeden der Vielzahl von Prozessoren. Der Eingangsdatensatz kann partitioniert sein und jede Partition der Daten kann einem separaten Prozessor zur Verfügung gestellt werden. Das Berechnen partiellen Ableitungen für jeden Datenwert kann parallel durchgeführt werden an jeder Partition durch jeden Prozessor.
In 1 empfängt ein Datenaufteilmodul 16 den Eingangsdatensatz 10 und die Empfindlichkeitsmaße 14 und teilt den Eingangsdatensatz in Unterräume 18 und 19 auf entsprechend dem durch die Empfindlichkeitsmaße 14 definierten Empfindlichkeitsprofil. Die Aufteilung kann von der Dimension sein, die am herausragendsten ist, oder kann entlang einer Achse in zwei- oder mehr Dimensionen sein, die am herausragendsten sind. Die Aufteilung wird derart durchgeführt, dass ein Subraum die Eingangsdaten enthält, für welche der Wert der ausgewählten Dimension kleiner ist als (oder gleich) ein ausgewählter Schwellwert; der andere Subraum enthält die Eingangsdaten, für welche der Wert in der ausgewählten Dimension größer ist als (oder gleich) der Schwellwert. Jede Seite der Aufteilung kann programmiert werden, um Daten mit einem Wert gleich dem Schwellwert zu empfangen.
Der Schwellwert kann auf viele Arten ausgewählt werden. Beispiel-Schwellwerte enthalten die Durchschnitts-, Medial- oder häufigsten werte in den Eingangsdaten für die ausgewählte Dimension, oder eine Funktion der Empfindlichkeitsmaße oder eine Funktion der Werte, die verwendet werden zum Berechnen der Empfindlichkeitsmaße. In einer Ausführungsform wird der Schwellwert berechnet durch Bringen des Eingangsdatensatzes in eine Reihenfolge in Übereinstimmung mit den Werten der ausgewählten Dimension. Insbesondere wenn jeder Eingangsdatenwert x_i nummeriert ist als x₁, x₂, ..., x_N ϵ [x_min, x_max] UND wenn die Eingangsdaten x_i vom Minimum zum Maximum geordnet sind, mit x₁ als Datenwert mit dem kleinsten Wert einer ausgewählten Dimension und x_N als dem Datum mit dem größten Wert der ausgewählten Dimension, dann ist ein Wert der ausgewählten Dimension des Datenwertes x_m der am nächsten zur Mitte des Satzes {x_i, ..., x_N} in Bezug auf die Empfindlichkeitsmaße liegt, ein geeigneter Schwellwert. Das heißt, der Schwellwert ist der Wert der ausgewählten Dimension des Datenwertes x_m derart, dass
so nahe wie möglich bei
liegt.
Jeder der Subräume, die durch Aufteilen der Eingangsdaten in dieser Weise erhalten werden, kann ferner aufgeteilt werden auf dieselbe Weise bis eine vorbestimmte Anzahl von Subräumen oder eine vorbestimmte Größe eines Subraums erreicht worden sind. Durch rekursives Aufteilen jedes Subraums kann jede Aufteilung, die durch ein Datenaufteilmodul 16 definiert wird, durch einen Entscheidungsbaum repräsentiert werden. Jeder Knoten des Entscheidungsbaums speichert einen Indikator der Dimension, welche am Herausragendsten ist für die Eingangsdaten und den Schwellwert, der durch den Knoten verwendet worden ist zum Aufteilen der Eingangsdaten in Subräume. Der Entscheidungsbaum definiert demnach hierarchisch für jeden Subraum des Eingangsraums die Dimension und den Schwellwert, der zum Erstellen des Subraums verwendet wird und die Dimension, die in diesem Subraum am herausragendsten ist.
Ein Flussdiagramm, das den Betrieb der in 1 gezeigten Ausführungsform beschreibt, wird nun in Verbindung mit 2 beschrieben. Insbesondere wird Empfindlichkeitsanalyse durchgeführt an dem Modell 11 unter Verwendung des Eingangsdatensatzes 10 im Schritt 20. Der Eingangsdatensatz 10 wird aufgeteilt, beispielsweise durch das Datenaufteilmodul 16, im Schritt 22 der herausragendsten Dimension. Der Prozess der 2 wird rekursiv auf den Subräumen durchgeführt, d. h. Subräume 18 und 19, resultierend von dem Schritt 22, wie in Schritten 24 und 26 gezeigt. Schritte 24 und 26 können seriell ausgeführt werden oder können parallel auf separaten Prozessoren ausgeführt werden. Wie oben erwähnt kann die Berechnung der zum Bestimmen der Empfindlichkeitsmaße verwendeten partiellen Ableitungen einmal für den gesamten Eingangsdatensatz durchgeführt werden. Die Verarbeitung von nachfolgenden Subräumen erfordert keine Neuberechnung dieser partiellen Ableitungen. Jedoch werden die Empfindlichkeitsmaße für jeden Subraum neu berechnet unter Verwendung der partiellen Ableitungen nur für die Daten in dem Subraum.
Das Aufteilen von Subräumen kann auch durchgeführt werden parallel und in einer pipelineweise wie in 3 gezeigt. Insbesondere können das Empfindlichkeitsanalysemodul 12 und das Datenaufteilmodul 16 der 1 als Datenaufteiler 30, wie er in 3 gezeigt ist, betrachtet werden. Das Modell 11 ist in dieser Figur nicht gezeigt, weil es als in einem Vorverarbeitungsschritt zum Generieren der partiellen Ableitungen, von welchen die Empfindlichkeitsmaße berechnet werden, verwendet angesehen werden kann. Ein Datenaufteiler 30 empfängt Eingangsdaten 31 und generiert Ausgangssubräume 32 und 33. Zusätzliche Datenaufteiler 34 und 36 können vorgesehen sein zum Parallelarbeiten an den Ausgangssubräumen 32 und 33 zum Bereitstellen zusätzlicher Subräume.
Ein detaillierteres Blockdiagramm eines Datenaufteilmoduls 16 der 1 in einer Ausführungsform wird nun in Verbindung mit 4 beschrieben. In 4 werden die Empfindlichkeitsmaße von einem Dimensionsauswahlmodul 40 verwendet zum Identifizieren einer Dimension 42, auf der der Eingangsdatensatz 10 aufgeteilt werden wird. Ein Schwellwert 48 wird durch ein Schwellwertauswahlmodul 46 für die ausgewählte Dimension 42 ausgewählt. Diese Auswahl kann unter Verwendung des Eingangsdatensatzes 10 durchgeführt werden, beispielsweise durch Identifizieren der Durchschnitts-, Medial- oder häufigsten Werte oder eine andere Funktion der Werte in dieser Dimension im Eingangsdatensatz. Der Schwellwert 48 wird in einen Komparator 49 eingegeben. Jeder Eingangsdatenwert wird auch in den Komparator 49 eingegeben, um mit dem Schwellwert verglichen zu werden. Das Ergebnis dieses Vergleichs stellt ein Auswahlsignal 45 bereit, welches an einen Steuereingang eines Multiplexers 47 angelegt wird. Der Multiplexer 47 richtet den Eingangsdatenwert an einen eines ersten Ausgangs oder eines zweiten Ausgangs abhängig von dem Auswahlsignal 45. Die von dem Multiplexer 47 ausgegebenen Daten fallen demnach in einen der beiden Subräume, wie durch den Komparator spezifiziert.
Das Flussdiagramm der 5 beschreibt detaillierter den Betrieb der Schaltung der 4. Zuerst wird eine Dimension basierend auf den Empfindlichkeitsmaßen ausgewählt, wie in einem Schritt 50 angezeigt. Ein Schwellwert der ausgewählten Dimension wird in Schritt 52 aus dem Eingangsdatensatz bestimmt. Für jeden Eingangsdatenwert wird, wie in Schritt 54 angezeigt, der Wert der ausgewählten Dimension in Schritt 56 mit dem bestimmten Schwellwert verglichen. In Übereinstimmung mit dem Vergleich wird der Datenwert in einem angemessenen Subraum platziert in Schritt 58. Die Schritte 56 und 58 werden für jeden Eingangsdatenwert wiederholt, wie in Schritten 54 und 59 angezeigt.
Die Beschreibung des Verhaltens des Modells kann einem Benutzer beispielsweise von einer Computeranzeige oder einem Ausdruck in einer Anzahl von Formaten präsentiert werden. Durch Wiedergeben der Beschreibung unter Verwendung eines Entscheidungsbaums kann jeder Knoten des Baums beschrieben werden unter Verwendung einer Regel in einer Vorhersagerechnung erster Ordnung. Der Benutzer kann den Baum durchlaufen und interaktiv jeden Knoten expandieren oder kontrahieren zum Betrachten der Beschreibung für jeden Knoten des Baumes.
Ein Universalrechnersystem kann zur Implementierung des oben gezeigten Systems unter Verwendung eines Computerprogramms verwendet werden. Ein solches Computersystem enthält üblicherweise eine Haupteinheit, die sowohl mit einer Ausgabeeinrichtung verbunden ist, welche Information für einen Benutzer anzeigt als auch mit einer Eingabeeinrichtung, die Eingangsgrößen von einem Benutzer empfängt. Die Haupteinheit schließt allgemein einen Prozessor ein, damit ein Speichersystem über einen Verbindungsmechanismus verbunden ist. Auch die Eingangseinrichtung und die Ausgabeeinrichtung sind über den Zwischenverbindungsmechanismus mit dem Prozessor und dem Speichersystem verbunden.
Es sollte verstanden werden, dass eine oder mehre Ausgabeeinrichtungen mit dem Computersystem verbunden sein können. Beispielhafte Ausgabeeinrichtungen können eine Kathodenstrahlröhrenanzeige (CRT), eine Flüssigkristallanzeige (LCD), Drucker, Kommunikationseinrichtungen wie ein Modem und Audioausgangseinrichtungen sein. Es sollte auch verstanden werden, dass eine oder mehrere Eingabeeinrichtungen mit dem Computersystem verbunden sein können. Beispielhafte Eingabeeinrichtungen schließen eine Tastatur, ein Tastenfeld, einen Track-Ball, eine Maus, eine Stift-Tablett-Kombination, eine Kommunikationseinrichtung und eine Dateneingabeeinrichtung wie z. B. Sensoren ein. Es sollte verstanden werden, dass die Erfindung nicht auf die speziellen Eingabe- oder Ausgabeeinrichtungen beschränkt ist, die in Kombination mit dem Computersystem verwendet werden oder auf jene hier beschriebenen.
Das Computersystem kann ein Universalrechnersystem sein, welches programmierbar ist unter der Verwendung einer Computerprogrammiersprache wie z. B. "C++", JAVA oder einer anderen Sprache wie z. B. einer Schreibsprache oder selbst Assembler-Sprache. Das Computersystem kann auch aus einer speziell programmierten Spezialanwendungshardware bestehen. In einem Universalcomputersystem ist der Prozessor üblicherweise ein kommerziell verfügbarer Prozessor von den Serie-x86 und Pentium Prozessoren, die von Intel verfügbar sind, und ähnliche Einrichtungen, die von AMD und Cyrix verfügbar sind, der 680X0 Serienmikroprozessor, der von Motorola verfügbar ist, der PowerPC Mikroprozessor von IBM und die Alphaserienprozessoren von Digital Equipment Corporation sind Beispiele. Viele andere Prozessoren sind verfügbar. Solch ein Mikroprozessor führt ein Programm aus, das Betriebssystem genannt wird, von welchem Windows NT, Linux, UNIX, System 7, DOS, VMS und OS8 Beispiele sind, welche das Ausführen anderer Computerprogramme steuern und Planung, Debugging, Eingabe/Ausgabe-Steuerung, Buchung, Compilierung, Speicherzuordnung, Datenmanagement und Speichermanagement und Kommunikationssteuerung und zugehörige Dienste bereitstellen. Der Prozessor und das Betriebssystem definieren eine Computerplattform, für welche Anwendungsprogramme in Programmierhochsprachen beschrieben werden. Eine Parallelverarbeitungsbetriebsumgebung kann auch verwendet werden wie z. B. die "Orchestrate parallel operating shell" von Torrent Systems, Inc. aus Cambridge, Massachusetts.
Das Speichersystem enthält üblicherweise ein computerlesbares und beschreibbares nicht flüchtiges Speichermedium, von welchen eine Magnetscheibe, ein Flashspeicher und ein Band Beispiele sind. Die Scheibe kann entfernbar sein, bekannt als eine Floppy Disk, oder permanent, bekannt als Festplatte. Eine Scheibe kann eine Anzahl von Spuren haben, in welchen Signale gespeichert sind, üblicherweise in Binärform, d. h. einer Form, die aus einer Folge von Einsen und Nullen interpretiert wird. Solche Signale können ein Anwendungsprogramm, das durch den Mikroprozessor auszuführen ist, definieren oder eine Information, die auf der Platte gespeichert ist, um verarbeitet zu werden durch das Anwendungsprogramm. Üblicherweise veranlasst der Prozessor im Betrieb aus dem nicht flüchten Aufzeichnungsmedium zu lesende Daten in ein Speicherelement in Form einer integrierten Schaltung geschrieben zu werden, welches üblicherweise ein flüchtiger Speicher wahlfreien Zugriffs ist, wie z. B. ein dynamischer Speicher wahlfreien Zugriffs (DRAM) oder ein statischer Speicher (SRAM). Das Speicherelement in Form einer integrierten Schaltung ermöglicht einen schnelleren Zugriff auf die Information durch den Prozessor, als es die Scheibe tut. Der Prozessor manipuliert im allgemein die Daten innerhalb des Speichers in Form einer integrierten Schaltung und kopiert dann die Daten zu der Platte, wenn die Verarbeitung abgeschlossen ist. Eine Vielzahl von Mechanismen sind bekannt zum Organisieren von Datenbewegung zwischen der Platte und dem Speicherelement in Form einer integrierten Schaltung und die Erfindung ist nicht darauf beschränkt. Es sollte auch verstanden werden, dass die Erfindung nicht auf ein spezielles Speichersystem beschränkt ist.
Es sollte auch verstanden werden, dass die Erfindung nicht auf eine spezielle Computerplattform, einen speziellen Prozessor oder spezielle Programmierhochsprachen beschränkt ist. Zudem kann das Computersystem ein Mehrcomputersystem sein oder kann mehrere Computer einschließen, die über ein Computernetz verbunden sind. Es sollte verstanden werden, dass jedes Modul separate Module eines Computerprogramms sein kann oder separate Computerprogramme sein kann. Solche Module können betreibbar sein auf separaten Computern oder Prozessoren und können parallel oder seriell ausgeführt werden.
Nachdem nun einige Ausführungsformen beschrieben worden sind, sollte Fachleuten ersichtlich sein, dass das Vorangegangene bloß erläuternd ist und nicht beschränkend und nur als Beispiel präsentiert worden ist.

Claims

Rechnerimplementierter Prozess zum Erstellen einer Beschreibung des Verhaltens eines Modells, das die Empfindlichkeit des Modells in Teilräumen eines Eingangsraums des Modells angibt, umfassend: Durchführen (20) einer Empfindlichkeitsanalyse an dem Modell, um ein Empfindlichkeitsprofil des Eingangsraums des Modells gemäß der Empfindlichkeit von Ausgängen des Modells gegenüber Variationen von Dateneingängen zu dem Modell bereitzustellen, Unterteilen (22) des Eingangsraums in wenigstens zwei Teilräume gemäß dem Empfindlichkeitsprofil, wobei der genannte rechnerimplementierte Prozess gekennzeichnet ist durch: Durchführen (24) einer Empfindlichkeitsanalyse an dem Modell, um ein Empfindlichkeitsprofil jedes der Teilräume gemäß der Empfindlichkeit von Ausgängen des Modells gegenüber Variationen von Dateneingängen zu dem Modell bereitzustellen.
Rechnerimplementierter Prozess nach Anspruch 1, bei dem das Empfindlichkeitsprofil eine Rangordnung von Dimensionen des Eingangsraums ist.
Rechnerimplementierter Prozess nach Anspruch 2, bei dem der Schritt des Unterteilens des Eingangsraums den Schritt des Unterteilens des Eingangsraums gemäß der Dimension aufweist, gegenüber der Ausgänge des Modells am empfindlichsten sind.
Rechnersystem zum Erstellen einer Beschreibung des Verhaltens eines Modells, das Empfindlichkeit des Modells in Teilräumen eines Eingangsraums des Modells angibt, umfassend: Mittel (14) zum Durchführen einer Empfindlichkeitsanalyse an dem Modell, um ein Empfindlichkeitsprofil des Eingangsraums des Modells gemäß der Empfindlichkeit von Ausgängen des Modells gegenüber Variationen von Dateneingängen zu dem Modell bereitzustellen, Mittel (16) zum Unterteilen des Eingangsraums in wenigstens zwei Teilräume gemäß dem Empfindlichkeitsprofil, wobei das genannte Rechnersystem gekennzeichnet ist durch: Mittel (12) zum Durchführen einer Empfindlichkeitsanalyse an dem Modell, um ein Empfindlichkeitsprofil jedes der Teilräume gemäß der Empfindlichkeit von Ausgängen des Modells gegenüber Variationen von Dateneingängen zu dem Modell bereitzustellen.
Rechnersystem nach Anspruch 4, bei dem das Empfindlichkeitsprofil eine Rangordnung von Dimensionen des Eingangsraums ist.
Rechnersystem nach Anspruch 5, bei dem das Mittel zum Unterteilen des Eingangsraums den Schritt des Unterteilens des Eingangsraums gemäß der Dimension aufweist, gegenüber der Ausgänge des Modells am empfindlichsten sind.
Rechnerlesbares Speichermedium mit darauf gespeichertem Programmcode, der, wenn er auf einem Rechner ausgeführt wird, eine Beschreibung des Verhaltens eines Modells, das die Empfindlichkeit des Modells in Teilräumen eines Eingangsraums des Modells angibt, erstellt durch: – Durchführen (20) einer Empfindlichkeitsanalyse an dem Modell, um ein Empfindlichkeitsprofil des Eingangsraums des Modells gemäß der Empfindlichkeit von Ausgängen des Modells gegenüber von Variationen von Dateneingängen zu dem Modell bereitzustellen, – Unterteilen (22) des Eingangsraums in wenigstens zwei Teilräume gemäß dem Empfindlichkeitsprofil, gekennzeichnet durch: – Durchführen (24) einer Empfindlichkeitsanalyse an dem Modell, um ein Empfindlichkeitsprofil jedes der Teilräume gemäß der Empfindlichkeit von Ausgängen des Modells gegenüber Variationen von Dateneingängen zu dem Modell bereitzustellen.