<Desc/Clms Page number 1>
Die Erfindung betrifft die Auswertung psychologischer und/oder biomedizinischer Rohdaten in Form eines Profilvektors, welcher einen Probanden betreffende, im Rahmen einer psycholo- gisch/biomedizinischer Testung gewonnene Daten umfasst.
In der psychologischen Diagnostik kommen, besonders in jüngster Zeit, Tests zum Einsatz, in denen - beispielsweise mittels Messungen, Testsituationen oder Interviews - verschiedene psycho- logische und/oder biomedizinische Parameter erfasst werden und aus diesen ein Gesamturteil ermittelt wird, z. B. betreffend die Eignung des Probanden (z.B. als Fahrzeuglenker oder Flugzeug- pilot), die psychische Belastbarkeit, das Vorliegen einer psychischen Störung (z. B. einer Depressi- on). Oft werden diese Tests in der Form von Testbatterien gebündelt durchgeführt.
Seit mehreren Jahrzehnten gibt es in diesem Bereich der Psychologie heftige Diskussionen über die Art der Dateninterpretation und Datenintegration im Rahmen des diagnostischen Prozes- ses. Ein zentraler kontroverser Punkt ist der Gegensatz zwischen zwei Strategien der Urteilsbil- dung, nämlich die "statistische" und die "klinische" Urteilsbildung. Während in der klinischen Ur- teilsbildung die Informationen von geschulten Psychologen auf der Grundlage deren Fachwissens, Erfahrung und Intuition zu einem Urteil integriert werden, nutzen Methoden der statistischen Ur- teilsbildung mathematische Algorithmen zur Integration der erhobenen Daten. Im Rahmen der klinischen Urteilsbildung muss der Grad an intersubjektiver Nachvollziehbarkeit der Urteile erst post-hoc ermittelt und auf Basis der Merkmale der Beurteilungen hinsichtlich der Aussagekraft relativiert werden.
Im Gegensatz zur klinischen Urteilsbildung ermöglichen Methoden der statisti- schen Urteilsbildung auch die Ermittlung der Sicherheiten individueller diagnostischer Entschei- dungen, was bei klinischen Urteil lediglich über die Abgabe subjektiver Ratings des Diagnostikers möglich ist.
Vor allem bei Fragen zur Personalselektion (Schlagwort "die richtige Person am richtigen Platz") sowie bei verkehrspsychologischen Untersuchungen kommt der Entscheidungssicherheit eine immer grössere Bedeutung zu, insbesondere im Zuge einer Qualitätssicherung von Auswahl- prozeduren bzw. von strengeren Vorschreibungen bei Qualitätsstandards (z. B. ISO 9001). Statisti- sche Methoden der diagnostischen Urteilsbildung weisen nach den oben diskutierten Gesichts- punkten hier einen klaren Vorteil auf.
In der Verkehrspsychologie wird derzeit vor allem auf Cut-Off-Scores zurückgegriffen, wobei bereits das Unterschreiten eines vorgeschriebenen Cut-Off-Scores in einem einzigen Messwert zum Entzug der Fahrerlaubnis führen kann. Die angegebenen Cut-Off-Scores in den einzelnen Testkennwerten (z. B. aus Intelligenz-, Konzentrations-, Reaktions- bzw. Persönlichkeitstests), basieren auf Expertenratings. Studien über Möglichkeiten der Kompensation von Defiziten oder Verstärkung einzelner Defizite stehen jedoch aus.
Darüber hinaus gibt es im Bereich der Verkehrspsychologie äusserst wenige und vor allem grossteils enttäuschende Studien darüber, wie die erreichten Einzeltestwerte mit dem Kriterium Fahreignung zusammenhängen. Die in der Literatur berichteten Korrelationen bewegen sich bei Werten bis maximal 0.40, was eine Varianzaufklärung von gerade 16% entspricht ; Varianz- aufklärung von lediglich 9% ist in diesem Bereich keine Seltenheit. Diese - praktisch irrelevanten - Korrelationskoeffizienten wurden bereits als "grosser" Erfolg angepriesen. Greift man in den ver- schiedenen Studien jedoch auf die methodisch erforderliche Korrektur des Alphafehlerniveaus zurück, verschwindet zumeist die statistische ausgewiesene Signifikanz.
Präzise und wissenschaft- lich seriöse Aussagen lassen sich bei der gegebenen Befundlage und der derzeit verwendeten klinischen Art der Informationsintegration aus methodischer Sicht nicht ohne gravierende methodi- sche Bedenken ziehen. Diese oben diskutierte Befundlage verdeutlicht die Notwendigkeit einer stärker objektiven Art der Informationsintegration zum Zweck der Entscheidungsfindung unter Rückgriff auf statistische Methoden der Informationsintegration.
Im Bereich der Verbesserung klassischer statistischer Klassifizierungsmodelle, die sich für den Einsatz im Rahmen der diagnostischen Urteilsbildung eignen, hat sich in den letzten Jahren aller- dings nur wenig getan. In der Praxis kommt den korrelations- und regressionsanalytische Modellen derzeit die grösste Bedeutung zu.
Die korrelations- und regressionsanalytische Ansätze lassen sich weiter in lineare und kurvili- neare Methoden unterteilen. Als Hauptvertreter der linearen statistischen Techniken, die auch in den meisten Studien zur Klassifikation von Probanden verwendet werden, gelten die Regressions- analyse und die Diskriminanzanalyse, vgl. R. S. Jäger, "Diagnostische Urteilsbildung" in Enzyklopä-
<Desc/Clms Page number 2>
die der Psychologie, Hrsg. K-J. Groffmann u. L. Michel, Göttingen: Hogrefe 1982.
Die kurvilinearen Modelle, deren Grundidee auch öfters als "Konfiguralität" bezeichnet wird, gehen von der Annahme eines nicht-linearen Zusammenhangs zwischen den Prädiktorvariablen (z. B. Testdaten, Informationen aus Anamnesen) und der Kriteriumsvariable (Aussagen über das Urteil, z. B. "erfolgreich" gegenüber "nicht erfolgreich") aus. Genau diese kurvilinearen Beziehungen stellt im Bereich der Psychologie zumeist die Realität dar, jedoch sind derartige Zusammenhänge naturgemäss schwer zu modellieren. In heutigen Studien wird daher überwiegend die Diskriminan- zanalyse bei der Klassifizierung von Personen herangezogen.
Das Prinzip der Diskriminanzanalyse bei zwei qualitativ unterschiedlichen Ausprägungen einer Kriteriumsvariable besteht darin, durch eine lineare und gewichtete Kombination der einzelnen Merkmale ein Mass zu finden, das die beiden Zuweisungsgruppen optimal trennt. Dies bedeutet, dass die Varianz der kombinierten Punktwerte zwischen den beiden Gruppen im Vergleich zu der Varianz innerhalb einer Gruppe maximiert wird. Der Rechengang wird durch die Ermittlung einer Diskriminanzfunktion und dem Vergleich der empirisch erhobenen und anhand der Diskriminanz- funktion ermittelten Zuordnungen der Personen zu den beiden Zuweisungsgruppen beendet. Diese Diskriminanzfunktion besitzt die Eigenschaft, die vorgegebenen Klassen am besten trennt.
Die dabei berechneten #-Gewichte für die einzelnen Prädiktoren sind Partialregressionskoeffizienten, was unmittelbar die Beziehung der Diskriminanzanalyse zur multiplen Regression verdeutlicht. Die Diskriminanzanalyse wurde ursprünglich für Zuordnungen im Rahmen der Anthropologie entwi- ckelt, vgl. R. A. Fisher, "The statistical utilization of multiple measurement", Annals of Eugenics 8,376-386, und ist seit der Verfügbarkeit von Computeranlagen zu einem Routineverfahren gewor- den, dessen Bedeutsamkeit in zahlreichen Untersuchungen zu Klassifikationsfragen in der Klini- schen Psychologie und Eignungspsychologie in Schule und Beruf gezeigt wurde.
Gegen die Verwendung der Diskriminanzanalyse spricht die Empfindlichkeit dieser Methode gegenüber einer Verletzung der Voraussetzungen für die Anwendung dieses mathematischen Modells, sowie die relativ geringe Stabilität der meisten bisher erzielten Ergebnisse bei Verwen- dung von Kreuzvalidierungen. Folgende Voraussetzungen bestehen bei der Verwendung von Diskriminanzanalysen zur Klassifikation auf der Basis von Testkennwerten:
1.
Die Verteilungen der Kennwerte der Prädiktorvariablen sind für jede nach dem Kriterium gebildete Teilstichprobe multivariat normal,
2. die Varianz-Kovarianz-Matrizen der verwendeten Teilstichproben sind homogen,
3. die Mittelwerte und Kovarianzen der Grundgesamtheiten sind bekannt oder können hin- reichend genau geschätzt werden und
4. linearer Zusammenhänge zwischen der Kriteriumsvariable und den Prädiktorvariablen können angenommen werden.
Während die Diskriminanzanalyse einen vielversprechenden Ansatzpunkt zur statistischen Ur- teilsbildung darstellt, weisen die Eigenschaften des Verfahrens bei einer Verletzung der Vorausset- zungen an die Daten erhebliche Mängel auf. Im Bereich der Personalauswahl und der Verkehrs- psychologie sind, wie sich bei jüngsten, seitens der Anmelderin durchgeführten Untersuchungen herausgestellt hat, derartige Verletzungen der Voraussetzungen dieses Verfahrens allerdings eher die Regel.
Wegen der vielfältigen Probleme bei bekannten statistischen Klassifizierungsmodellen und der sehr häufig geringen Zuverlässigkeit der mit ihnen gewonnenen Bewertungen begegnen Psycholo- gen diesen Testmethoden in der Regel mit Skepsis. Die statistische Methode wird daher oft ledig- lich als Unterstützung der klinischen Methode verwendet.
In der US 5,486,999 wird ein Neuronales Netzwerk für eine personenbezogene Risikoabschät- zung einer Krankenversicherung eingesetzt. Abgesehen davon, dass eine solche Risikoabschät- zung sich inhaltlich und hinsichtlich ihres Zwecks sich grundlegend von einem diagnostischen Verfahren für die Psychologie unterscheidet, sind die zugrunde gelegten Eingangsdaten allge- meinmedizinischer Art und beruhen nicht auf einer psychologischen oder biomedizinischen Aus- wertung des betrachteten Probanden. Dem entsprechend unterscheiden sich auch die Instrumente zur Datenerhebung zwischen dieser Druckschrift und der psychologischen Erhebungen.
Aus dem Stand der Technik sind Verfahren bekannt, bei denen physikalisch messbare, physio- logisch-medizinische Daten zur Abschätzung von möglichem Risikoverhalten des untersuchten Patienten od.dgl. ausgewertet werden. So schlägt z. B. die DE 198 31 109 A1 vor, EEG-Daten von
<Desc/Clms Page number 3>
Früh- und Neugeborenen mithilfe eines Neuronalen Netzwerks auszuwerten, um Störungen der Atemregulation zu erkennen. Die US 5,724,987 betrifft ein Verfahren zur Regulation von Trainings- einheiten auf der Basis neurophysiologischer Ableitungen, bei dem mittels einer Neuronalen Netz- werks physiologische Parameter zu einem Index der Aufmerksamkeit und kognitiven Beanspru- chung verdichtet werden und mit Hilfe dieses Index die Trainingssitzung gesteuert wird.
Die EP 0 699 413 A1 behandelt ein ähnliches Verfahren, bei dem EEG-Signale zur Analyse des phy- siologischen und geistigen Zustands eines Fahrers genutzt werden.
Die Auswertung physiologischer Daten unterscheidet sich jedoch aus verschiedenen Gründen wesentlich von der Bewertung psychologischer Daten, die der Erfindung unterliegen. Physiologi- sche Daten sind naturgemäss messbar, oft sogar mit normierten Methoden, sodass Tendenzen aus dem gemessenen Material klar belegbar und die sich daraus ergebenden Schlussfolgerungen oft auch begründbar sind. Auch die Reproduzierbarkeit ist vielfach wenig problematisch. Die Auswer- tung psychologischer Daten ist dagegen immer noch auf statistische Methoden angewiesen, und die zugrunde liegenden Daten gelten als weniger leicht handhabbar und vergleichbar; zudem ist Gewinnung psychologischer Daten meist schlecht reproduzierbar und somit sind diese Daten mit entsprechenden Unsicherheiten behaftet. Dies wirkt sich zwangsläufig auf die Zuverlässigkeit der daraus abgeleiteten Schlussfolgerungen aus.
Auch findet bei bekannten psychologischen Auswer- teverfahren eine Rückkopplung der Ergebnisse auf die Auswertung nicht statt.
Aufgabe der Erfindung ist es, einen Weg für objektivierbare Klassifizierungen für Rohdaten der eingangs dargestellten Art aufzuzeigen, die eine hohe Zuverlässigkeit aufweisen.
Diese Aufgabe wird gemäss der Erfindung von einer Vorrichtung zum Auswerten nach der ein- gangs genannten Art mit einem Neuronalen Netzwerk gelöst, dem als Eingangsdaten die Daten eines Profilvektors sowie Parameterdaten zur Auswahl abzuleitender Grössen zuführbar sind und das zur Ausgabe von zumindest einer aus den Eingangsdaten gemäss den Parameterdaten abge- leiteten Ergebnisgrösse (5) zur Beurteilung des Probanden eingerichtet ist.
Die Erfindung gestattet die statistische Auswertung der psychologisch/biomedizinischen Daten durch den Einsatz von nichtlinearen Automaten, nämlich Neuronalen Netzen. Diese sind in ver- schiedenen Bereichen der Technik, z. B. bei der Musterkennung, bekannt. In der EP 1 022 632 A1 ist die Verwendung eines Neuronalen Netzes zur Überprüfung der Funktionsfähigkeit eines elektri- schen Geräts beschrieben. Die Erfindung schlägt nun Neuronale Netze für den Einsatz in der Psychologie vor. Im Vergleich zu etablierten Bewertungsmethoden ermöglicht die erfindungsge- mässe Bewertung eine wesentlich höhere Quote der Zuverlässigkeit.
Naturgemäss muss das erfindungsgemäss vorgesehene Neuronale Netzwerk vor seiner eigentli- chen Verwendung trainiert werden. Ausgangspunkt für den Lernprozess des Netzwerks sind die vorab erhobenen Eingangs- und Bewährungswerte eines sogenannten Lernsamples. Darunter versteht man im vorliegenden Anwendungsfall die Rohwerte der einzelnen diagnostischen Verfah- ren (Eingangswerte) für die einzelnen Probanden bzw. die Ausprägung der vorherzusagenden Kriteriumsvariable (Bewährungswerte). Das Netzwerk soll mit Hilfe einer Trainingsphase dazu in die Lage versetzt werden, selbstständig eine Zuordnung für die Personen des Lernsamples durch- zuführen. Sobald ein Netzwerk für einen bestimmten Zweck erstellt und trainiert wurde, kann nun auch die Klassifikation von Einzelbeobachtungen vorgenommen werden, die im Anschluss an das Training in das Netzwerk eingegeben werden.
Das Netzwerk generalisiert seine in Bezug auf das Trainingssample gemachten "Erfahrungen" auf den neu erhobenen Einzelfall.
Im Vergleich zu den bekannten statistischen Methoden der Urteilsbildung weisen Neuronale Netzwerke folgende, für Klassifikationsaufgaben folgende günstige Eigenschaften auf:
1. Neuronale Netzwerke sind lernfähig und veränderbar, d. h., sie können aus vorhande- nen Datenmengen die optimale Zuordnung "erlernen" und verändern sich, sofern ge- wünscht, sukzessiv mit der Einbeziehung neuer (Lern)Daten.
2. Neuronale Netzwerke können nichtlineare Zusammenhänge abbilden.
3. Neuronale Netzwerke gehen von keinen Voraussetzungen hinsichtlich der Dateneigen- schaften und der Verteilung der Prädiktorvariablen aus ; die einzige Voraussetzung der Me- thode betrifft die Vollständigkeit der Datensätze im Lernsample.
Die zweite Eigenschaft, die Nachbildung von Nichtlinearitäten, ist gerade in der Psychologie wichtig, da Menschen nur äusserst selten "linear reagieren" und Moderatorbedingungen den Zu- sammenhang zwischen Verhalten und Kriterium moderieren können, was zu einem nichtlinearen
<Desc/Clms Page number 4>
Zusammenhang der beiden Variablen resultiert.
Diesen Ausführungen zufolge weisen neuronale Netzwerke im Vergleich zu konkurrierenden Methoden der Datenintegration bedeutsame Vorteile bei der Informationsintegration im Rahmen einer statistischen Urteilsbildung auf. Im Gegensatz zu Alternativen wie der Verwendung von Expertensystemen aus dem Bereich der Produktionssysteme bieten sie darüber hinaus auch noch den Vorteil, dass sie auch in Bereichen der Psychologie anwendbar sind, in denen bislang noch keine hinreichende theoretische Wissensbasis in Form vollständig empirisch evaluierter Gesamt- modelle menschlichen Verhaltens verfügbar sind. Dies gilt im Besonderen im Bereich der Ver- kehrspsychologie und anderen Bereichen der angewandten Psychologie, wie z. B. der Risikofor- schung.
In einer bevorzugten Ausführungsform der Erfindung sieht eine dem Neuronalen Netzwerk nachgeordnete Konversionseinrichtung zum Umwandeln der vom Netzwerk gelieferten Ergebnis- grösse(n) in Klartext-Information vor, um die Interpretation der Bewertung weiter zu vereinfachen.
Vorteilhafterweise enthält das Neuronale Netz ein Multilayer Perceptron ("mehrschichtiges Per- zeptron"). Fig. 1 zeigt die an sich bekannte Netzwerktopologie eines Multilayer Perceptrons MLP, das eine Anzahl von Eingangsgrössen E1,E2,...,En erhält und im allgemeinen mehrere Ausgangs- grössen liefert ; sind es beispielsweise zwei Ausgangsgrössen 01,02. Die Topologie ist azyk- lisch (vorwärts gerichtet) in Schichten IL,HL,OL gegliedert. Die Neuronen NI1,NI2....,INn einer ersten Schicht, der Input-Schicht IL, erhalten als Eingabe die Eingangsgrössen E1-En und geben ihre Ausgabesignale an die Neuronen H1,...,Hm einer sogenannten Verborgenen Schicht HL ('hidden layer') weiter. Die Ausgaben der Neuronen H1,...,Hm der Verborgenen Schicht sind mit den Neuronen ON1,ON2 der Output-Schicht OL verbunden.
Im allgemeinen können auch mehr als eine Verborgene Schicht vorgesehen sein (in Fig. 1 nicht gezeigt), wobei dann die Ausgaben einer Verborgenen Schicht jeweils mit der nächsten Verborgenen Schicht verknüpft ist und die letzte Verborgene Schicht die Output-Schicht versorgt. Die von der Output-Schicht gelieferten Ausgabe- grössen 01,02 stellen die von dem Multilayer Perceptron gelieferte Bewertung der Eingangsdaten dar.
Die Verknüpfung zwischen der Input-Schicht IL und der Verborgenen Schicht HL wird bei- spielsweise durch eine mxn-Matrix beschrieben (n= Anzahl der Neuronen der Input-Schicht IL; m = Anzahl der Neuronen der Schicht HL), die für jedes der m Neuronen der Verborgenen Schicht angibt, mit welchem Gewicht die n Ausgabesignale der vorangehenden Schicht IL auf dieses Neuron einwirken, zuzüglich eines m-Vektors, der jedem der m Neuronen jeweils einen konstanten Offset-Wert zuteilt. Entsprechend wird die Verknüpfung zwischen der Verborgenen Schicht HL und der Output-Schicht OL der Fig. 1 durch eine 2xm-Matrix plus einen Offset-Wert beschrieben. Die Übergangsfunktion der Neuronen wurden beispielsweise mit einer sigmoidalen Funktion belegt, z.
B. der logisitischen Funktion f (x) =1/(1+e'"), die auf die Summe der gemäss den Parametern gemäss der Verknüpfungsmatrix gewichteten Outputs der jeweils vorgelagerten Neuronen bzw. (im Fall der Input-Schicht) der Eingangswerte angewendet wird. Das verwendete Multilayer Perceptron kann genau eine Verborgene Schicht aufweisen; zusätzlich ist es in der Regel von Vorteil, wenn die Anzahl der Neuronen in der Verborgenen Schicht grösser ist als die Anzahl der Neuronen in der Eingangsschicht.
Günstigerweise enthält die erfindungsgemässe Bewertevorrichtung einen Speicher zur Speiche- rung von Eingangsdaten (Profilvektor) und Ergebnisdaten vorangegangener Auswertungen, wobei das Neuronale Netzwerk Zugriff auf diesen Speicher hat, z. B. für ein ergänzendes Training oder ein Neutraining des Netzwerks. Insbesondere kann die Vorrichtung dazu eingerichtet sein, nach einer Auswertung eines Profilvektors die zugehörenden Eingangs- und Ergebnisdaten in dem Speicher abzuspeichern und die so ergänzten Daten des Speichers nachfolgenden Auswertungen zugrunde zu legen.
Weiters ist es vorteilhaft, wenn die Eingangsdaten neben aus psychologisch/biometrischen Testung gewonnen Daten weitere Daten umfassen, die aus einem Interview mit dem betreffenden Probanden und/oder einer biographischen Erhebung erhoben wurden.
Naturgemäss muss das erfindungsgemäss verwendete Neuronale Netzwerk vor der Verwen- dung trainiert werden, um das gewünschte abzufragende Ergebnis zu "erlernen". Hierbei ist es vorteilhaft, wenn die Verknüpfungskonfiguration (Verknüpfungsform und Gewichte) des Netzwerks auf einem Training unter Verwendung von Daten beruht, die neben Eingangsdaten auch Bewäh- rungsdaten enthalten, die für den betreffenden Probanden im Zeitraum nach einer bereits getätig-
<Desc/Clms Page number 5>
ten Auswertung erhoben wurden.
Die Erfindung samt weiterer Vorzüge wird im folgenden am Beispiel einer nicht einschränken- den Ausführungsform zur Durchführung verschiedener psychologischer Eignungstests näher erläutert, wobei die beigefügten Zeichnungen herangezogen werden. Die Zeichnungen zeigen in schematischer Form:
Fig. 1 die Architektur eines Multilayer Perceptrons ;
Fig. 2 die Durchführung und Auswertung eines Eignungstests ; Fig. 3 die erfindungsgemässe Testbewertung innerhalb des Eignungstests der Fig. 2.
Bei der im Folgenden dargestellten Bewertungsvorrichtung handelt es sich um eine selbstler- nende und selbstoptimierendes Vorrichtung mit einem zugrundeliegenden Verfahren für die ge- naue Selektion der Probanden nach vorgegebenen Kriterien aus Messergebnissen von anerkann- ten psychologischen Testverfahren.
Dabei wird das Verfahren des neuronalen Netzwerkes auf die Probandendaten unter Zuhilfe- nahme von Auswerteprofilen angewendet. Für die Abbildung im Neuronalen Netzwerk werden ferner weitere Ergebnisdaten früherer Probanden für die Adaption des Netzwerks herangezogen.
Das so entstehende System gestattet ein selbsttätige Optimierung der Ergebnisprofile der Proban- den. Im weitesten Sinn wird eine Datenintegration der Probandendaten mit dem Ziel angewendet, die Schärfe der Ergebnisdaten (d. h. der Kriteriumsvorhersage) zu erhöhen. Somit wird der Aussa- gegehalt und die Zuverlässigkeit der Ergebnisdaten signifikant gesteigert. Diese Methode gestattet eine maschinengestützte Auswertung von Ergebnissen psychologischer Tests und stellt dabei eine deutliche Verbesserung der Ergebnisschärfe im Vergleich zur bislang dominierenden klinischen Methode dar.
Bezugnehmend auf Fig. 2 werden die Messergebnisse des Probanden auf einem psychologi- schen Testplatz 1 erhoben und für die nachfolgende, erfindungsgemässe Auswertung in Form von psychologischen Rohdaten 2 zur Verfügung gestellt. Parallel dazu werden auf anderem Wege erhobene, die Probanden betreffende Daten 3 verwendet, z. B. in einem Interview erhaltene Inter- viewdaten, in einer Anamnese des Probanden erhobene biographische Daten oder "Bewährungs- daten", die durch spätere Rückmeldungen über die Bewährung des betreffenden Probanden gewonnen wurden. Diese Daten 2,3 werden in eine Datenverarbeitungseinheit 6 eingegeben, auf der die erfindungsgemässe Analysevorrichtung unter Verwendung eines Neuronalen Netzes einge- richtet ist.
Unter Auswahl 4 eines Auswerteprofiles (Netzwerkarchitektur und dazugehörige Gewich- te) ermittelt die Datenverarbeitung einen Ergebnisvektor 5. Dieser wird über einen Formatkonverter 7 in eine Klartextausgabe gewandelt und steht somit in lesbarer Form der weiteren Textverarbei- tung oder Archivierung 8 zur Verfügung.
Die für die Auswertung der erfassten Daten erforderliche Datenverarbeitungseinheit 6 basiert auf der Analyse durch ein Neuronales Netzwerk NN und ist in Fig. 3 näher dargestellt. Ein Speicher 9 umfasst einen Probandendatenspeicher 10 und einen Bewährungsdatenspeicher 11. Im Proban- dendatenspeicher 10 werden alle verfügbaren diagnostischen Informationen 12 archiviert, insbe- sondere sämtliche psychologischen Testergebnisse 2, sowie bei Bedarf weitere relevante Proban- den-bezogene Daten 2a, wie Interviewdaten und/oder biographische Daten. Der Bewährungsda- tenspeicher 11 verwaltet die Bewährungsdaten 13. Als Eingangsdaten des Neuronalen Netzwerks NN fungieren die Probandendatenfelder 12.
Diese werden, basierend auf dem jeweils gemäss der Auswahl 4 vorgegebenen Auswerteprofil 14, das als Parameterdaten im Sinne der Erfindung die Art der Bewertung festlegt und in einem Parameterspeicher 15 abgelegt ist, einer Bewertung unterzogen. Daraus resultiert der Ergebnisvektor 5 der sämtliche relevanten Daten des Probanden zur Verfügung stellt.
Bei dem Auswerteprofil 14 handelt es sich um die Kennwerte der Gewichte der Verknüpfungen innerhalb des betreffenden Neuronalen Netzwerks. Jedes Auswerteprofil 14 wurde bei gegebener
Netzstruktur unter zugrunde Legung eines Trainingssamples erlernt. Mittels des Auswerteprofils ist eine einfache und rasche Auswahl von unterschiedlich trainierten Netzwerken nach gegebenen
Erfordernissen möglich. Sämtliche Auswerteprofile sind in dem Parameterspeicher 15 gehalten, der zweckmässigerweise ebenfalls Teil des Speichers 9 ist.
Die Daten des Speichers 14 stehen dem Neuronalen Netz zu dessen Initialisierung, insbeson- dere für das Training, zur Verfügung. Wenn neue Probanden bewertet werden, werden die zugehö- renden Daten in den Probandendatenspeicher 10 aufgenommen; gleiches gilt hinsichtlich des
<Desc/Clms Page number 6>
Bewährungsdatenspeichers 11, wenn zu Probanden neue Ereignisse bekannt werden. Bei einem Training des Neuronalen Netzwerks NN werden neben den zu dem Trainingssample gehörenden Probandendaten (Probandendatenspeicher 10) auch dem Sample zugehörende Bewährungsdaten (Bewährungsdatenspeicher 11) verwendet. Ein wesentlicher Vorteil der Anordnung ist die Anwendung des selbstlernenden Neuronalen Netzwerks auf die Probandendaten unter Zugrundelegung von weiteren Informationen (Bewährungsdaten) von selbigen. Diese Daten werden zum weiter führenden Leinen des Netzwerks verwendet.
Damit kann die Schärfe (die Informationssicherheit) der Ergebnisse iterativ signifikant gegenüber allen anderen bekannten Methoden gesteuert werden.
Im Gegensatz zu den derzeit verwendeten Verfahren, die für die datenverarbeitungsgestützte Testauswertung herangezogen werden können, z. B. der Diskriminanzanalyse, stellt die Verwendung eines selbstlernenden und selbstoptimierenden Neuronalen Netzes eine gravierende Verbesserung der Ergebnissicherheit (von etwa 60% auf 85%) dar, die mit bekannten Methoden bei weitem nicht erreicht werden konnten.
Selbstverständlich ist die Auswahl, welche der zur Verfügung stehenden Daten für das Training der erfindungsgemässen Bewertungsvorrichtung bzw. für die Eingabe bei einer konkreten Probanden-Bewertung verwendet werden, in anderen Ausführungsformen der Erfindung von der hier beschriebenen abweichen. Beispielsweise können in einer Variante der Erfindung z. B. Bewährungsdaten auch als Inputdaten der Bewertung verwendet werden, sofern solche Daten zur Verfügung stehen, oder Teile der Daten wie Test- oder Interviewdaten können dem Training vorbehalten werden.
An folgenden beispielhaften Studien aus dem Bereich der Verkehrspsychologie wurden seitens der Anmelderin bereits erste Studien zur erfindungsgemässen Verwendung neuronaler Netzwerke im Rahmen der statistischen Urteilsbildung durchgeführt.
Kraftfahreignung
In diesem Beispiel wird die Eignung ("Führerschein-Tauglichkeit") von Kraftfahrer-Kandidaten bewertet, die als riskant gelten (z.B. aufgrund früheren auffälligen Verhaltens, Straffälligkeit od.dgl.). Als Datenbasis für die Klassifikation der Kraftfahrer standen die Kennwerte aus fünf verschiedenen Leistungstests aus dem Bereich der Reaktionsfähigkeit und Wahrnehmungsleistung, das Lebensalter und die Zuordnung der Personen hinsichtlich ihrer Fahrtauglichkeit anhand des Fahrstils bzw. eines Globalurteils des Fahrverhaltens vor. Die Daten wurden im Rahmen einer multizentrischen Validierungsstudie erhoben (vgl. Karner & Neuwirth, 2000 ; Sommer,2001).
Der Fahrstil der Untersuchungsteilnehmer wurde über eine hierarchische Clusteranalyse nach dem Ward-Algorithmus, basierend auf der Beurteilung einzelner Dimensionen sicheren Fahrverhaltens während einer standardisierten Fahrprobe ermittelt. Das Globalurteil stellt einen Gesamteindruck des Fahrverhaltens aus der Sicht eines Verkehrspsychologen dar.
Die als Eingangsdaten für die Auswertung verwendeten Grössen werden hinsichtlich des Mittelwerts und der Standardabweichung der jeweils zugrunde liegenden Verteilung z-transformiert.
Bei der in der Statistik bekannten z-Transformation wird von jedem Wert der Mittelwert der Verteilung subtrahiert, und durch anschliessende Division durch die Standardabweichung der zugehörende z-transfomierte Wert erhalten. Durch die z-Transformation wird erreicht, dass die verwendeten Kennwerte - unabhängig von ihrem anfänglichen Wertebereich - einen vergleichbaren Wertebereich annehmen. Dies ist insbesondere bei der Kombination von Reaktionszeiten (typischerweise in der Grössenordnung mehrerer 100 ms) und Zahlen der Richtig-Antworten aus Testverfahren mit unterschiedlicher Postenanzahl von Bedeutung. Die z-transformierten Testresultate der Probanden aus dem Bereich der Reaktionsfähigkeit und Wahrnehmungsleistung, sowie deren Lebensalter stellen die Prädiktoren dar.
Die Beurteilung des Fahrtauglichkeit anhand des Kriteriums Fahrstil oder Gesamturteil in geeignete und nicht geeignete Kraftfahrer bilden die beiden Kriteriumsvariablen für die jeweils ein eigenes neuronales Netzwerk erstellt und trainiert wurde. Es wurden also zwei verschiedene neuronale Netzwerke trainiert, die sich lediglich in der verwendeten Kriteriumsvariable (Globalurteil vs. Fahrstil) - und somit in dem zugehörenden Auswerteprofil - unterscheiden.
Bei dem verwendeten neuronalen Netzwerk handelt es sich jeweils um ein Multilayer
<Desc/Clms Page number 7>
Perceptron, welches aus einer Inputschicht mit sechs Inputeinheiten zur Repräsentation der oben genannten Prädiktorvariablen (= sechs Eingangsvariable), einer einzelnen Verborgenen Schicht mit zehn Einheiten als Zwischenschicht und einer Outputschicht mit zwei Outputeinheiten zur Repräsentation der Ausprägungen der Kriteriumsvariable besteht. Die beiden Output-Neuronen entsprechen hierbei den beiden möglichen Ausprägungen des dichotomen Kriteriums (z. B.: geeig- net oder ungeeignet). Natürlich sind neben dichotomen Kriteriumsvariablen auf mehrkategorielle Kriteriumsvariable denkbar, wie z. B. verschiedene Berufe oder Verwendungszwecke ; einem solchen Fall wären dann entsprechend viele Output-Neuronen vorzusehen.
Die verwendeten Neuronalen Netzwerke wurden mit Hilfe eines kommerziellen Software- Pakets (Math Lab) auf einem PC realisiert. Es wurde eine Vernetzung realisiert, in der jede Einheit der vorausgehenden Schicht mit jeder Einheit der nachfolgenden Schicht verbunden wird (soge- nannte Feedforward-Vollverbringung; in Fig. 1 der Übersichtlichkeit halber nur angedeutet). Als Transferfunktion wird die bekannte Softmax-Funktion eingesetzt, um eine Normierung der Aus- gangsgrössen auf 100% zu erreichen. Beim Lernalgorithmus wurde der bekannte Backpropagation- Algorithmus verwendet.
Die Netzstruktur wurde in der hier beschriebenen Weise definiert, um mögliche nichtlineare Ef- fekt bei einer guten Generalisierbarkeit der Ergebnisse abbilden zu können. Bekanntermassen muss die Anzahl der Einheiten in der Verborgenen Schicht gross genug sein, um die gestellte Aufgabe zu erfüllen, aber auch gering genug, um eine hinreichend gute Generalisierung des Netz- werks zu ermöglichen. Bei der Erstellung eines passenden Netzwerks wurde die Anzahl der Neu- ronen in der Verborgenen Schicht in mehreren Berechnungen anhand der gleichen Datensätze systematisch variiert und die Ergebnisse der verschiedenen Netzwerke für je eines der Kriterien hinsichtlich Generalisierungsfähigkeit und Klassifikationsrate miteinander verglichen. Aus den so gewonnen Ergebnissen wurde eine optimale Zahl der Neuronen in der Verborgenen Schicht be- stimmt.
Auf der Basis von 83 bzw. 65 vollständigen Datensätzen bei den beiden Netzwerken mit den Kriterien Globalurteil bzw. Fahrstilprognose konnte eine Klassifikationsrate von 81 bzw. 78 Prozent bei einer zufriedenstellenden Generalisierung des neuronalen Netzwerks erzielt werden. Im Ver- gleich zu den diskriminanzanalytischen Ergebnissen zeigte sich eine deutliche Überlegenheit des neuronalen Netzwerks, was auf die Existenz nichtlinearer Beziehungen zwischen Kriterium und Prädiktorvariablen hindeuten dürfte.
Die Überprüfung der Generalisierbarkeit erfolgte mit Hilfe der Methode der Teilstichprobenbil- dung wobei bei beiden Kriterien jeweils 10 zufällig ausgewählte Personen als Testsample fungier- ten, anhand derer die Generalisierbarkeit des mit dem nun reduzierten Stichprobenumfang erneut trainierten Netzwerks überprüft wurde. Die Ergebnisse zur Generalisierbarkeit der Ergebnisse weisen auf eine gute Stabilität der erzielten Resultate hin. Für das Kriterium Globalurteil konnte bei dem nun reduzierten Trainingssample von 73 Probanden eine Klassifikationsrate von 86 Prozent richtigen Zuordnungen erzielt werden. Für das Testsampie lag die Klassifikationsrate bei 90 Pro- zent richtiger Zuordnungen, wobei richtig klassifizierte Personen mit 63 bis 99 Prozent Sicherheit richtig zugeordnet wurden, während die Sicherheit der falschen Zuordnung bei 60 Prozent lag.
Die gute Übereinstimmung zwischen der Klassifikationsrate im Lernsampie (86. 3%) und Testsampie (90%) deutet auf eine gute Netzwerkspezifikation.
Flugpsychologie
Als zweites Anwendungsgebiet standen 92 vollständigen Daten einer Testbatterie bestehend aus sieben verschiedenen Testverfahren einer Validierungsstudie zur Auswahl erfolgreicher Absol- venten einer Flugausbildung einer österreichischen Luftlinie (Lauda Airlines), und darüber hinaus Informationen über die erfolgreiche Absolvierung bzw. dem Abbruch der Ausbildung zur Verfügung.
In diesem Anwendungsfall wurde ebenfalls ein Multilayer Perceptron, bestehend aus insgesamt drei Schichten eingesetzt. Das Netzwerk bestand aus elf Inputeinheiten zur Repräsentation der z- transformierten Rohwerte aus den einzelnen Testverfahren, fünfzehn Einheiten der Verborgenen Schicht und den zwei Outputschichteinheiten zur Repräsentation der zwei Merkmalsausprägungen der Kriteriumsvariable Ausbildungserfolg.
In diesem Ausführungsbeispiel zeigte sich ebenso wie bei der Bewertung der Kraftfahrer, dass
<Desc/Clms Page number 8>
die erfindungsgemässe Auswertung der Daten eine überraschend hohe Zuverlässigkeit lieferte.
Während mittels der Diskriminanzanalyse eine richtige Zuordnung der Testpersonen aufgrund der Testwerte in Absolventen und Abbrecher von ca. 72 % gefunden wurde, lieferte das neuronale Netz in 96% der Fälle richtige Zuordnungen. Die Überprüfung der Generalisierbarkeit erfolgte mit Hilfe der Methode der Teilstichprobenbildung wobei bei beiden Kriterien jeweils 10 zufällig ausge- wählte Personen als Testsample fungierten, anhand derer die Generalisierbarkeit des mit dem nun reduzierten Stichprobenumfang erneut trainierten Netzwerks überprüft wurde. Die Ergebnisse zur Generalisierbarkeit der Ergebnisse weisen auf eine gute Stabilität der erzielten Resultate hin. Bei dem nun reduzierten Trainingssample von 82 Probanden eine Klassifikationsrate von 93. 6 Prozent richtigen Zuordnungen erzielt werden.
Für das Testsample lag die Klassifikationsrate bei 80 Pro- zent richtiger Zuordnungen, wobei richtig klassifizierte Personen mit 60 bis 99 Prozent Sicherheit richtig zugeordnet wurden, während die Sicherheit der falschen Zuordnung zwischen 63 bis 68 Prozent lag. Die Übereinstimmung zwischen der Klassifikationsrate im Lernsample (93. 6%) und Testsample (80%) ist als hinreichend gut zu bezeichnen. Die Generalisierung der Ergebnisse des neuronalen Netzwerks kann auch hier als befriedigend beurteilt werden.
Bei den Ergebnisse der Diskriminanzanalyse zeigte sich auch eine deutliche Verletzung der Modellannahmen. Dies bedeutet, dass die Diskriminanzanalyse im Vergleich zu den neuronalen Netzwerken nicht nur zu einer geringeren Klassifikationsrate, sondern auch zu methodisch proble- matischen Ergebnissen, bedingt durch die Verletzung der Modellannahmen, geführt hat. Detailana- lysen, die im Anschluss an die genannten Versuche zur Auswertung mit einem Neuronalen Netz bzw. einer Diskriminanzanalyse durchgeführt wurden, zeigen, dass die beobachteten Unterschiede zwischen beiden Klassifikationsverfahren durch die Existenz nichtlinearer Beziehungen zwischen Prädiktor- und Kriteriumsvariable erklärbar sind.
Wie aus dem oben Gesagten hervorgeht, weisen neuronale Netzwerke im Vergleich zu her- kömmlichen Methoden der Datenintegration einige Vorteile auf. Ein wesentlicher Vorteil besteht in den vergleichsweise geringen Anforderungen an die Daten. Im Beispiel aus der Flugpsychologie konnte gezeigt werden, dass mit Hilfe neuronaler Netzwerke eine Integration der vorliegenden Daten ermöglicht wird, die mit Hilfe der etablierten Methode der Diskriminanzanalyse nicht erziel- bar ist, was im nachhinein auf fehlendes Vorliegen der zugehörenden Voraussetzungen zurück geführt werden konnte.
Neben diesen für praktische Anwendungen wichtigen methodischen Vor- zügen ermöglichen neuronale Netzwerke auch eine angemessene Berücksichtigung nicht-linearer Beziehungen zwischen den Prädiktorvariablen und der gewählten Kriteriumsvariable, die durch einen menschlichen Diagnostiker nicht geleistet werden kann.
PATENTANSPRÜCHE :
1. Vorrichtung zum Auswerten psychologischer und/oder biomedizinischer Rohdaten in Form eines Profilvektors, welcher einen Probanden betreffende, im Rahmen einer psycholo- gisch/biomedizinischen Testung gewonnene Daten umfasst, gekennzeichnet durch ein Neuronales Netzwerk (NN), dem als Eingangsdaten die Daten (12) eines Profilvektors sowie Parameterdaten (14) zur Auswahl abzuleitender Grössen zuführbar sind, und das zur
Ausgabe von zumindest einer aus den Eingangsdaten gemäss den Parameterdaten abge- leiteten Ergebnisgrösse (5) zur Beurteilung des Probanden eingerichtet ist.