Beschreibung
Verfahren und Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse
Die Erfindung betrifft ein Verfahren und eine Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebenen Klassen durch einen Rechner.
Ein Verfahren und eine Anordnung zur Klassifikation eines Textes ist bekannt aus [1] .
Bei der Klassifikation wird ein Objekt einer oder mehreren Klassen zugeordnet (Multi-Klassifikationssystem) , indem ein Zugehörigkeitsmaß für das Objekt bestimmt und mit einem zugehörigen Schwellwert jeder Klasse verglichen wird. Ist das Zugehörigkeitsmaß für die jeweilige Klasse größer als der Schwellwert dieser Klasse, so wird das Objekt der Klasse zugeordnet. Dabei ist es von Nachteil, daß die Schwellwerte aller Klassen global vorbestimmt werden und damit eine ungenaue Klassifikation erfolgt.
Weiterhin ist ein Verfahren zur Lösung eines linearen Gleichungssystems aus [2] bekannt.
Die Aufgabe der Erfindung besteht darin, eine Klassifikation zu ermöglichen, wobei automatisch für mehrere Klassen spezifische Schwellwerte bestimmt werden.
Diese Aufgabe wird gemäß den Merkmalen der unabhängigen
Patentansprüche gelöst. Weiterbildungen der Erfindung ergeben sich auch aus den abhängigen Ansprüchen.
Zur Lösung der Aufgabe wird ein Verfahren zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebener Klassen durch einen Rechner angegeben, bei dem für jede Klasse ein Zugehörigkeitsmaß des Objekts zu der
Klasse ermittelt wird. Für jede Klasse aus der Menge der Klassen wird ein Schwellwert berechnet, indem ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert wird. Das Objekt wird einer Klasse aus der Menge vorgegebener Klassen zugeordnet, falls das Zugehorigkeitsmaß oberhalb des zugehörigen Schwellwerts der Klasse liegt. Im anderen Fall wird ein Objekt einer Klasse aus den mehreren vorgegebenen Klassen nicht zugeordnet, falls das Zugehorigkeitsmaß unterhalb des Schwellwerts der Klasse liegt.
Es ist ein Vorteil, daß f r jede Klasse ein individueller Schwellwert bestimmbar ist, der durch Optimierung des Evaluierungsmaßes direkt klassentypische Voraussetzungen ber cksichtigt .
Eine Weiterbildung besteht darin, daß das Evaluierungsmaß von den Schwellwerten der Klassen abhangt. In diesem Fall ist es von Vorteil, daß die Schwellwerte direkt oder indirekt in das Evaluierungsmaß eingehen.
Auch ist es eine Weiterbildung, daß das Evaluierungsmaß eine der folgenden Spezifikationen umfaßt: a) Anzahl der Fehler; b) Erkennungsrate (Recall); c) Erkennungsrate eines Erkennungssystems (Precision) .
Das Evaluierungsmaß kann auf bestimmte Eigenheiten des zu klassifizierenden Objektes abstellen. Insbesondere ist es nützlich, im Evaluierungsmaß den Fehler der Klassifikation zu berücksichtigen und hinsichtlich bestimmter Vorgaben zu optimieren.
Eine andere Weiterbildung besteht darin, daß das Evaluierungsmaß mit einer Bedingung versehen wird, die mindestens einen vorgegebenen Wert für das Evaluierungsmaß erfordert. Hierbei wird berücksichtigt, daß eine der vorgenannten Spezifikationen mit einem bestimmten Wert
beaufschlagt sind und dies bei der Optimierung des Evaluierungsmaßes unter den vorgegebenen Nebenbedingungen mit berücksichtigt wird.
Eine andere Weiterbildung besteht darin, daß eine zusätzliche Nebenbedingung angegeben wird, indem für alle Klassen ein Mindestwert für ein zusätzliches Evaluierungsmaß vorgegeben wird. Diese zusätzliche Nebenbedingung fließt in die Optimierung des Evaluierungsmaßes mit ein, indem sie zu den vorgegebenen Nebenbedingungen hinzugefügt wird.
Die Nebenbedingungen werden vorzugsweise derart formuliert, daß gilt:
kn + kχ2+. • -+kiM = 1
kNl +
kN2+- • -
+kNM = !
wobei kj_j eine in das Evaluierungsmaß eingehende Ergebnis der Klasse k_ bei Schwellwert Tj , N die Anzahl der Klassen,
M die Anzahl der Schwellwerte Tj bezeichnen und kj_j nur die Werte 0 oder 1 annehmen kann.
Eine Ausgestaltung besteht auch darin, daß das Evaluierungsmaß unter den Nebenbedingungen optimiert wird, indem ein lineares Gleichungssystem (hier: Evaluierungsmaß mit vorgegebenen Nebenbedingungen und gegebenenfalls zusätzliche Nebenbedingung) mittels eines LP-Solvers (siehe [2] ) gelöst wird.
Eine Ausgestaltung besteht auch darin, daß das Verfahren zur Textklassifikation eingesetzt wird. Gerade bei der Textklassifikation ist es üblich, einen vorgegebenen Text unterschiedlichen (thematischen) Klassen, sogenannten
Domänen, zuzuordnen. Dabei kann ein vorgegebener Text naturgemäß mehreren Domänen zugeordnet werden. Die Entscheidung, ob die Zuordnung erfolgt oder nicht, ergibt sich für jede Klasse durch Vergleich des mittels Evaluierungsmaß ermittelten Wertes für den Text mit dem vorgegebenen Schwellwert der Domäne (Klasse) . Es ergibt sich für den Text ein Zugehörigkeitsmaß für jede Klasse, die Zuordnung erfolgt, wenn das Zugehörigkeitsmaß oberhalb des Schwellwerts der jeweiligen Klasse liegt. Dabei sind insbesondere nach dem obengenannten Verfahren die Schwellwerte für die Klasse vorbestimmt worden.
Auch ist es eine Ausgestaltung, daß für jede Klasse ein eigener optimaler Schwellwert bestimmt wird.
Im Rahmen einer zusätzlichen Ausgestaltung wird anhand der ermittelten Schwellwerte für die Klassen eine "microaveraged" Evaluierung durchgeführt. Hierauf wird im Rahmen des Ausführungsbeispiels detailliert eingegangen.
Auch wird zur Lösung der Aufgabe eine Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebenen Klassen angegeben, bei der eine Prozessoreinheit vorgesehen ist, die derart eingerichtet ist, daß
a) für jede Klasse ein Zugehörigkeitsmaß des Objekts zu der Klasse ermittelbar ist;
b) für jede Klasse aus der Menge der Klassen ein Schwellwert berechenbar ist, indem ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert wird;
c) das Objekt einer Klasse aus der Menge vorgegebener Klassen zuordenbar ist, falls das Zugehörigkeitsmaß oberhalb des Schwellwerts der Klasse liegt;
d) das Objekt einer Klasse aus der Menge vorgegebener Klassen nicht zuordenbar ist, falls das Zugehörigkeitsmaß unterhalb des Schwellwerts der Klasse liegt.
Diese Anordnung ist insbesondere geeignet zur Durchführung des erfindungsgemäßen Verfahrens oder einer seiner vorstehend erläuterten Weiterbildungen.
Ausführungsbeispiele der Erfindung werden nachfolgend anhand der Zeichnung dargestellt und erläutert.
Es zeigen
Fig.l ein Blockdiagramm mit Schritten eines Verfahrens zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebener Klassen;
Fig.2 eine Tabelle mit Maßen für eine Textklassifikation;
Fig.3 eine Prozessoreinheit,
In Fig.l ist ein Blockdiagramm mit Schritten eines Verfahrens zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebener Klassen dargestellt. In einem Schritt 101 wird für das Objekt zu jeder Klasse ein Zugehörigkeitsmaß ermittelt. Dies soll Aufschluß darüber geben, ob das Objekt zu der jeweiligen Klasse zuzuordnen ist. Die Zuordnung erfolgt generell, wenn das Zugehörigkeitsmaß einen vorgegebenen Schwellwert (für die Klasse) überschreitet. Zur Ermittlung eines klassenabhängigen Schwellwerts, d.h. zur Bestimmung je eines Schwellwerts für jede Klasse, wird in einem Schritt 102 ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert, wobei das Evaluierungsmaß von den Schwellwerten der Klassen abhängt. Aus der Optimierung ergeben sich Schwellwerte für die Klassen, konkret je ein Schwellwert für jede Klasse. In einem
Schritt 103 wird geprüft, ob das Zugehörigkeitsmaß größer als der jeweilige klassenspezifische Schwellwert ist. Ist dies der Fall, so wird das Objekt gemäß Schritt 104 der jeweiligen Klasse zugeordnet, ansonsten wird keine Zuordnung zu dieser Klasse (vgl. Schritt 105) getroffen. Entsprechend der hier verwendeten Formulierung kann alternativ auch ein Abweichungsmaß anstellte des Zugehörigkeitsmaßes eingesetzt werden, wobei unter Abweichungsmaß lediglich die negierte Formulierung verstanden wird.
Fig.2 zeigt eine Tabelle mit Maßen für eine
Textklassifikation. Eine Anwendungsmöglichkeit der Zuordnung des Objekts zu mindestens einer Klasse besteht in der Textklassifikation. Hier werden vorgegebene Texte unterschiedlichen Klassen (Domänen) zugeordnet, wobei jede Klasse zumeist einem Themenbereich angehört. Eine konkrete Realisierung besteht in der Zuordnung von Zeitungstexten zu einem oder mehreren Themen, z.B. Sport, Literatur, Politik und/oder Wirtschaft. Wie oben angeführt, wird das Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert. Das Evaluierungsmaß selbst kann bestimmte Spezifikationen umfassen. Nachfolgend werden anhand der Tabelle von Fig.2 einige mögliche Spezifikationen näher erläutert. Die Felder 201 bis 204 zeigen mögliche Klassifikationszustände. Das Feld 201 "a" enthält alle vom System automatisch richtig getroffenen
Klassifikationsentscheidungen, die auch tatsächlich richtig, also von einem Experten als richtig beurteilt werden, sind. Feld 202 "b" enthält die Anzahl aller vom System als richtig klassifizierten Zuordnungen, die tatsächlich (nach
Expertenmeinung) falsch sind. In Feld 203 "c" werden die Zahl derjenigen Klassifikationen benannt, die das System als falsch zugeordnet hat, die in Wahrheit aber richtig gewesen wären. Schließlich umfaßt Feld 204 "d" alle falschen Zuordnungen, die auch das System als falsch klassifiziert hat.
Es gibt nun unterschiedliche Spezifikationen, die anhand der obengenannten Größen definiert werden können. Die
Erkennungsrate (Recall) ist definiert als die Anzahl der richtigen (wiedererkannten) Zuordnungen geteilt durch die Anzahl der möglichen Zuordnungen:
Recall = !2) a + c
Eine Erkennungsrate (Precision) ist bestimmt durch die Anzahl der richtigen Zuordnungen geteilt durch die Anzahl aller automatischen Zuordnungen:
a Precision a + b
Ein Fehler des Systems (Fallout) ist bestimmt durch
Fallout (4!
Eine Fehlerrate ist bestimmt durch
b + c
Errorrate = (5) a + b + c + d
Die benannten Spezifikationen Gleichung (2) bis Gleichung (5) eignen sich, die Klassifizierungsqualität in Form eines geeigneten Evaluierungsmaßes Q anzugeben. Das Evaluierungsmaß kann zum einen direkt über alle Klassen ( " icroaveraged" Evaluierungsmaß) bestimmt werden:
wobei N die Anzahl der Klassen k bezeichnet.
Auch wird das Evaluierungsmaß alternativ zuerst für jede Klasse einzeln bestimmt und danach über alle Klassen gemittelt ( "macroaveraged" Evaluierungsmaß):
Q.(kl) + Q(k2)+...+θ(kN)
N
Wie bereits erwähnt, ist im allgemeinen nicht davon auszugehen, daß ein und derselbe Schwellwert für alle Klassen eine ausreichend hohe Qualität der Zuordnung (Klassifikation) gewährleistet. Eine Bestimmung je eines Schwellwerts für jede Klasse soll demnach erfolgen, so daß die
Klassifikationsqualität insgesamt möglichst hoch ist. Bei der Variante "macroaveraged" Evaluierungsmaß erfolgt dies, indem für jede Klasse der Wert als Schwellwert bestimmt wird, der das Evaluierungsmaß für diese Klasse optimiert:
Q-(l) + θ(k2)+...+Q(kN) — -—- = ax <=>
N (8) .
C(kι) + Q.(k2)+. - -+θ(kN) = max
Im Falle des "microaveraged" Evaluierungsmaßes funktioniert Gleichung (8) nicht. Gesucht wird hier eine Menge von Schwellwerten
{L, T2, ... , TN}
die eine Ungleichverteilung der Klassen mitberücksichtigt. Wenn z.B. eine Klasse ki doppelt so oft vorkommt wie eine Klasse k2, so geht dies in Gleichung (7) nicht ein und wird somit bei der Klassifikationsqualität insgesamt nicht ausreichend berücksichtigt.
Die beste Menge von Schwellwerten (vgl. Gleichung (9)) wird bestimmt, indem ein lineares Optimierungsproblem formuliert und mittels linearer Programmierung (vgl. LP-Solver) gelöst wird. Mit einer Trainingsmenge von Objekten, deren
Klassifikation bekannt ist, wird mit M unterschiedlichen Schwellwerten eine Evaluierung durchgeführt. Dabei steht im folgenden für das m das Evaluierungsmaß Q eingehende Ergebnis der Klasse kx bei einem Schwellwert T-, . Das zu losende lineare Optimierungsproblem wird wie folgt formuliert :
Zielfunktion: max Q(kn, k]_
2, ... , kι
M, ... ,
(10)
Nebenbedingungen : kl l + 12+- • -+ lM = 1 21 + k22+- • -+ 2M = 1 di; kNl + N2+- • -+kNM = 1
Anhand der Nebenbedingungen geht m das Evaluierungsmaß Q jeweils nur ein Ergebnis pro Klasse ein (kx-| nimmt nur die Werte 0 oder 1 an) . Die Menge der k-,_-,, also
{kla> 2b' • ••/ Nz} (12),
die die Zielfunktion maximieren, sind die Losung des
Optimierungsproblems . Für die Optimierung des "microaveraged" Evaluierungsmaßes bedeutet dies, daß mit den Schwellwerten Ta für die Klasse kj_, T^ für die Klasse k2, ... und Tz für die Klasse k^ ein optimiertes Ergebnis erzielt wird.
Dieses Verfahren kann auch angewandt werden, wenn die Gute des Klassifikationssystems durch zwei Evaluierungsmaße Q]_ und Q2 anzugeben ist, z.B. anhand von Recall und Precision (siehe obige Ausfuhrung) . Dabei wird durch Hinzuf gen einer zusatzlichen Nebenbedingung das Gleichungssystem optimiert:
Zielfunktion: F8 max Q_(kn, k^2^ • • - > klM> • • • > kNl' kN2' • • • > kNMJ
Nebenbedingungen: F9 ll + k12+- • -+klM = 1 k21 + 22+- - -+k2M = 1
kNl + kN2+- • -+kNM = 1
Qi(kll' k12' • • • ' klM' • • • ' kNl' kN2' • • • ' kNMJ ≥ x (13) ,
5 wobei X einen vorgegebenen Mindestwert für das Evaluierungsmaß Q^ bezeichnet.
Im Hinblick auf die obigen Ausführungen, insbesondere Fig.2, werden folgende Definitionen vereinbart:
10
„τ, „ . . al' a2, ... , aN
MIC Precision = η ^ 7 r (15),
(al r a2, ... , aN + \blf b2, ... , bNj
al + a2 + +_ a
1 ,5, „MA..C_ DRecalιlπ = al + cl a2 + c2 aN + CN I(1e6.. ,
N
N
wobei MIC "microaveraged" und MAC "macroaveraged" bezeichnen. 20 Die Bezeichnungen a_, b_, C_ und dj_ geben die jeweiligen
Werte der Tabelle aus Fig.2 beschränkt auf die Klasse kj_ an.
In Fig.3 ist eine Prozessoreinheit PRZE dargestellt. Die Prozessoreinheit PRZE umfaßt einen Prozessor CPU, einen 25 Speicher SPE und eine Input/Output-Schnittstelle IOS, die über ein Interface IFC auf unterschiedliche Art und Weise genutzt wird: Über eine Grafikschnittstelle wird eine Ausgabe auf einem Monitor MON sichtbar und/oder auf einem Drucker PRT ausgegeben. Eine Eingabe erfolgt über eine Maus MAS oder eine
Tastatur TAST. Auch verfügt die Prozessoreinheit PRZE über einen Datenbus BUS, der die Verbindung von einem Speicher MEM, dem Prozessor CPU und der Input/Output-Schnittstelle IOS gewährleistet. Weiterhin sind an den Datenbus BUS zusätzliche Komponenten anschließbar, z.B. zusätzlicher Speicher, Datenspeicher (Festplatte) oder Scanner.
Literaturverzeichnis :
[1] W097/38382, "Verfahren zur automatischen Klassifikation eines auf einem Dokument aufgebrachten Textes nach dessen Transformation in digitale Daten".
[2] http: //www.wior.uni-karlsruhe.de/Bibliothek/Software_for_ OR/Linear_Programming/pub/lp_solve/index .html, 28.09.1998