WO2000019335A1

WO2000019335A1 - Verfahren und anordnung zur zuordnung eines objekts zu mindestens einer klasse

Info

Publication number: WO2000019335A1
Application number: PCT/DE1999/002929
Authority: WO
Inventors: Thomas BRÜCKNER
Original assignee: Siemens Aktiengesellschaft
Priority date: 1998-09-30
Filing date: 1999-09-14
Publication date: 2000-04-06
Also published as: US20020007381A1; EP1118060A1

Abstract

Es wird ein Objekt zu mindestens einer Klasse aus einer Menge von Klassen zugeordnet, indem für das Objekt zu jeder Klasse ein Zugehörigkeitsmaß bestimmt wird. Dabei werden klassenabhängige Schwellwerte für die Zuordnung bestimmt, indem ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert wird. Ein Vergleich des Zugehörigkeitsmaßes mit den Schwellwerten der Klassen ergibt die entsprechende Zuordnung des Objekts zu mindestens einer Klasse.

Description

Beschreibung

Verfahren und Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse

Die Erfindung betrifft ein Verfahren und eine Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebenen Klassen durch einen Rechner.

Ein Verfahren und eine Anordnung zur Klassifikation eines Textes ist bekannt aus [1] .

Bei der Klassifikation wird ein Objekt einer oder mehreren Klassen zugeordnet (Multi-Klassifikationssystem) , indem ein Zugehörigkeitsmaß für das Objekt bestimmt und mit einem zugehörigen Schwellwert jeder Klasse verglichen wird. Ist das Zugehörigkeitsmaß für die jeweilige Klasse größer als der Schwellwert dieser Klasse, so wird das Objekt der Klasse zugeordnet. Dabei ist es von Nachteil, daß die Schwellwerte aller Klassen global vorbestimmt werden und damit eine ungenaue Klassifikation erfolgt.

Weiterhin ist ein Verfahren zur Lösung eines linearen Gleichungssystems aus [2] bekannt.

Die Aufgabe der Erfindung besteht darin, eine Klassifikation zu ermöglichen, wobei automatisch für mehrere Klassen spezifische Schwellwerte bestimmt werden.

Diese Aufgabe wird gemäß den Merkmalen der unabhängigen

Patentansprüche gelöst. Weiterbildungen der Erfindung ergeben sich auch aus den abhängigen Ansprüchen.

Zur Lösung der Aufgabe wird ein Verfahren zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebener Klassen durch einen Rechner angegeben, bei dem für jede Klasse ein Zugehörigkeitsmaß des Objekts zu der Klasse ermittelt wird. Für jede Klasse aus der Menge der Klassen wird ein Schwellwert berechnet, indem ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert wird. Das Objekt wird einer Klasse aus der Menge vorgegebener Klassen zugeordnet, falls das Zugehorigkeitsmaß oberhalb des zugehörigen Schwellwerts der Klasse liegt. Im anderen Fall wird ein Objekt einer Klasse aus den mehreren vorgegebenen Klassen nicht zugeordnet, falls das Zugehorigkeitsmaß unterhalb des Schwellwerts der Klasse liegt.

Es ist ein Vorteil, daß f r jede Klasse ein individueller Schwellwert bestimmbar ist, der durch Optimierung des Evaluierungsmaßes direkt klassentypische Voraussetzungen ber cksichtigt .

Eine Weiterbildung besteht darin, daß das Evaluierungsmaß von den Schwellwerten der Klassen abhangt. In diesem Fall ist es von Vorteil, daß die Schwellwerte direkt oder indirekt in das Evaluierungsmaß eingehen.

Auch ist es eine Weiterbildung, daß das Evaluierungsmaß eine der folgenden Spezifikationen umfaßt: a) Anzahl der Fehler; b) Erkennungsrate (Recall); c) Erkennungsrate eines Erkennungssystems (Precision) .

Das Evaluierungsmaß kann auf bestimmte Eigenheiten des zu klassifizierenden Objektes abstellen. Insbesondere ist es nützlich, im Evaluierungsmaß den Fehler der Klassifikation zu berücksichtigen und hinsichtlich bestimmter Vorgaben zu optimieren.

Eine andere Weiterbildung besteht darin, daß das Evaluierungsmaß mit einer Bedingung versehen wird, die mindestens einen vorgegebenen Wert für das Evaluierungsmaß erfordert. Hierbei wird berücksichtigt, daß eine der vorgenannten Spezifikationen mit einem bestimmten Wert beaufschlagt sind und dies bei der Optimierung des Evaluierungsmaßes unter den vorgegebenen Nebenbedingungen mit berücksichtigt wird.

Eine andere Weiterbildung besteht darin, daß eine zusätzliche Nebenbedingung angegeben wird, indem für alle Klassen ein Mindestwert für ein zusätzliches Evaluierungsmaß vorgegeben wird. Diese zusätzliche Nebenbedingung fließt in die Optimierung des Evaluierungsmaßes mit ein, indem sie zu den vorgegebenen Nebenbedingungen hinzugefügt wird.

Die Nebenbedingungen werden vorzugsweise derart formuliert, daß gilt:

kn + kχ2+. • -+kiM = 1

^kNl + ^kN2+- • -^+kNM = !

wobei kj_j eine in das Evaluierungsmaß eingehende Ergebnis der Klasse k_ bei Schwellwert Tj , N die Anzahl der Klassen,

M die Anzahl der Schwellwerte Tj bezeichnen und kj_j nur die Werte 0 oder 1 annehmen kann.

Eine Ausgestaltung besteht auch darin, daß das Evaluierungsmaß unter den Nebenbedingungen optimiert wird, indem ein lineares Gleichungssystem (hier: Evaluierungsmaß mit vorgegebenen Nebenbedingungen und gegebenenfalls zusätzliche Nebenbedingung) mittels eines LP-Solvers (siehe [2] ) gelöst wird.

Eine Ausgestaltung besteht auch darin, daß das Verfahren zur Textklassifikation eingesetzt wird. Gerade bei der Textklassifikation ist es üblich, einen vorgegebenen Text unterschiedlichen (thematischen) Klassen, sogenannten Domänen, zuzuordnen. Dabei kann ein vorgegebener Text naturgemäß mehreren Domänen zugeordnet werden. Die Entscheidung, ob die Zuordnung erfolgt oder nicht, ergibt sich für jede Klasse durch Vergleich des mittels Evaluierungsmaß ermittelten Wertes für den Text mit dem vorgegebenen Schwellwert der Domäne (Klasse) . Es ergibt sich für den Text ein Zugehörigkeitsmaß für jede Klasse, die Zuordnung erfolgt, wenn das Zugehörigkeitsmaß oberhalb des Schwellwerts der jeweiligen Klasse liegt. Dabei sind insbesondere nach dem obengenannten Verfahren die Schwellwerte für die Klasse vorbestimmt worden.

Auch ist es eine Ausgestaltung, daß für jede Klasse ein eigener optimaler Schwellwert bestimmt wird.

Im Rahmen einer zusätzlichen Ausgestaltung wird anhand der ermittelten Schwellwerte für die Klassen eine "microaveraged" Evaluierung durchgeführt. Hierauf wird im Rahmen des Ausführungsbeispiels detailliert eingegangen.

Auch wird zur Lösung der Aufgabe eine Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebenen Klassen angegeben, bei der eine Prozessoreinheit vorgesehen ist, die derart eingerichtet ist, daß

a) für jede Klasse ein Zugehörigkeitsmaß des Objekts zu der Klasse ermittelbar ist;

b) für jede Klasse aus der Menge der Klassen ein Schwellwert berechenbar ist, indem ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert wird;

c) das Objekt einer Klasse aus der Menge vorgegebener Klassen zuordenbar ist, falls das Zugehörigkeitsmaß oberhalb des Schwellwerts der Klasse liegt; d) das Objekt einer Klasse aus der Menge vorgegebener Klassen nicht zuordenbar ist, falls das Zugehörigkeitsmaß unterhalb des Schwellwerts der Klasse liegt.

Diese Anordnung ist insbesondere geeignet zur Durchführung des erfindungsgemäßen Verfahrens oder einer seiner vorstehend erläuterten Weiterbildungen.

Ausführungsbeispiele der Erfindung werden nachfolgend anhand der Zeichnung dargestellt und erläutert.

Es zeigen

Fig.l ein Blockdiagramm mit Schritten eines Verfahrens zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebener Klassen;

Fig.2 eine Tabelle mit Maßen für eine Textklassifikation;

Fig.3 eine Prozessoreinheit,

In Fig.l ist ein Blockdiagramm mit Schritten eines Verfahrens zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebener Klassen dargestellt. In einem Schritt 101 wird für das Objekt zu jeder Klasse ein Zugehörigkeitsmaß ermittelt. Dies soll Aufschluß darüber geben, ob das Objekt zu der jeweiligen Klasse zuzuordnen ist. Die Zuordnung erfolgt generell, wenn das Zugehörigkeitsmaß einen vorgegebenen Schwellwert (für die Klasse) überschreitet. Zur Ermittlung eines klassenabhängigen Schwellwerts, d.h. zur Bestimmung je eines Schwellwerts für jede Klasse, wird in einem Schritt 102 ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert, wobei das Evaluierungsmaß von den Schwellwerten der Klassen abhängt. Aus der Optimierung ergeben sich Schwellwerte für die Klassen, konkret je ein Schwellwert für jede Klasse. In einem Schritt 103 wird geprüft, ob das Zugehörigkeitsmaß größer als der jeweilige klassenspezifische Schwellwert ist. Ist dies der Fall, so wird das Objekt gemäß Schritt 104 der jeweiligen Klasse zugeordnet, ansonsten wird keine Zuordnung zu dieser Klasse (vgl. Schritt 105) getroffen. Entsprechend der hier verwendeten Formulierung kann alternativ auch ein Abweichungsmaß anstellte des Zugehörigkeitsmaßes eingesetzt werden, wobei unter Abweichungsmaß lediglich die negierte Formulierung verstanden wird.

Fig.2 zeigt eine Tabelle mit Maßen für eine

Textklassifikation. Eine Anwendungsmöglichkeit der Zuordnung des Objekts zu mindestens einer Klasse besteht in der Textklassifikation. Hier werden vorgegebene Texte unterschiedlichen Klassen (Domänen) zugeordnet, wobei jede Klasse zumeist einem Themenbereich angehört. Eine konkrete Realisierung besteht in der Zuordnung von Zeitungstexten zu einem oder mehreren Themen, z.B. Sport, Literatur, Politik und/oder Wirtschaft. Wie oben angeführt, wird das Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert. Das Evaluierungsmaß selbst kann bestimmte Spezifikationen umfassen. Nachfolgend werden anhand der Tabelle von Fig.2 einige mögliche Spezifikationen näher erläutert. Die Felder 201 bis 204 zeigen mögliche Klassifikationszustände. Das Feld 201 "a" enthält alle vom System automatisch richtig getroffenen

Klassifikationsentscheidungen, die auch tatsächlich richtig, also von einem Experten als richtig beurteilt werden, sind. Feld 202 "b" enthält die Anzahl aller vom System als richtig klassifizierten Zuordnungen, die tatsächlich (nach

Expertenmeinung) falsch sind. In Feld 203 "c" werden die Zahl derjenigen Klassifikationen benannt, die das System als falsch zugeordnet hat, die in Wahrheit aber richtig gewesen wären. Schließlich umfaßt Feld 204 "d" alle falschen Zuordnungen, die auch das System als falsch klassifiziert hat. Es gibt nun unterschiedliche Spezifikationen, die anhand der obengenannten Größen definiert werden können. Die

Erkennungsrate (Recall) ist definiert als die Anzahl der richtigen (wiedererkannten) Zuordnungen geteilt durch die Anzahl der möglichen Zuordnungen:

Recall = !2) a + c

Eine Erkennungsrate (Precision) ist bestimmt durch die Anzahl der richtigen Zuordnungen geteilt durch die Anzahl aller automatischen Zuordnungen:

a Precision a + b

Ein Fehler des Systems (Fallout) ist bestimmt durch

Fallout (4!

Eine Fehlerrate ist bestimmt durch

b + c

Errorrate = (5) a + b + c + d

Die benannten Spezifikationen Gleichung (2) bis Gleichung (5) eignen sich, die Klassifizierungsqualität in Form eines geeigneten Evaluierungsmaßes Q anzugeben. Das Evaluierungsmaß kann zum einen direkt über alle Klassen ( " icroaveraged" Evaluierungsmaß) bestimmt werden:

wobei N die Anzahl der Klassen k bezeichnet. Auch wird das Evaluierungsmaß alternativ zuerst für jede Klasse einzeln bestimmt und danach über alle Klassen gemittelt ( "macroaveraged" Evaluierungsmaß):

Q.(^kl) + Q(k₂)+...+θ(k_N)

N

Wie bereits erwähnt, ist im allgemeinen nicht davon auszugehen, daß ein und derselbe Schwellwert für alle Klassen eine ausreichend hohe Qualität der Zuordnung (Klassifikation) gewährleistet. Eine Bestimmung je eines Schwellwerts für jede Klasse soll demnach erfolgen, so daß die

Klassifikationsqualität insgesamt möglichst hoch ist. Bei der Variante "macroaveraged" Evaluierungsmaß erfolgt dies, indem für jede Klasse der Wert als Schwellwert bestimmt wird, der das Evaluierungsmaß für diese Klasse optimiert:

Q-(l) + θ(k₂)+...+Q(k_N) — -—- = ax <=>

^N (8) .

C(kι) + Q.(k₂)+. - -+θ(k_N) = max

Im Falle des "microaveraged" Evaluierungsmaßes funktioniert Gleichung (8) nicht. Gesucht wird hier eine Menge von Schwellwerten

{_L, T₂, ... , T_N}

die eine Ungleichverteilung der Klassen mitberücksichtigt. Wenn z.B. eine Klasse ki doppelt so oft vorkommt wie eine Klasse k₂, so geht dies in Gleichung (7) nicht ein und wird somit bei der Klassifikationsqualität insgesamt nicht ausreichend berücksichtigt.

Die beste Menge von Schwellwerten (vgl. Gleichung (9)) wird bestimmt, indem ein lineares Optimierungsproblem formuliert und mittels linearer Programmierung (vgl. LP-Solver) gelöst wird. Mit einer Trainingsmenge von Objekten, deren Klassifikation bekannt ist, wird mit M unterschiedlichen Schwellwerten eine Evaluierung durchgeführt. Dabei steht im folgenden für das m das Evaluierungsmaß Q eingehende Ergebnis der Klasse k_x bei einem Schwellwert T-, . Das zu losende lineare Optimierungsproblem wird wie folgt formuliert :

Zielfunktion: max Q(kn, k]_₂, ... , kι_M, ... ,

(10)

Nebenbedingungen : ^kl l + 12+- ^• -+ lM = 1 21 + ^k22+- ^• -⁺ 2M = 1 di; ^kNl + N2+- • -+^kNM = 1

Anhand der Nebenbedingungen geht m das Evaluierungsmaß Q jeweils nur ein Ergebnis pro Klasse ein (k_x-_| nimmt nur die Werte 0 oder 1 an) . Die Menge der k-,_-,, also

{^kla> 2b' • ••/ Nz} (12),

die die Zielfunktion maximieren, sind die Losung des

Optimierungsproblems . Für die Optimierung des "microaveraged" Evaluierungsmaßes bedeutet dies, daß mit den Schwellwerten T_a für die Klasse k_j_, T^ für die Klasse k₂, ... und T_z für die Klasse k^ ein optimiertes Ergebnis erzielt wird.

Dieses Verfahren kann auch angewandt werden, wenn die Gute des Klassifikationssystems durch zwei Evaluierungsmaße Q_]_ und Q₂ anzugeben ist, z.B. anhand von Recall und Precision (siehe obige Ausfuhrung) . Dabei wird durch Hinzuf gen einer zusatzlichen Nebenbedingung das Gleichungssystem optimiert:

Zielfunktion: F8 max Q_(kn, k^₂^ • • - > ^klM> • • • > ^kNl' ^kN2' • • • > ^kNMJ Nebenbedingungen: F9 ll + ^k12+- ^• -^+klM = 1 ^k21 + 22+- - -^+k2M = 1

^kNl + ^kN2+- ^• -+^kNM = 1

Qi(^kll' ^k12' • • • ' ^klM' • • • ' ^kNl' ^kN2' • • • ' ^kNMJ ^{≥ x} (13⁾ ,

5 wobei X einen vorgegebenen Mindestwert für das Evaluierungsmaß Q^ bezeichnet.

Im Hinblick auf die obigen Ausführungen, insbesondere Fig.2, werden folgende Definitionen vereinbart:

10

MIC Recall = (14),

„_τ, „ . . ^al' a₂, ... , a_N

MIC Precision = η ^ 7 r (15),

(a_{l r} a₂, ... , a_N + \b_lf b₂, ... , b_Nj

^al ₊ ^a2 _{+ +}_ ^a

1 ,5, „MA..C_ _DRecal_ιl_π = ^al + ^cl ^a2 + ^c2 ^aN + ^CN _I(1_e6.. ,

N

MAC Precision =

(17),

N

wobei MIC "microaveraged" und MAC "macroaveraged" bezeichnen. 20 Die Bezeichnungen a_, b_, C_ und dj_ geben die jeweiligen

Werte der Tabelle aus Fig.2 beschränkt auf die Klasse k_j_ an.

In Fig.3 ist eine Prozessoreinheit PRZE dargestellt. Die Prozessoreinheit PRZE umfaßt einen Prozessor CPU, einen 25 Speicher SPE und eine Input/Output-Schnittstelle IOS, die über ein Interface IFC auf unterschiedliche Art und Weise genutzt wird: Über eine Grafikschnittstelle wird eine Ausgabe auf einem Monitor MON sichtbar und/oder auf einem Drucker PRT ausgegeben. Eine Eingabe erfolgt über eine Maus MAS oder eine Tastatur TAST. Auch verfügt die Prozessoreinheit PRZE über einen Datenbus BUS, der die Verbindung von einem Speicher MEM, dem Prozessor CPU und der Input/Output-Schnittstelle IOS gewährleistet. Weiterhin sind an den Datenbus BUS zusätzliche Komponenten anschließbar, z.B. zusätzlicher Speicher, Datenspeicher (Festplatte) oder Scanner.

Literaturverzeichnis :

[1] W097/38382, "Verfahren zur automatischen Klassifikation eines auf einem Dokument aufgebrachten Textes nach dessen Transformation in digitale Daten".

[2] http: //www.wior.uni-karlsruhe.de/Bibliothek/Software_for_ OR/Linear_Programming/pub/lp_solve/index .html, 28.09.1998

Claims

Patentansprüche

1. Verfahren zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebenen Klassen durch einen Rechner,

a) bei dem für jede Klasse ein Zugehörigkeitsmaß des Objekts zu der Klasse ermittelt wird;

b) bei dem für jede Klasse aus der Menge der Klassen ein Schwellwert berechnet wird, indem ein Evaluierungsmaß unter vorgegebenen Nebenbedingungen optimiert wird;

c) bei dem das Objekt einer Klasse aus der Menge vorgegebener Klassen zugeordnet wird, falls das

Zugehörigkeitsmaß oberhalb des Schwellwerts der Klasse liegt;

d) bei dem das Objekt einer Klasse aus der Menge vorgegebener Klassen nicht zugeordnet wird, falls das

Zugehörigkeitsmaß unterhalb des Schwellwerts der Klasse liegt.

2. Verfahren nach Anspruch 1, bei dem das Evaluierungsmaß von den Schwellwerten der Klassen abhängt.

3. Verfahren nach Anspruch 1 oder 2, bei dem das Evaluierungsmaß eine der folgenden Spezifikationen umfaßt: a) Anzahl der Fehler; b) Erkennungsrate (Recall) ; c) Erkennungsrate eines Erkennungssystems (Precision) .

4. Verfahren nach Anspruch 3, bei dem das Evaluierungsmaß mit einer Bedingung versehen wird, die mindestens einen vorgegebenen Wert für das Evaluierungsmaß erfordert.

5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem eine zusatzliche Nebenbedingungen angegeben wird, indem für alle Klassen ein Mindestwert eines zusätzlichen Evaluierungsmaßes vorgegeben wird.

6. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Nebenbedingungen derart formuliert werden, daß gilt:

^kll + ^k12+- • -^+klM = 1 ^k21 + ^k22+- --+^k2M = 1

^kNl ^{+ k}N2+- • -^+kNM ⁼ 1

wobei k_-_j eine m das Evaluierungsmaß eingehende Ergebnis der Klasse k_x bei Schwellwert T-_j ,

N die Anzahl der Klassen,

M die Anzahl der Schwellwerte T-, bezeichnen und k_-, nur die Werte 0 oder 1 annehmen kann.

7. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Evaluierungsmaß unter den Nebenbedingungen optimiert wird, indem ein lineares Gleichungssystem mittels eines LP-Solvers gelost wird.

8. Verfahren nach einem der vorhergehenden Ansprüche, bei dem eine Textklassifikation durchgeführt wird.

9. Verfahren nach Anspruch 8, bei dem die Klassen bei der Textklassifikation Domänen sind.

10. Verfahren nach einem der vorhergehenden Ansprüche, bei dem für jede Klasse ein eigener optimaler Schwellwert bestimmt wird.

11. Verfahren nach einem der vorhergehenden Ansprüche, bei dem anhand der ermittelten Schwellwerte für die Klassen eine "microaveraged" Evaluierung optimiert wird.

12. Anordnung zur Zuordnung eines Objekts zu mindestens einer Klasse aus einer Menge vorgegebenen Klassen, bei der eine Prozessoreinheit vorgesehen ist, die derart eingerichtet ist, daß

c) das Objekt einer Klasse aus der Menge vorgegebener Klassen zuordenbar ist, falls das Zugehörigkeitsmaß oberhalb des Schwellwerts der Klasse liegt;

das Objekt einer Klasse aus der Menge vorgegebener Klassen nicht zuordenbar ist, falls das Zugehörigkeitsmaß unterhalb des Schwellwerts der Klasse liegt.