DE10045360A1 - Verfahren zur Klassifizierung von Dokumenten - Google Patents
Verfahren zur Klassifizierung von DokumentenInfo
- Publication number
- DE10045360A1 DE10045360A1 DE10045360A DE10045360A DE10045360A1 DE 10045360 A1 DE10045360 A1 DE 10045360A1 DE 10045360 A DE10045360 A DE 10045360A DE 10045360 A DE10045360 A DE 10045360A DE 10045360 A1 DE10045360 A1 DE 10045360A1
- Authority
- DE
- Germany
- Prior art keywords
- document
- features
- determined
- documents
- significant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 55
- 230000006978 adaptation Effects 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000000556 factor analysis Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 6
- 230000007257 malfunction Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000012512 characterization method Methods 0.000 abstract 1
- 238000012935 Averaging Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2131—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D11/00—Devices accepting coins; Devices accepting, dispensing, sorting or counting valuable papers
- G07D11/50—Sorting or counting valuable papers
Abstract
Die Erfindung betrifft ein Verfahren zur Klassifizierung von Dokumenten, insbesondere Banknoten, bei welchem anhand von Merkmalen eines zu klassifizierenden Dokuments eine Klasse aus mehreren möglichen Klassen ermittelt wird. DOLLAR A Zur Beschleunigung der Klassifizierung bei gleichzeitig hoher Zuverlässigkeit ist vorgesehen, daß aus den Merkmalen des Dokuments solche Merkmale ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Merkmale des Dokuments, und anhand der ausgewählten Merkmale die Klasse für das Dokument ermittelt wird. Dokumente verschiedener Klassen unterscheiden sich hierbei in den ausgewählten Merkmalen deutlicher als in den übrigen Merkmalen. DOLLAR A Eine bevorzugte Ausführung des Verfahrens sieht vor, daß die auszuwählenden Merkmale in einem separaten Adaptionsprozeß anhand von Referenzdokumenten ermittelt werden. Die Merkmale der Referenzdokumente werden hierbei zu Referenzvektoren zusammengefaßt, aus welchen mittels Faktorenanalyse (PCA) signifikante Komponenten ermittelt werden, welche den auszuwählenden Merkmalen des zu klassifizierenden Dokuments entsprechen.
Description
Die Erfindung betrifft ein Verfahren zur Klassifizierung von Dokumenten,
insbesondere Banknoten, bei welchem Merkmale eines zu klassifizierenden
Dokuments ermittelt werden und anhand der Merkmale des Dokuments
eine Klasse aus mehreren möglichen Klassen für das Dokument ermittelt
wird.
Klassifizierungsverfahren werden unter anderem bei der Erkennung und
gegebenenfalls Sortierung von Banknoten in Banknotenbearbeitungsmaschi
nen oder Geldeingabeautomaten eingesetzt. Hierbei werden zunächst physi
kalische Eigenschaften der zu klassifizierenden Banknote gemessen und dar
aus eine Vielzahl von Merkmalen der Banknote abgeleitet. Anhand der
Merkmale wird dann mit Hilfe von Klassifizierungskriterien eine Masse
ermittelt, d. h. aus mehreren möglichen Klassen ausgewählt, und der Bank
note zugeordnet. In einem anschließenden Sortiervorgang kann die Bankno
te dann in ein für die ermittelte Klasse vorgesehenes Sortierfach ausgegeben
werden, um von dort aus weiteren Bearbeitungsschritten, ggf. einer Wieder
ausgabe, zugeführt zu werden.
Die bekannten Verfahren zur Klassifizierung von Dokumenten sind jedoch
wegen der im allgemeinen großen Anzahl der zur Ermittlung der Klasse
herangezogenen Merkmale sehr zeitintensiv. Infolgedessen ist eine Klassifi
zierung der Dokumente in Echtzeit kaum realisierbar.
Darüber hinaus werden die erforderlichen Klassifizierungskriterien meist in
einem separaten Adaptionsprozeß vor der eigentlichen Klassifizierung fest
gelegt. Insbesondere bei einer großen Anzahl von Merkmalen und Klassifi
zierungskriterien gestaltet sich auch dieser Prozeß als sehr zeitaufwendig.
Außerdem ist hierbei oft das Spezialwissen und die Erfahrung eines Experten
erforderlich, um eine zuverlässige Festlegung und Einstellung der Klas
sifizierungskriterien zu gewährleisten.
Es ist Aufgabe der vorliegenden Erfindung, ein schnelles und zugleich zu
verlässiges Verfahren zur Klassifizierung von Dokumenten anzugeben.
Diese Aufgabe wird durch das Verfahren gemäß Anspruch 1 gelöst. Erfin
dungsgemäß ist hierin vorgesehen, aus der Vielzahl der Merkmale des zu
überprüfenden Dokuments diejenigen Merkmale auszuwählen, welche eine
höhere Signifikanz bei der Klassifizierung aufweisen als die übrigen Merk
male des Dokuments. Anhand der ausgewählten Merkmale wird dann die
Klasse für das Dokument ermittelt, d. h. aus mehreren möglichen Klassen
ausgewählt.
Bei den Merkmalen handelt es sich um durch Messung an dem Dokument
erhaltene Meßwerte oder davon abgeleitete Werte. Insbesondere werden die
Merkmale für bestimmte Merkmalsbereiche, welche eine bestimmte Lage
und Größe auf dem Dokument aufweisen, ermittelt. Beispielsweise enthalten
die Merkmale jeweils Meßwerte bzw. Werte für die von quadratischen Flä
chen bestimmter Lage und Größe reflektierte und/oder transmittierte
Lichtintensität, gegebenenfalls bei einer bestimmten Wellenlänge oder in
einem bestimmten Wellenlängenbereich.
Bei den möglichen Klassen, aus welchen eine ausgwählt werden soll, handelt
es sich beispielsweise um die möglichen vorkommenden Stückelungen der
zu klassifizierenden Dokumente. Im Falle von Banknoten handelt es sich
hierbei um die Nennwerte der verschiedenene Banknoten. Mögliche Klassen
können dann beispielsweise für 10, 20, 50, 100, 200, 500 und 1000 DM-
Scheine vorgesehen sein.
Im allgemeinen kann die Ermittlung einer Klasse aber auch im Hinblick auf
die Echtheit und/oder Fitneß, d. h. die Tauglichkeit des Dokuments für eine
Wiederverwendung, erfolgen. Die einzelnen möglichen Klassen spiegeln
dann beispielsweise unterschiedliche Echtheits- bzw. Fitneßgrade der zu
klassifizierenden Dokumente wider.
Unter einer höheren Signifikanz der ausgewählten Merkmale wird eine im
Vergleich zu den übrigen Merkmalen höhere Unterscheidungskraft zwi
schen den einzelnen möglichen Klassen verstanden. Dies bedeutet, daß sich
Dokumente aus verschiedenen Klassen in den ausgewählten Merkmalen
deutlicher unterscheiden als in den übrigen Merkmalen. Bei den ausgewähl
ten Merkmalen handelt es sich insbesondere um Merkmale bestimmter
Merkmalsbereiche, in welchen die Unterschiede zwischen Dokumenten un
terschiedlicher Klassen besonders groß sind.
Durch die Auswahl einer Teilmenge aus der ursprünglichen Vielzahl von
Merkmalen wird die Anzahl der für die Ermittlung der Klasse herangezoge
nen Merkmale reduziert. Da dann weniger Merkmale anhand von Klassifi
zierungskriterien geprüft werden müssen, wird der erforderliche Aufwand,
d. h. die Rechenzeit, für das Klassifizierungsverfahren reduziert. Da außer
dem nur Merkmale mit hoher Signifikanz herangezogen werden, ist gleich
zeitig eine hohe Zuverlässigkeit gewährleistet.
Es ist vorteilhaft, wenn die Merkmale des Dokuments zu einem Merkmals
vektor zusammengefaßt werden, wobei die einzelnen Merkmale des Doku
ments die einzelnen Komponenten des Merkmalsvektors bilden. Aus den
Komponenten des Merkmalsvektors werden dann diejenigen Komponenten,
d. h. Merkmale, ausgewählt, welche eine höhere Signifikanz aufweisen als
die übrigen Komponenten des Merkmalsvektors. Die ausgewählten Kompo
nenten bilden dann die Komponenten eines signifikanten Merkmalsvektors,
anhand dessen die Klasse für das Dokument ermittelt wird. Die Zusammen
fassung der Merkmale zu rechentechnisch leichter handhabbaren Vektoren
führt hierbei zu einer weiteren Vereinfachung des Verfahrens, insbesondere
bei einer computergestützten Durchführung.
In einer bevorzugten Ausführung des Verfahrens ist vorgesehen, daß die
auszuwählenden Merkmale bzw. Komponenten des signifikanten Merk
malsvektors in einem separaten Adaptionsprozeß anhand von Referenzdo
kumenten ermittelt werden. Der Adaptionsprozeß gestaltet sich insbesonde
re wie folgt: Für jede mögliche Klasse, z. B. Stückelung, wird jeweils eine
Vielzahl von Merkmalen jeweils eines oder mehrerer Referenzdokumente
ermittelt. Bei den Referenzdokumenten einer Klasse handelt es sich vor
zugsweise um gebrauchte Referenzdokumente, wenn mit den im Adapti
onsprozeß ermittelten signifikanten Komponenten anschließend eine Klassi
fizierung von gebrauchten Dokumenten vorgenommen werden soll. Für je
des Referenzdokument wird ein Referenzvektor erzeugt, dessen einzelne
Komponenten durch die Merkmale jeweils eines Referenzdokuments gebil
det werden. Mit den Referenzvektoren wird eine Faktorenanalyse (Principle
Component Analysis, PCA) durchgeführt. Hierbei werden signifikante
Komponenten der Referenzvektoren ermittelt, für welche die Unterschiede
zwischen den Referenzdokumenten der verschiedenen Klassen besonders
groß sind. Die signifikanten Komponenten der Referenzvektoren entspre
chen dann den auszuwählenden Komponenten des Merkmalsvektors eines
zu klassifizierenden Dokuments, d. h. bei der eigentlichen Klassifizierung,
also der Ermittlung der Klasse für das Dokument, werden dann diejenigen
Merkmale bzw. Komponenten des Merkmalsvektors eines zu klassifizieren
den Dokuments ausgewählt, welche den ermittelten signifikanten Komponenten
der Referenzvektoren entsprechen. Die verwendete Faktorenanalyse
stellt hierbei eine zuverlässige und schnelle Näherung zur Reduktion einer
diskreten Zahl von Vektorkomponenten dar. Die beschriebene Ermittlung
von signifikanten Merkmalen im Adaptionsprozeß anhand von Referenzdo
kumenten ist darüber hinaus voll automatisierbar, so daß hier kein weiteres
Expertenwissen mehr erforderlich ist.
Die Erfindung wird nachfolgend anhand von Figuren beispielhaft erläutert.
Es zeigen:
Fig. 1 eine Banknote mit regelmäßig verteilten Merkmalsbereichen;
Fig. 2 eine Banknote mit regelmäßig verteilten Merkmalsbereichen
und ausgewählten Merkmalsbereichen;
Fig. 3 einen zweidimensionalen Merkmalsraum und
Fig. 4 jeweils ein Ablaufdiagramm des Adaptionsprozesses sowie der
eigentlichen Klassifizierung.
Fig. 1 zeigt eine Banknote 10 mit regelmäßig verteilten Merkmalsbereichen
12. In dem dargestellten Beispiel weisen alle Merkmalsbereiche 12 eine qua
dratische bzw. rechteckige Form auf. Generell sind jedoch auch beliebige
andere, z. B. kreisförmige, geometische Formen denkbar. Auch können sich
Lage und Größe der einzelnen Merkmalsbereiche 12 deutlicher voneinander
unterscheiden als im Beispiel.
Für die einzelnen Merkmalsbereiche 12 wird jeweils mindestens ein Merk
mal abgeleitet. Vorzugsweise wird hierzu, z. B. mit Hilfe eines CCD-Sensors,
ein Bild der Banknote 10 aufgenommen, welches aus einzelnen Bildpunkten
mit zugehörigen Intensitätswerten besteht. Aus den Intensitätswerten von
Bildpunkten, welche jeweils innerhalb der einzelnen Merkmalsbereiche 12
liegen, wird dann, z. B. durch Mittelung der Intensitätswerte, gegebenenfalls
bei einer oder mehreren bestimmten Wellenlängen, das Merkmal des jewei
ligen Merkmalsbereichs 12 abgeleitet. Im allgemeinen ist es auch möglich,
neben oder anstelle von optischen Eigenschaften der Banknote 10 andere
physikalische Eigenschaften, z. B. magnetische, zu messen und daraus
Merkmale abzuleiten.
Fig. 2 zeigt die in Fig. 1 dargestellte Banknote 10 mit regelmäßig verteilten
Merkmalsbereichen 12, wobei zusätzlich ausgewählte Merkmalsbereiche 14
eingezeichnet sind, welche für die Ermittlung der Klasse, d. h. beispielsweise
des Nennwertes, der Banknote 10 herangezogen werden. Die Festlegung
oder Ermittlung der Lage der auszuwählenden Merkmalsbereiche 14 erfolgt
hierbei in einem separaten Adaptionsprozeß vor der Klassifizierung anhand
von Referenzdokumenten. Gemäß der Erfindung weisen hierbei die ausge
wählten Merkmalsbereiche 14 eine höhere Signifikanz, d. h. Unterschei
dungskraft, bei der Klassifizierung der Banknoten 10 unterschiedlicher
Nennwerte auf als die restlichen Merkmalsbereiche 12. In den im Adapti
onsprozeß ermittelten Merkmalsbereichen 14 sind die Unterschiede zwi
schen Banknoten unterschiedlicher Klassen, z. B. 10, 20, 50, 100, 200, 500,
1000 DM-Scheine, besonders groß. Die eigentliche Klassifizierung, d. h. die
Ermittlung einer Klasse für das zu klassifizierende Dokument, erfolgt dann
anhand der ausgewählten Merkmalsbereiche 14.
Um eine möglichst gleiche relative Lage der Merkmalsbereiche 12 und 14
auch bei Banknoten 10 unterschiedlichen Formats zu gewährleisten, wird die
Lage und/oder die Größe der Merkmalsbereiche 12 entsprechend der Größe
der Banknoten skaliert. Die auszuwählenden Merkmalsbereiche 14 befinden
sich dann auch bei Banknoten 10 unterschiedlichen Formats, und damit un
terschiedlichen Nennwerts, immer in derselben relativen Lage bzw. weisen
eine entsprechend skalierte Größe auf.
Fig. 3 verdeutlicht am Beispiel eines zweidimensionalen Merkmalsraumes
die unterschiedliche Signifikanz von zwei Merkmalen f1 und f2 bei der
Klassifizierung. In dem Diagramm ist für zwei Klassen und jeweils zehn Re
ferenzdokumente das Merkmal f2 über dem Merkmal f1 aufgetragen. Jeder
dargestellte Punkt 15 liegt hierbei an der Spitze eines Referenzvektors 16 für
ein einzelnes Referenzdokument mit den Komponenten f1 und f2. Im gezeig
ten Beispiel sind aus Gründen der Anschaulichkeit lediglich zwei Referenz
vektoren 16 eingezeichnet. Wie aus dem Diagramm ersichtlich ist, liegen die
Punkte 15 der Referenzvektoren 16 der beiden unterschiedlichen Klassen in
zwei voneinander getrennten Bereichen 18. Offensichtlich lassen sich die
Dokumente beider Klassen eindeutig alleine durch das Merkmal f1 vonein
ander unterscheiden. So wird einem zu überprüfenden Dokument die erste
Klasse zugeordnet, wenn das Merkmal f1 des Dokuments innerhalb des In
tervalls I1 liegt. Befindet sich das Merkmal f1 innerhalb des Intervalls I2, so
wird dem Dokument die zweite Klasse zugeordnet. Im Gegensatz dazu ist
eine eindeutige Zuordnung eines zu klassifizierenden Dokuments zu einer
der beiden Klassen alleine anhand des Merkmals f2 nicht möglich, da für
dieses Merkmal die Merkmalsvektoren 16 beider Klassen nicht in voneinan
der getrennten Bereichen liegen.
In dem einfachen Beispiel ist gezeigt, daß die für eine eindeutige Zuordnung
der Klassen zu einzelnen Dokumenten erforderliche Anzahl von Merkmalen
reduziert werden kann. Im allgemeinen müssen jedoch diese für die Klassi
fizierung signifikanten Merkmale aus einer Vielzahl von Merkmalen gefunden
werden. Darüber hinaus sind i. a. unterschiedliche Merkmale zumindest
geringfügig korreliert, d. h. voneinander abhängig. Die Bereiche 18 der Klas
sen im dargestellten Beispiel erstrecken sich dann im zweidimensionalen
Merkmalsraum stärker in Richtung der Diagonalen des Merkmalsraums
(nicht dargestellt), so daß eine eindeutige Zuordnung anhand des Merkmals
f1 schwieriger oder unmöglich wird.
Um auch in diesem allgemeineren Falleine klare Unterscheidbarkeit der
Klassen anhand ausgewählter signifikanter Merkmale zu erreichen, wird mit
den Referenzvektoren der Referenzdokumente eine Faktorenanalyse (PCA)
durchgeführt. Unter anderem wird hierbei das Koordinatensystem des
Merkmalsraumes so transformiert, daß eine eindeutige Unterscheidung der
Klassen in der oben beschriebenen Weise anhand von möglichst wenigen
Merkmalen erfolgen kann. Mit Hilfe der Faktorenanalyse werden somit aus
den Referenzvektoren von Referenzdokumenten diejenigen signifikanten
Komponenten ermittelt, für welche die Merkmalsvektoren von zu unter
schiedlichen Klassen gehörenden Dokumenten im Merkmalsraum in von
einander getrennten Bereichen liegen.
Die Faktorenanalyse weist hierbei folgende Schritte auf: Für jede Klasse der
möglichen Klassen wird aus den Referenzvektoren der Referenzdokumente
der jeweiligen Klasse ein mittlerer Referenzvektor ermittelt; ein über alle
möglichen Klassen gemittelter Referenzvektor wird ermittelt; aus den mitte
leren Referenzvektoren und dem gemittelten Referenzvektor wird eine Kor
relationsmatrix berechnet; die Korrelationsmatrix wird diagonalisiert, wobei
deren Eigenwerte mit den zugehörigen Eigenvektoren bestimmt werden; die
Eigenwerte werden ihrer Größe nach sortiert. Aus den Eigenvektoren, die zu
den Eigenwerten gehören, welche größer sind als ein vorgegebener Schwel
lenwert, wird ein Satz orthonormaler Basisvektoren abgeleitet und zu einer
Transformationsmatrix zusammengefaßt. Die Transformationsmatrix be
schreibt dann die Transformation der Referenzvektoren 16 zu signifikanten
Referenzvektoren, deren Komponenten die signifikanten Merkmale enthal
ten.
Fig. 4 zeigt jeweils ein Ablaufdiagramm des Adaptionsprozesses (linker Teil)
sowie der eigentlichen Klassifizierung (rechter Teil). In dem im linken Teil
der Figur dargestellten Adaptionsprozeß werden zunächst in einem ersten
Schritt 30 Meßdaten, beispielsweise das Druckbild, von mehreren Referenz
dokumenten je Klasse erfaßt und einer Vorverarbeitung 31 zugeführt, in
welcher aus den Meßdaten, beispielsweise aus Bildpunkten der erfaßten
Druckbilder, Merkmale ermittelt werden, beispielsweise durch Mittelung
der Intensiätswerte einzelner Bildpunkte, welche innerhalb eines Merkmals
bereichs 12 liegen. In Schritt 32 erfolgt die Ermittlung signifikanter Merkma
le, anhand welcher sich die einzelnen Referenzdokumente eindeutig einer
Klasse zuordnen lassen. Die Ermittlung signifikanter Merkmale erfolgt vor
zugsweise durch Faktorenanalyse (PCA) der Referenzvektoren 16, deren
Komponenten die einzelnen Merkmale der Referenzdokumente enthalten.
Aus den ermittelten signifikanten Merkmalen, welche die Komponenten ei
nes signifikanten Referenzvektors bilden, werden im folgenden Schritt 33 die
Klassifizierungskriterien berechnet. Dies erfolgt vorzugsweise durch Be
rechnung eines linearen Klassifizierers aus den signifikanten Referenzvekto
ren.
Im rechten Teil der Fig. 4 ist die Klassifizierung einer zu klassifizierenden
Banknote dargestellt. Es werden zunächst in einem ersten Schritt 40 Meßda
ten, insbesondere das Druckbild, der Banknote erfaßt und in einem weiteren
Schritt 41 analog Schritt 31 während des Adaptionsprozesses vorverarbeitet,
wobei eine Vielzahl von Merkmalen auf der zu klassifizierenden Banknote
erhalten wird. Im folgenden Schritt 42 wird aus der Vielzahl von Merkmalen
des Dokuments eine Teilmenge von Merkmalen ausgewählt, welche eine
höhere Signifikanz bei der Klassifizierung aufweisen als die übrigen Merk
male des Dokuments. Bei der ausgewählten Teilmenge von Merkmalen han
delt es sich um solche Merkmale, welche in Schritt 32 während des Adapti
onsprozesses als signifikante Merkmale ermittelt wurden. Der von Schritt 32
in Richtung Schritt 42 verlaufende Pfeil soll andeuten, daß hierzu Daten, z. B.
die Orte der als signifikant ermittelten Merkmalsbereiche oder die Trans
formationsmatrix, aus dem Adaptionsprozeß an die eigentliche Klassifizie
rung übergeben werden.
Die Klammer um die Schritte 41 und 42 soll andeuten, daß die beiden Schrit
te 41 und 42 zusammengefaßt werden können. Die Ermittlung der Merkmale
der Merkmalsbereiche 12 in Schritt 41 erfolgt hierbei nur noch für die in
Schritt 32 während des Adaptionsprozesses ermittelten signifikanten Merk
malsbereiche 14. Auf diese Weise reduziert sich die Berechnung der Merk
male für eine Vielzahl von Merkmalsbereichen 12 auf die Berechnung ledig
lich der signifikanten Merkmalsbereiche 14. Der Zeitaufwand bei der Klassi
fizierung wird hierdurch deutlich vermindert.
In Schritt 43 wird aus den Merkmalen der ausgewählten Teilmenge die Klas
se für das Dokument ermittelt, wobei die in Schritt 33 des Adaptionsprozes
ses ermittelten Klassifizierungskriterien herangezogen werden. Auch dies ist
durch einen entsprechenden Pfeil von Schritt 33 in Richtung Schritt 43 ange
deutet. Insbesondere handelt es sich hierbei um einen linearen Klassifizierer,
so daß die zu einem Merkmalsvektor zusammengefaßten signifikanten
Merkmale des zu klassifizierenden Dokuments einfach durch Multiplikation
mit einer Matrix M und Addition eines Vektors B auf die Klasse führen, wel
che dem Dokument zugeordnet wird.
Während der Schritte 31 und 41 kann nach der Ermittlung der Merkmale 12
bereits eine Vorauswahl getroffen werden, in welcher solche Merkmale 12
von der weiteren Verarbeitung ausgenommen werden, welche im Bereich
von typischen Störungen auf oder in den Dokumenten liegen. Dies können
u. a. der Randbereich, Ecken sowie vertikale oder horizontale Streifen durch
die Mitte des Dokuments sein. Da dort oft Schäden durch Risse, Fehlstellen,
Knicke und Falten auftreten, ist die Ermittlung signifikanter Merkmale aus
diesen Bereichen sowie die Klassifizierung anhand solcher Merkmale nicht
ausreichend zuverlässig. Wie der Fig. 2 zu entnehmen ist, liegen die aus
gewählten signifikanten Merkmale 14 nicht im Bereich der Ränder und Ec
ken der Banknote 10. Außerdem befinden sich auf einem drei Einheiten brei
ten vertikalen und einem zwei Einheiten breiten horizontalen Streifen durch
die Mitte der Banknote ebenfalls keine signifikanten Merkmale 14.
Zur Abschätzung der Qualität einer Klassifizierung bei einer vorgenomme
nen Adaption kann die zu erwartende Fehlerrate berechnet werden, welche
den statistisch zu erwartenden Anteil falsch klassifizierter Dokumente an
gibt. Die Fehlerrate kann aus den gegenseitigen Abständen der zu den ein
zelnen Klassen gehörenden Bereichen 18 im Merkmalsraum der signifikan
ten Merkmale abgeleitet werden.
Claims (11)
1. Verfahren zur Klassifizierung von Dokumenten, insbesondere Banknoten,
bei welchem
Merkmale (12) eines zu klassifizierenden Dokuments (10) ermittelt werden und
anhand der Merkmale (12) des Dokuments (10) eine Klasse aus meh reren möglichen Klassen für das Dokument (10) ermittelt wird,
dadurch gekennzeichnet, daß
aus den Merkmalen (12) des Dokuments (10) solche Merkmale (14) ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Merkmale des Dokuments (10), und
anhand der ausgewählten Merkmale (14) die Klasse für das Doku ment (10) ermittelt wird.
Merkmale (12) eines zu klassifizierenden Dokuments (10) ermittelt werden und
anhand der Merkmale (12) des Dokuments (10) eine Klasse aus meh reren möglichen Klassen für das Dokument (10) ermittelt wird,
dadurch gekennzeichnet, daß
aus den Merkmalen (12) des Dokuments (10) solche Merkmale (14) ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Merkmale des Dokuments (10), und
anhand der ausgewählten Merkmale (14) die Klasse für das Doku ment (10) ermittelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die Merkmale (12) des Dokuments (10) einzelnen Komponenten eines Merkmalsvektors zugeordnet werden,
aus den Komponenten des Merkmalsvektors diejenigen Komponen ten ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Komponenten des Merkmalsvektors,
die ausgewählten Komponenten die Komponenten eines signifikanten Merkmalsvektors bilden und
aus dem signifikanten Merkmalsvektor die Klasse für das Dokument (10) ermittelt wird.
die Merkmale (12) des Dokuments (10) einzelnen Komponenten eines Merkmalsvektors zugeordnet werden,
aus den Komponenten des Merkmalsvektors diejenigen Komponen ten ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Komponenten des Merkmalsvektors,
die ausgewählten Komponenten die Komponenten eines signifikanten Merkmalsvektors bilden und
aus dem signifikanten Merkmalsvektor die Klasse für das Dokument (10) ermittelt wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die
auszuwählenden Merkmale (14) bzw. Komponenten des signifikanten
Merkmalsvektors in einem Adaptionsprozeß (30-33) anhand von Referenz
dokumenten ermittelt werden.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß der Adapti
onsprozeß (30-33) folgende Teilschritte aufweist:
für jede mögliche Klasse werden Merkmale (f1, f2) jeweils eines oder mehrerer Referenzdokumente ermittelt,
die Merkmale (f1, f2) jedes Referenzdokuments werden einzelnen Komponenten jeweils eines zu jedem Referenzdokument gehörenden Referenzvektors (16) zugeordnet,
mit den Referenzvektoren (16) wird eine Faktorenanalyse (PCA) durchgeführt, wobei signifikante Komponenten der Referenzvektoren (16) ermittelt werden, welche den Komponenten eines signifikanten Referenzvektors zugeordnet werden, und welche die auszuwählen den Komponenten des Merkmalsvektors des zu klassifizierenden Do kuments bilden.
für jede mögliche Klasse werden Merkmale (f1, f2) jeweils eines oder mehrerer Referenzdokumente ermittelt,
die Merkmale (f1, f2) jedes Referenzdokuments werden einzelnen Komponenten jeweils eines zu jedem Referenzdokument gehörenden Referenzvektors (16) zugeordnet,
mit den Referenzvektoren (16) wird eine Faktorenanalyse (PCA) durchgeführt, wobei signifikante Komponenten der Referenzvektoren (16) ermittelt werden, welche den Komponenten eines signifikanten Referenzvektors zugeordnet werden, und welche die auszuwählen den Komponenten des Merkmalsvektors des zu klassifizierenden Do kuments bilden.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Faktorena
nalyse (PCA) folgende Schritte aufweist:
für jede mögliche Klasse wird ein mittlerer Referenzvektor ermittelt,
ein über alle möglichen Klassen gemittelter Referenzvektor wird er mittelt,
aus den mittleren Referenzvektoren und dem gemittelten Referenz vektor wird eine Korrelationsmatrix berechnet,
die Korrelationsmatrix wird diagonalisiert, wobei deren Eigenwerte mit deren zugehörigen Eigenvektoren bestimmt werden,
die Eigenwerte werden ihrer Größe nach sortiert,
aus den Eigenvektoren, die zu Eigenwerten gehören, welche größer sind als ein vorgegebener Schwellenwert, wird ein Satz orthonormaler Basisvektoren abgeleitet und zu einer Transformationsmatrix zusam mengefaßt, welche eine Transformation der Referenzvektoren zu den signifikanten Referenzvektoren beschreibt.
für jede mögliche Klasse wird ein mittlerer Referenzvektor ermittelt,
ein über alle möglichen Klassen gemittelter Referenzvektor wird er mittelt,
aus den mittleren Referenzvektoren und dem gemittelten Referenz vektor wird eine Korrelationsmatrix berechnet,
die Korrelationsmatrix wird diagonalisiert, wobei deren Eigenwerte mit deren zugehörigen Eigenvektoren bestimmt werden,
die Eigenwerte werden ihrer Größe nach sortiert,
aus den Eigenvektoren, die zu Eigenwerten gehören, welche größer sind als ein vorgegebener Schwellenwert, wird ein Satz orthonormaler Basisvektoren abgeleitet und zu einer Transformationsmatrix zusam mengefaßt, welche eine Transformation der Referenzvektoren zu den signifikanten Referenzvektoren beschreibt.
6. Verfahren nach einem der Ansprüche 4 bis 5, dadurch gekennzeichnet,
daß die Klasse für das Dokument (10) anhand eines oder mehrerer Klassifi
zierungskriterien ermittelt wird, welche aus dem signifikanten Referenzvek
toren abgeleitet werden.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Ableitung
von Klassifizierungskriterien durch Berechnung eines linearen Klassifizierers
aus den signifikanten Referenzvektoren erfolgt.
8. Verfahren nach einem der Ansprüche 4 bis 7, dadurch gekennzeichnet,
daß eine bei der Ermittlung der Klasse für das zu klassifizierende Dokument
(10) zu erwartende Fehlerrate aus den Referenzvektoren ermittelt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet,
daß die auszuwählenden Merkmale (14) nicht im Bereich von typischen Stö
rungen auf oder in den zu klassfizierenden Dokumenten (10) bzw. Referenz
dokumenten liegen.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet,
daß die Merkmale Meßwerte oder davon abgeleitete Werte von Merkmals
bereichen (12, 14) angeben, wobei jeder Merkmalsbereich (12, 14) eine be
stimmte Lage und Größe auf den zu klassifizierenden Dokumenten (10) bzw.
Referenzdokumenten aufweist.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die Lage der
Merkmalsbereiche (12, 14) und/oder deren Größe entsprechend der Größe
des Dokuments (10) bzw. Referenzdokuments skaliert wird.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10045360A DE10045360A1 (de) | 2000-09-14 | 2000-09-14 | Verfahren zur Klassifizierung von Dokumenten |
PCT/EP2001/010542 WO2002023492A2 (de) | 2000-09-14 | 2001-09-12 | Verfahren zur klassifizierung von dokumenten |
AU2001291857A AU2001291857A1 (en) | 2000-09-14 | 2001-09-12 | Method for classifying documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10045360A DE10045360A1 (de) | 2000-09-14 | 2000-09-14 | Verfahren zur Klassifizierung von Dokumenten |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10045360A1 true DE10045360A1 (de) | 2002-03-28 |
Family
ID=7656113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10045360A Ceased DE10045360A1 (de) | 2000-09-14 | 2000-09-14 | Verfahren zur Klassifizierung von Dokumenten |
Country Status (3)
Country | Link |
---|---|
AU (1) | AU2001291857A1 (de) |
DE (1) | DE10045360A1 (de) |
WO (1) | WO2002023492A2 (de) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10117250A1 (de) * | 2001-04-06 | 2002-10-17 | Giesecke & Devrient Gmbh | Verfahren zum Test von Meßsystemen |
DE10145608A1 (de) * | 2001-09-15 | 2003-05-08 | Eads Deutschland Gmbh | Modellbasierte Objektklassifikation und Zielerkennung |
DE102004036229A1 (de) * | 2004-07-26 | 2006-02-16 | Giesecke & Devrient Gmbh | Verfahren für die Prüfung von Banknoten |
DE102005044092A1 (de) * | 2005-09-15 | 2007-03-22 | Giesecke & Devrient Gmbh | Banknotenerkennung |
DE102010021803A1 (de) * | 2010-05-27 | 2011-12-01 | Giesecke & Devrient Gmbh | Vorrichtung zur Echtheitsprüfung von Wertdokumenten |
DE102008000758B4 (de) | 2007-04-09 | 2018-09-06 | Denso Corporation | Vorrichtung zum Erkennen eines Objekts in einer Abbildung |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6944333B2 (en) * | 2003-04-30 | 2005-09-13 | Ventana Medical Systems, Inc. | Color image compression via spectral decorrelation and elimination of spatial redundancy |
JP4893278B2 (ja) * | 2006-12-01 | 2012-03-07 | 日本電気株式会社 | 証紙識別システム及び証紙識別方法 |
CN103646458B (zh) * | 2013-12-23 | 2015-10-28 | 华中科技大学 | 主成份分析鉴别纸币真伪的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH684222A5 (de) * | 1992-03-10 | 1994-07-29 | Mars Inc | Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze. |
CH684856A5 (de) * | 1992-11-30 | 1995-01-13 | Mars Inc | Verfahren zur Klassifizierung eines Musters - insbesondere eines Musters einer Banknote oder einer Münze - und Einrichtung zur Durchführung des Verfahrens. |
DE19538004A1 (de) * | 1995-03-31 | 1996-10-02 | Fraunhofer Ges Forschung | Verfahren zur Grobklassifizierung von Objekten |
DE19636074C2 (de) * | 1996-09-05 | 1999-08-12 | Siemens Ag | Lernfähiges Bildverarbeitungssystem zur Klassierung |
DE29916927U1 (de) * | 1999-09-28 | 2000-01-20 | Weiss Andreas | Vorrichtung für die Überprüfung der Echtheit von Banknoten |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3724014B2 (ja) * | 1994-08-25 | 2005-12-07 | ソニー株式会社 | 画像認識装置および画像認識方法 |
US5757001A (en) * | 1996-05-01 | 1998-05-26 | The Regents Of The University Of Calif. | Detection of counterfeit currency |
US6185337B1 (en) * | 1996-12-17 | 2001-02-06 | Honda Giken Kogyo Kabushiki Kaisha | System and method for image recognition |
GB2344446A (en) * | 1998-12-02 | 2000-06-07 | Mars Inc | Classifying currency items |
-
2000
- 2000-09-14 DE DE10045360A patent/DE10045360A1/de not_active Ceased
-
2001
- 2001-09-12 AU AU2001291857A patent/AU2001291857A1/en not_active Abandoned
- 2001-09-12 WO PCT/EP2001/010542 patent/WO2002023492A2/de active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH684222A5 (de) * | 1992-03-10 | 1994-07-29 | Mars Inc | Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze. |
CH684856A5 (de) * | 1992-11-30 | 1995-01-13 | Mars Inc | Verfahren zur Klassifizierung eines Musters - insbesondere eines Musters einer Banknote oder einer Münze - und Einrichtung zur Durchführung des Verfahrens. |
DE19538004A1 (de) * | 1995-03-31 | 1996-10-02 | Fraunhofer Ges Forschung | Verfahren zur Grobklassifizierung von Objekten |
DE19636074C2 (de) * | 1996-09-05 | 1999-08-12 | Siemens Ag | Lernfähiges Bildverarbeitungssystem zur Klassierung |
DE29916927U1 (de) * | 1999-09-28 | 2000-01-20 | Weiss Andreas | Vorrichtung für die Überprüfung der Echtheit von Banknoten |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10117250A1 (de) * | 2001-04-06 | 2002-10-17 | Giesecke & Devrient Gmbh | Verfahren zum Test von Meßsystemen |
DE10145608A1 (de) * | 2001-09-15 | 2003-05-08 | Eads Deutschland Gmbh | Modellbasierte Objektklassifikation und Zielerkennung |
DE10145608B4 (de) * | 2001-09-15 | 2006-01-26 | Eads Deutschland Gmbh | Modellbasierte Objektklassifikation und Zielerkennung |
US8005261B2 (en) | 2001-09-15 | 2011-08-23 | Eads Deutschland Gmbh | Model-based object classification and target recognition |
DE102004036229A1 (de) * | 2004-07-26 | 2006-02-16 | Giesecke & Devrient Gmbh | Verfahren für die Prüfung von Banknoten |
DE102005044092A1 (de) * | 2005-09-15 | 2007-03-22 | Giesecke & Devrient Gmbh | Banknotenerkennung |
DE102008000758B4 (de) | 2007-04-09 | 2018-09-06 | Denso Corporation | Vorrichtung zum Erkennen eines Objekts in einer Abbildung |
DE102010021803A1 (de) * | 2010-05-27 | 2011-12-01 | Giesecke & Devrient Gmbh | Vorrichtung zur Echtheitsprüfung von Wertdokumenten |
US8917386B2 (en) | 2010-05-27 | 2014-12-23 | Giesecke & Devrient Gmbh | Apparatus for checking the authenticity of value documents |
Also Published As
Publication number | Publication date |
---|---|
AU2001291857A1 (en) | 2002-03-26 |
WO2002023492A2 (de) | 2002-03-21 |
WO2002023492A3 (de) | 2002-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0692089B1 (de) | Produktionsnahe farbkontrolle mit bildgebenden sensoren | |
DE10157958B4 (de) | Bildverarbeitungsverfahren und-vorrichtung | |
EP0585724A2 (de) | Verfahren und Vorrichtung zur Erkennung von Druckbildern auf Dokumenten | |
DE2801536A1 (de) | Zeichenerkennungsvorrichtung | |
EP0560023A1 (de) | Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze | |
DE3738304A1 (de) | Vorrichtung zum pruefen von banknoten | |
CH684856A5 (de) | Verfahren zur Klassifizierung eines Musters - insbesondere eines Musters einer Banknote oder einer Münze - und Einrichtung zur Durchführung des Verfahrens. | |
CH651145A5 (de) | Verfahren und vorrichtung zum identifizieren des wertes einer banknote. | |
EP1576553A2 (de) | Verfahren und vorrichtung für die überprüfung von banknoten | |
DE2921862A1 (de) | Maschine fuer die automatische qualitaetskontrolle an frisch gedruckten banknoten und wertpapieren | |
EP3287951A1 (de) | Verfahren für die urheberschaftsbewertung eines gemäldes sowie eine entsprechende verwendung | |
DE10045360A1 (de) | Verfahren zur Klassifizierung von Dokumenten | |
WO2006133974A1 (de) | Verfahren und vorrichtung zur erkennung einer münze unter verwendung ihres prägebildes | |
WO2011082792A1 (de) | Verfahren zur prüfung von wertdokumenten | |
EP3111426A1 (de) | Verfahren zum ermitteln eines sortierergebnisses für ein wertdokument und mittel zur durchführung des verfahrens | |
DE102005040662A1 (de) | Verfahren zur Identifizierung von zu sortierenden Sendungen | |
EP2096578A2 (de) | Verfahren und Vorrichtung zur Charakterisierung der Formation von Papier | |
WO2010089157A1 (de) | Verfahren und vorrichtung zum verifizieren von dokumenten unter verwendung einer wavelet-transformation | |
EP1567991B1 (de) | Verfahren und vorrichtung zur prüfung von wertdokumenten | |
EP3435056A1 (de) | Druckinspektionsvorrichtung zur optischen inspektion eines druckbildes eines druckobjekts | |
EP1139285B1 (de) | Verfahren und Vorrichtung zur Prüfung bzw. Untersuchung von Gegenständen | |
DE19917899C2 (de) | Verfahren zur Fehlererkennung und Fehlerbewertung von Druckprodukten | |
DE10024559B4 (de) | Verfahren zur Erkennung von Objekten | |
DE10066189B4 (de) | Verfahren zur Erkennung von Objekten | |
DE10040614A1 (de) | Verfahren zur automatischen Erkennung einer gerichteten Struktur |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8110 | Request for examination paragraph 44 | ||
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final |
Effective date: 20130926 |