DE10045360A1 - Verfahren zur Klassifizierung von Dokumenten - Google Patents

Verfahren zur Klassifizierung von Dokumenten

Info

Publication number
DE10045360A1
DE10045360A1 DE10045360A DE10045360A DE10045360A1 DE 10045360 A1 DE10045360 A1 DE 10045360A1 DE 10045360 A DE10045360 A DE 10045360A DE 10045360 A DE10045360 A DE 10045360A DE 10045360 A1 DE10045360 A1 DE 10045360A1
Authority
DE
Germany
Prior art keywords
document
features
determined
documents
significant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE10045360A
Other languages
English (en)
Inventor
Norbert Holl
Alfred Kraxenberger
John C Weaver
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Giesecke and Devrient GmbH
Original Assignee
Giesecke and Devrient GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Giesecke and Devrient GmbH filed Critical Giesecke and Devrient GmbH
Priority to DE10045360A priority Critical patent/DE10045360A1/de
Priority to PCT/EP2001/010542 priority patent/WO2002023492A2/de
Priority to AU2001291857A priority patent/AU2001291857A1/en
Publication of DE10045360A1 publication Critical patent/DE10045360A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2131Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D11/00Devices accepting coins; Devices accepting, dispensing, sorting or counting valuable papers
    • G07D11/50Sorting or counting valuable papers

Abstract

Die Erfindung betrifft ein Verfahren zur Klassifizierung von Dokumenten, insbesondere Banknoten, bei welchem anhand von Merkmalen eines zu klassifizierenden Dokuments eine Klasse aus mehreren möglichen Klassen ermittelt wird. DOLLAR A Zur Beschleunigung der Klassifizierung bei gleichzeitig hoher Zuverlässigkeit ist vorgesehen, daß aus den Merkmalen des Dokuments solche Merkmale ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Merkmale des Dokuments, und anhand der ausgewählten Merkmale die Klasse für das Dokument ermittelt wird. Dokumente verschiedener Klassen unterscheiden sich hierbei in den ausgewählten Merkmalen deutlicher als in den übrigen Merkmalen. DOLLAR A Eine bevorzugte Ausführung des Verfahrens sieht vor, daß die auszuwählenden Merkmale in einem separaten Adaptionsprozeß anhand von Referenzdokumenten ermittelt werden. Die Merkmale der Referenzdokumente werden hierbei zu Referenzvektoren zusammengefaßt, aus welchen mittels Faktorenanalyse (PCA) signifikante Komponenten ermittelt werden, welche den auszuwählenden Merkmalen des zu klassifizierenden Dokuments entsprechen.

Description

Die Erfindung betrifft ein Verfahren zur Klassifizierung von Dokumenten, insbesondere Banknoten, bei welchem Merkmale eines zu klassifizierenden Dokuments ermittelt werden und anhand der Merkmale des Dokuments eine Klasse aus mehreren möglichen Klassen für das Dokument ermittelt wird.
Klassifizierungsverfahren werden unter anderem bei der Erkennung und gegebenenfalls Sortierung von Banknoten in Banknotenbearbeitungsmaschi­ nen oder Geldeingabeautomaten eingesetzt. Hierbei werden zunächst physi­ kalische Eigenschaften der zu klassifizierenden Banknote gemessen und dar­ aus eine Vielzahl von Merkmalen der Banknote abgeleitet. Anhand der Merkmale wird dann mit Hilfe von Klassifizierungskriterien eine Masse ermittelt, d. h. aus mehreren möglichen Klassen ausgewählt, und der Bank­ note zugeordnet. In einem anschließenden Sortiervorgang kann die Bankno­ te dann in ein für die ermittelte Klasse vorgesehenes Sortierfach ausgegeben werden, um von dort aus weiteren Bearbeitungsschritten, ggf. einer Wieder­ ausgabe, zugeführt zu werden.
Die bekannten Verfahren zur Klassifizierung von Dokumenten sind jedoch wegen der im allgemeinen großen Anzahl der zur Ermittlung der Klasse herangezogenen Merkmale sehr zeitintensiv. Infolgedessen ist eine Klassifi­ zierung der Dokumente in Echtzeit kaum realisierbar.
Darüber hinaus werden die erforderlichen Klassifizierungskriterien meist in einem separaten Adaptionsprozeß vor der eigentlichen Klassifizierung fest­ gelegt. Insbesondere bei einer großen Anzahl von Merkmalen und Klassifi­ zierungskriterien gestaltet sich auch dieser Prozeß als sehr zeitaufwendig. Außerdem ist hierbei oft das Spezialwissen und die Erfahrung eines Experten erforderlich, um eine zuverlässige Festlegung und Einstellung der Klas­ sifizierungskriterien zu gewährleisten.
Es ist Aufgabe der vorliegenden Erfindung, ein schnelles und zugleich zu­ verlässiges Verfahren zur Klassifizierung von Dokumenten anzugeben.
Diese Aufgabe wird durch das Verfahren gemäß Anspruch 1 gelöst. Erfin­ dungsgemäß ist hierin vorgesehen, aus der Vielzahl der Merkmale des zu überprüfenden Dokuments diejenigen Merkmale auszuwählen, welche eine höhere Signifikanz bei der Klassifizierung aufweisen als die übrigen Merk­ male des Dokuments. Anhand der ausgewählten Merkmale wird dann die Klasse für das Dokument ermittelt, d. h. aus mehreren möglichen Klassen ausgewählt.
Bei den Merkmalen handelt es sich um durch Messung an dem Dokument erhaltene Meßwerte oder davon abgeleitete Werte. Insbesondere werden die Merkmale für bestimmte Merkmalsbereiche, welche eine bestimmte Lage und Größe auf dem Dokument aufweisen, ermittelt. Beispielsweise enthalten die Merkmale jeweils Meßwerte bzw. Werte für die von quadratischen Flä­ chen bestimmter Lage und Größe reflektierte und/oder transmittierte Lichtintensität, gegebenenfalls bei einer bestimmten Wellenlänge oder in einem bestimmten Wellenlängenbereich.
Bei den möglichen Klassen, aus welchen eine ausgwählt werden soll, handelt es sich beispielsweise um die möglichen vorkommenden Stückelungen der zu klassifizierenden Dokumente. Im Falle von Banknoten handelt es sich hierbei um die Nennwerte der verschiedenene Banknoten. Mögliche Klassen können dann beispielsweise für 10, 20, 50, 100, 200, 500 und 1000 DM- Scheine vorgesehen sein.
Im allgemeinen kann die Ermittlung einer Klasse aber auch im Hinblick auf die Echtheit und/oder Fitneß, d. h. die Tauglichkeit des Dokuments für eine Wiederverwendung, erfolgen. Die einzelnen möglichen Klassen spiegeln dann beispielsweise unterschiedliche Echtheits- bzw. Fitneßgrade der zu klassifizierenden Dokumente wider.
Unter einer höheren Signifikanz der ausgewählten Merkmale wird eine im Vergleich zu den übrigen Merkmalen höhere Unterscheidungskraft zwi­ schen den einzelnen möglichen Klassen verstanden. Dies bedeutet, daß sich Dokumente aus verschiedenen Klassen in den ausgewählten Merkmalen deutlicher unterscheiden als in den übrigen Merkmalen. Bei den ausgewähl­ ten Merkmalen handelt es sich insbesondere um Merkmale bestimmter Merkmalsbereiche, in welchen die Unterschiede zwischen Dokumenten un­ terschiedlicher Klassen besonders groß sind.
Durch die Auswahl einer Teilmenge aus der ursprünglichen Vielzahl von Merkmalen wird die Anzahl der für die Ermittlung der Klasse herangezoge­ nen Merkmale reduziert. Da dann weniger Merkmale anhand von Klassifi­ zierungskriterien geprüft werden müssen, wird der erforderliche Aufwand, d. h. die Rechenzeit, für das Klassifizierungsverfahren reduziert. Da außer­ dem nur Merkmale mit hoher Signifikanz herangezogen werden, ist gleich­ zeitig eine hohe Zuverlässigkeit gewährleistet.
Es ist vorteilhaft, wenn die Merkmale des Dokuments zu einem Merkmals­ vektor zusammengefaßt werden, wobei die einzelnen Merkmale des Doku­ ments die einzelnen Komponenten des Merkmalsvektors bilden. Aus den Komponenten des Merkmalsvektors werden dann diejenigen Komponenten, d. h. Merkmale, ausgewählt, welche eine höhere Signifikanz aufweisen als die übrigen Komponenten des Merkmalsvektors. Die ausgewählten Kompo­ nenten bilden dann die Komponenten eines signifikanten Merkmalsvektors, anhand dessen die Klasse für das Dokument ermittelt wird. Die Zusammen­ fassung der Merkmale zu rechentechnisch leichter handhabbaren Vektoren führt hierbei zu einer weiteren Vereinfachung des Verfahrens, insbesondere bei einer computergestützten Durchführung.
In einer bevorzugten Ausführung des Verfahrens ist vorgesehen, daß die auszuwählenden Merkmale bzw. Komponenten des signifikanten Merk­ malsvektors in einem separaten Adaptionsprozeß anhand von Referenzdo­ kumenten ermittelt werden. Der Adaptionsprozeß gestaltet sich insbesonde­ re wie folgt: Für jede mögliche Klasse, z. B. Stückelung, wird jeweils eine Vielzahl von Merkmalen jeweils eines oder mehrerer Referenzdokumente ermittelt. Bei den Referenzdokumenten einer Klasse handelt es sich vor­ zugsweise um gebrauchte Referenzdokumente, wenn mit den im Adapti­ onsprozeß ermittelten signifikanten Komponenten anschließend eine Klassi­ fizierung von gebrauchten Dokumenten vorgenommen werden soll. Für je­ des Referenzdokument wird ein Referenzvektor erzeugt, dessen einzelne Komponenten durch die Merkmale jeweils eines Referenzdokuments gebil­ det werden. Mit den Referenzvektoren wird eine Faktorenanalyse (Principle Component Analysis, PCA) durchgeführt. Hierbei werden signifikante Komponenten der Referenzvektoren ermittelt, für welche die Unterschiede zwischen den Referenzdokumenten der verschiedenen Klassen besonders groß sind. Die signifikanten Komponenten der Referenzvektoren entspre­ chen dann den auszuwählenden Komponenten des Merkmalsvektors eines zu klassifizierenden Dokuments, d. h. bei der eigentlichen Klassifizierung, also der Ermittlung der Klasse für das Dokument, werden dann diejenigen Merkmale bzw. Komponenten des Merkmalsvektors eines zu klassifizieren­ den Dokuments ausgewählt, welche den ermittelten signifikanten Komponenten der Referenzvektoren entsprechen. Die verwendete Faktorenanalyse stellt hierbei eine zuverlässige und schnelle Näherung zur Reduktion einer diskreten Zahl von Vektorkomponenten dar. Die beschriebene Ermittlung von signifikanten Merkmalen im Adaptionsprozeß anhand von Referenzdo­ kumenten ist darüber hinaus voll automatisierbar, so daß hier kein weiteres Expertenwissen mehr erforderlich ist.
Die Erfindung wird nachfolgend anhand von Figuren beispielhaft erläutert. Es zeigen:
Fig. 1 eine Banknote mit regelmäßig verteilten Merkmalsbereichen;
Fig. 2 eine Banknote mit regelmäßig verteilten Merkmalsbereichen und ausgewählten Merkmalsbereichen;
Fig. 3 einen zweidimensionalen Merkmalsraum und
Fig. 4 jeweils ein Ablaufdiagramm des Adaptionsprozesses sowie der eigentlichen Klassifizierung.
Fig. 1 zeigt eine Banknote 10 mit regelmäßig verteilten Merkmalsbereichen 12. In dem dargestellten Beispiel weisen alle Merkmalsbereiche 12 eine qua­ dratische bzw. rechteckige Form auf. Generell sind jedoch auch beliebige andere, z. B. kreisförmige, geometische Formen denkbar. Auch können sich Lage und Größe der einzelnen Merkmalsbereiche 12 deutlicher voneinander unterscheiden als im Beispiel.
Für die einzelnen Merkmalsbereiche 12 wird jeweils mindestens ein Merk­ mal abgeleitet. Vorzugsweise wird hierzu, z. B. mit Hilfe eines CCD-Sensors, ein Bild der Banknote 10 aufgenommen, welches aus einzelnen Bildpunkten mit zugehörigen Intensitätswerten besteht. Aus den Intensitätswerten von Bildpunkten, welche jeweils innerhalb der einzelnen Merkmalsbereiche 12 liegen, wird dann, z. B. durch Mittelung der Intensitätswerte, gegebenenfalls bei einer oder mehreren bestimmten Wellenlängen, das Merkmal des jewei­ ligen Merkmalsbereichs 12 abgeleitet. Im allgemeinen ist es auch möglich, neben oder anstelle von optischen Eigenschaften der Banknote 10 andere physikalische Eigenschaften, z. B. magnetische, zu messen und daraus Merkmale abzuleiten.
Fig. 2 zeigt die in Fig. 1 dargestellte Banknote 10 mit regelmäßig verteilten Merkmalsbereichen 12, wobei zusätzlich ausgewählte Merkmalsbereiche 14 eingezeichnet sind, welche für die Ermittlung der Klasse, d. h. beispielsweise des Nennwertes, der Banknote 10 herangezogen werden. Die Festlegung oder Ermittlung der Lage der auszuwählenden Merkmalsbereiche 14 erfolgt hierbei in einem separaten Adaptionsprozeß vor der Klassifizierung anhand von Referenzdokumenten. Gemäß der Erfindung weisen hierbei die ausge­ wählten Merkmalsbereiche 14 eine höhere Signifikanz, d. h. Unterschei­ dungskraft, bei der Klassifizierung der Banknoten 10 unterschiedlicher Nennwerte auf als die restlichen Merkmalsbereiche 12. In den im Adapti­ onsprozeß ermittelten Merkmalsbereichen 14 sind die Unterschiede zwi­ schen Banknoten unterschiedlicher Klassen, z. B. 10, 20, 50, 100, 200, 500, 1000 DM-Scheine, besonders groß. Die eigentliche Klassifizierung, d. h. die Ermittlung einer Klasse für das zu klassifizierende Dokument, erfolgt dann anhand der ausgewählten Merkmalsbereiche 14.
Um eine möglichst gleiche relative Lage der Merkmalsbereiche 12 und 14 auch bei Banknoten 10 unterschiedlichen Formats zu gewährleisten, wird die Lage und/oder die Größe der Merkmalsbereiche 12 entsprechend der Größe der Banknoten skaliert. Die auszuwählenden Merkmalsbereiche 14 befinden sich dann auch bei Banknoten 10 unterschiedlichen Formats, und damit un­ terschiedlichen Nennwerts, immer in derselben relativen Lage bzw. weisen eine entsprechend skalierte Größe auf.
Fig. 3 verdeutlicht am Beispiel eines zweidimensionalen Merkmalsraumes die unterschiedliche Signifikanz von zwei Merkmalen f1 und f2 bei der Klassifizierung. In dem Diagramm ist für zwei Klassen und jeweils zehn Re­ ferenzdokumente das Merkmal f2 über dem Merkmal f1 aufgetragen. Jeder dargestellte Punkt 15 liegt hierbei an der Spitze eines Referenzvektors 16 für ein einzelnes Referenzdokument mit den Komponenten f1 und f2. Im gezeig­ ten Beispiel sind aus Gründen der Anschaulichkeit lediglich zwei Referenz­ vektoren 16 eingezeichnet. Wie aus dem Diagramm ersichtlich ist, liegen die Punkte 15 der Referenzvektoren 16 der beiden unterschiedlichen Klassen in zwei voneinander getrennten Bereichen 18. Offensichtlich lassen sich die Dokumente beider Klassen eindeutig alleine durch das Merkmal f1 vonein­ ander unterscheiden. So wird einem zu überprüfenden Dokument die erste Klasse zugeordnet, wenn das Merkmal f1 des Dokuments innerhalb des In­ tervalls I1 liegt. Befindet sich das Merkmal f1 innerhalb des Intervalls I2, so wird dem Dokument die zweite Klasse zugeordnet. Im Gegensatz dazu ist eine eindeutige Zuordnung eines zu klassifizierenden Dokuments zu einer der beiden Klassen alleine anhand des Merkmals f2 nicht möglich, da für dieses Merkmal die Merkmalsvektoren 16 beider Klassen nicht in voneinan­ der getrennten Bereichen liegen.
In dem einfachen Beispiel ist gezeigt, daß die für eine eindeutige Zuordnung der Klassen zu einzelnen Dokumenten erforderliche Anzahl von Merkmalen reduziert werden kann. Im allgemeinen müssen jedoch diese für die Klassi­ fizierung signifikanten Merkmale aus einer Vielzahl von Merkmalen gefunden werden. Darüber hinaus sind i. a. unterschiedliche Merkmale zumindest geringfügig korreliert, d. h. voneinander abhängig. Die Bereiche 18 der Klas­ sen im dargestellten Beispiel erstrecken sich dann im zweidimensionalen Merkmalsraum stärker in Richtung der Diagonalen des Merkmalsraums (nicht dargestellt), so daß eine eindeutige Zuordnung anhand des Merkmals f1 schwieriger oder unmöglich wird.
Um auch in diesem allgemeineren Falleine klare Unterscheidbarkeit der Klassen anhand ausgewählter signifikanter Merkmale zu erreichen, wird mit den Referenzvektoren der Referenzdokumente eine Faktorenanalyse (PCA) durchgeführt. Unter anderem wird hierbei das Koordinatensystem des Merkmalsraumes so transformiert, daß eine eindeutige Unterscheidung der Klassen in der oben beschriebenen Weise anhand von möglichst wenigen Merkmalen erfolgen kann. Mit Hilfe der Faktorenanalyse werden somit aus den Referenzvektoren von Referenzdokumenten diejenigen signifikanten Komponenten ermittelt, für welche die Merkmalsvektoren von zu unter­ schiedlichen Klassen gehörenden Dokumenten im Merkmalsraum in von­ einander getrennten Bereichen liegen.
Die Faktorenanalyse weist hierbei folgende Schritte auf: Für jede Klasse der möglichen Klassen wird aus den Referenzvektoren der Referenzdokumente der jeweiligen Klasse ein mittlerer Referenzvektor ermittelt; ein über alle möglichen Klassen gemittelter Referenzvektor wird ermittelt; aus den mitte­ leren Referenzvektoren und dem gemittelten Referenzvektor wird eine Kor­ relationsmatrix berechnet; die Korrelationsmatrix wird diagonalisiert, wobei deren Eigenwerte mit den zugehörigen Eigenvektoren bestimmt werden; die Eigenwerte werden ihrer Größe nach sortiert. Aus den Eigenvektoren, die zu den Eigenwerten gehören, welche größer sind als ein vorgegebener Schwel­ lenwert, wird ein Satz orthonormaler Basisvektoren abgeleitet und zu einer Transformationsmatrix zusammengefaßt. Die Transformationsmatrix be­ schreibt dann die Transformation der Referenzvektoren 16 zu signifikanten Referenzvektoren, deren Komponenten die signifikanten Merkmale enthal­ ten.
Fig. 4 zeigt jeweils ein Ablaufdiagramm des Adaptionsprozesses (linker Teil) sowie der eigentlichen Klassifizierung (rechter Teil). In dem im linken Teil der Figur dargestellten Adaptionsprozeß werden zunächst in einem ersten Schritt 30 Meßdaten, beispielsweise das Druckbild, von mehreren Referenz­ dokumenten je Klasse erfaßt und einer Vorverarbeitung 31 zugeführt, in welcher aus den Meßdaten, beispielsweise aus Bildpunkten der erfaßten Druckbilder, Merkmale ermittelt werden, beispielsweise durch Mittelung der Intensiätswerte einzelner Bildpunkte, welche innerhalb eines Merkmals­ bereichs 12 liegen. In Schritt 32 erfolgt die Ermittlung signifikanter Merkma­ le, anhand welcher sich die einzelnen Referenzdokumente eindeutig einer Klasse zuordnen lassen. Die Ermittlung signifikanter Merkmale erfolgt vor­ zugsweise durch Faktorenanalyse (PCA) der Referenzvektoren 16, deren Komponenten die einzelnen Merkmale der Referenzdokumente enthalten. Aus den ermittelten signifikanten Merkmalen, welche die Komponenten ei­ nes signifikanten Referenzvektors bilden, werden im folgenden Schritt 33 die Klassifizierungskriterien berechnet. Dies erfolgt vorzugsweise durch Be­ rechnung eines linearen Klassifizierers aus den signifikanten Referenzvekto­ ren.
Im rechten Teil der Fig. 4 ist die Klassifizierung einer zu klassifizierenden Banknote dargestellt. Es werden zunächst in einem ersten Schritt 40 Meßda­ ten, insbesondere das Druckbild, der Banknote erfaßt und in einem weiteren Schritt 41 analog Schritt 31 während des Adaptionsprozesses vorverarbeitet, wobei eine Vielzahl von Merkmalen auf der zu klassifizierenden Banknote erhalten wird. Im folgenden Schritt 42 wird aus der Vielzahl von Merkmalen des Dokuments eine Teilmenge von Merkmalen ausgewählt, welche eine höhere Signifikanz bei der Klassifizierung aufweisen als die übrigen Merk­ male des Dokuments. Bei der ausgewählten Teilmenge von Merkmalen han­ delt es sich um solche Merkmale, welche in Schritt 32 während des Adapti­ onsprozesses als signifikante Merkmale ermittelt wurden. Der von Schritt 32 in Richtung Schritt 42 verlaufende Pfeil soll andeuten, daß hierzu Daten, z. B. die Orte der als signifikant ermittelten Merkmalsbereiche oder die Trans­ formationsmatrix, aus dem Adaptionsprozeß an die eigentliche Klassifizie­ rung übergeben werden.
Die Klammer um die Schritte 41 und 42 soll andeuten, daß die beiden Schrit­ te 41 und 42 zusammengefaßt werden können. Die Ermittlung der Merkmale der Merkmalsbereiche 12 in Schritt 41 erfolgt hierbei nur noch für die in Schritt 32 während des Adaptionsprozesses ermittelten signifikanten Merk­ malsbereiche 14. Auf diese Weise reduziert sich die Berechnung der Merk­ male für eine Vielzahl von Merkmalsbereichen 12 auf die Berechnung ledig­ lich der signifikanten Merkmalsbereiche 14. Der Zeitaufwand bei der Klassi­ fizierung wird hierdurch deutlich vermindert.
In Schritt 43 wird aus den Merkmalen der ausgewählten Teilmenge die Klas­ se für das Dokument ermittelt, wobei die in Schritt 33 des Adaptionsprozes­ ses ermittelten Klassifizierungskriterien herangezogen werden. Auch dies ist durch einen entsprechenden Pfeil von Schritt 33 in Richtung Schritt 43 ange­ deutet. Insbesondere handelt es sich hierbei um einen linearen Klassifizierer, so daß die zu einem Merkmalsvektor zusammengefaßten signifikanten Merkmale des zu klassifizierenden Dokuments einfach durch Multiplikation mit einer Matrix M und Addition eines Vektors B auf die Klasse führen, wel­ che dem Dokument zugeordnet wird.
Während der Schritte 31 und 41 kann nach der Ermittlung der Merkmale 12 bereits eine Vorauswahl getroffen werden, in welcher solche Merkmale 12 von der weiteren Verarbeitung ausgenommen werden, welche im Bereich von typischen Störungen auf oder in den Dokumenten liegen. Dies können u. a. der Randbereich, Ecken sowie vertikale oder horizontale Streifen durch die Mitte des Dokuments sein. Da dort oft Schäden durch Risse, Fehlstellen, Knicke und Falten auftreten, ist die Ermittlung signifikanter Merkmale aus diesen Bereichen sowie die Klassifizierung anhand solcher Merkmale nicht ausreichend zuverlässig. Wie der Fig. 2 zu entnehmen ist, liegen die aus­ gewählten signifikanten Merkmale 14 nicht im Bereich der Ränder und Ec­ ken der Banknote 10. Außerdem befinden sich auf einem drei Einheiten brei­ ten vertikalen und einem zwei Einheiten breiten horizontalen Streifen durch die Mitte der Banknote ebenfalls keine signifikanten Merkmale 14.
Zur Abschätzung der Qualität einer Klassifizierung bei einer vorgenomme­ nen Adaption kann die zu erwartende Fehlerrate berechnet werden, welche den statistisch zu erwartenden Anteil falsch klassifizierter Dokumente an­ gibt. Die Fehlerrate kann aus den gegenseitigen Abständen der zu den ein­ zelnen Klassen gehörenden Bereichen 18 im Merkmalsraum der signifikan­ ten Merkmale abgeleitet werden.

Claims (11)

1. Verfahren zur Klassifizierung von Dokumenten, insbesondere Banknoten, bei welchem
Merkmale (12) eines zu klassifizierenden Dokuments (10) ermittelt werden und
anhand der Merkmale (12) des Dokuments (10) eine Klasse aus meh­ reren möglichen Klassen für das Dokument (10) ermittelt wird,
dadurch gekennzeichnet, daß
aus den Merkmalen (12) des Dokuments (10) solche Merkmale (14) ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Merkmale des Dokuments (10), und
anhand der ausgewählten Merkmale (14) die Klasse für das Doku­ ment (10) ermittelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die Merkmale (12) des Dokuments (10) einzelnen Komponenten eines Merkmalsvektors zugeordnet werden,
aus den Komponenten des Merkmalsvektors diejenigen Komponen­ ten ausgewählt werden, welche eine höhere Signifikanz aufweisen als die übrigen Komponenten des Merkmalsvektors,
die ausgewählten Komponenten die Komponenten eines signifikanten Merkmalsvektors bilden und
aus dem signifikanten Merkmalsvektor die Klasse für das Dokument (10) ermittelt wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die auszuwählenden Merkmale (14) bzw. Komponenten des signifikanten Merkmalsvektors in einem Adaptionsprozeß (30-33) anhand von Referenz­ dokumenten ermittelt werden.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß der Adapti­ onsprozeß (30-33) folgende Teilschritte aufweist:
für jede mögliche Klasse werden Merkmale (f1, f2) jeweils eines oder mehrerer Referenzdokumente ermittelt,
die Merkmale (f1, f2) jedes Referenzdokuments werden einzelnen Komponenten jeweils eines zu jedem Referenzdokument gehörenden Referenzvektors (16) zugeordnet,
mit den Referenzvektoren (16) wird eine Faktorenanalyse (PCA) durchgeführt, wobei signifikante Komponenten der Referenzvektoren (16) ermittelt werden, welche den Komponenten eines signifikanten Referenzvektors zugeordnet werden, und welche die auszuwählen­ den Komponenten des Merkmalsvektors des zu klassifizierenden Do­ kuments bilden.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Faktorena­ nalyse (PCA) folgende Schritte aufweist:
für jede mögliche Klasse wird ein mittlerer Referenzvektor ermittelt,
ein über alle möglichen Klassen gemittelter Referenzvektor wird er­ mittelt,
aus den mittleren Referenzvektoren und dem gemittelten Referenz­ vektor wird eine Korrelationsmatrix berechnet,
die Korrelationsmatrix wird diagonalisiert, wobei deren Eigenwerte mit deren zugehörigen Eigenvektoren bestimmt werden,
die Eigenwerte werden ihrer Größe nach sortiert,
aus den Eigenvektoren, die zu Eigenwerten gehören, welche größer sind als ein vorgegebener Schwellenwert, wird ein Satz orthonormaler Basisvektoren abgeleitet und zu einer Transformationsmatrix zusam­ mengefaßt, welche eine Transformation der Referenzvektoren zu den signifikanten Referenzvektoren beschreibt.
6. Verfahren nach einem der Ansprüche 4 bis 5, dadurch gekennzeichnet, daß die Klasse für das Dokument (10) anhand eines oder mehrerer Klassifi­ zierungskriterien ermittelt wird, welche aus dem signifikanten Referenzvek­ toren abgeleitet werden.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Ableitung von Klassifizierungskriterien durch Berechnung eines linearen Klassifizierers aus den signifikanten Referenzvektoren erfolgt.
8. Verfahren nach einem der Ansprüche 4 bis 7, dadurch gekennzeichnet, daß eine bei der Ermittlung der Klasse für das zu klassifizierende Dokument (10) zu erwartende Fehlerrate aus den Referenzvektoren ermittelt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die auszuwählenden Merkmale (14) nicht im Bereich von typischen Stö­ rungen auf oder in den zu klassfizierenden Dokumenten (10) bzw. Referenz­ dokumenten liegen.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß die Merkmale Meßwerte oder davon abgeleitete Werte von Merkmals­ bereichen (12, 14) angeben, wobei jeder Merkmalsbereich (12, 14) eine be­ stimmte Lage und Größe auf den zu klassifizierenden Dokumenten (10) bzw. Referenzdokumenten aufweist.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die Lage der Merkmalsbereiche (12, 14) und/oder deren Größe entsprechend der Größe des Dokuments (10) bzw. Referenzdokuments skaliert wird.
DE10045360A 2000-09-14 2000-09-14 Verfahren zur Klassifizierung von Dokumenten Ceased DE10045360A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE10045360A DE10045360A1 (de) 2000-09-14 2000-09-14 Verfahren zur Klassifizierung von Dokumenten
PCT/EP2001/010542 WO2002023492A2 (de) 2000-09-14 2001-09-12 Verfahren zur klassifizierung von dokumenten
AU2001291857A AU2001291857A1 (en) 2000-09-14 2001-09-12 Method for classifying documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10045360A DE10045360A1 (de) 2000-09-14 2000-09-14 Verfahren zur Klassifizierung von Dokumenten

Publications (1)

Publication Number Publication Date
DE10045360A1 true DE10045360A1 (de) 2002-03-28

Family

ID=7656113

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10045360A Ceased DE10045360A1 (de) 2000-09-14 2000-09-14 Verfahren zur Klassifizierung von Dokumenten

Country Status (3)

Country Link
AU (1) AU2001291857A1 (de)
DE (1) DE10045360A1 (de)
WO (1) WO2002023492A2 (de)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10117250A1 (de) * 2001-04-06 2002-10-17 Giesecke & Devrient Gmbh Verfahren zum Test von Meßsystemen
DE10145608A1 (de) * 2001-09-15 2003-05-08 Eads Deutschland Gmbh Modellbasierte Objektklassifikation und Zielerkennung
DE102004036229A1 (de) * 2004-07-26 2006-02-16 Giesecke & Devrient Gmbh Verfahren für die Prüfung von Banknoten
DE102005044092A1 (de) * 2005-09-15 2007-03-22 Giesecke & Devrient Gmbh Banknotenerkennung
DE102010021803A1 (de) * 2010-05-27 2011-12-01 Giesecke & Devrient Gmbh Vorrichtung zur Echtheitsprüfung von Wertdokumenten
DE102008000758B4 (de) 2007-04-09 2018-09-06 Denso Corporation Vorrichtung zum Erkennen eines Objekts in einer Abbildung

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6944333B2 (en) * 2003-04-30 2005-09-13 Ventana Medical Systems, Inc. Color image compression via spectral decorrelation and elimination of spatial redundancy
JP4893278B2 (ja) * 2006-12-01 2012-03-07 日本電気株式会社 証紙識別システム及び証紙識別方法
CN103646458B (zh) * 2013-12-23 2015-10-28 华中科技大学 主成份分析鉴别纸币真伪的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH684222A5 (de) * 1992-03-10 1994-07-29 Mars Inc Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze.
CH684856A5 (de) * 1992-11-30 1995-01-13 Mars Inc Verfahren zur Klassifizierung eines Musters - insbesondere eines Musters einer Banknote oder einer Münze - und Einrichtung zur Durchführung des Verfahrens.
DE19538004A1 (de) * 1995-03-31 1996-10-02 Fraunhofer Ges Forschung Verfahren zur Grobklassifizierung von Objekten
DE19636074C2 (de) * 1996-09-05 1999-08-12 Siemens Ag Lernfähiges Bildverarbeitungssystem zur Klassierung
DE29916927U1 (de) * 1999-09-28 2000-01-20 Weiss Andreas Vorrichtung für die Überprüfung der Echtheit von Banknoten

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3724014B2 (ja) * 1994-08-25 2005-12-07 ソニー株式会社 画像認識装置および画像認識方法
US5757001A (en) * 1996-05-01 1998-05-26 The Regents Of The University Of Calif. Detection of counterfeit currency
US6185337B1 (en) * 1996-12-17 2001-02-06 Honda Giken Kogyo Kabushiki Kaisha System and method for image recognition
GB2344446A (en) * 1998-12-02 2000-06-07 Mars Inc Classifying currency items

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH684222A5 (de) * 1992-03-10 1994-07-29 Mars Inc Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze.
CH684856A5 (de) * 1992-11-30 1995-01-13 Mars Inc Verfahren zur Klassifizierung eines Musters - insbesondere eines Musters einer Banknote oder einer Münze - und Einrichtung zur Durchführung des Verfahrens.
DE19538004A1 (de) * 1995-03-31 1996-10-02 Fraunhofer Ges Forschung Verfahren zur Grobklassifizierung von Objekten
DE19636074C2 (de) * 1996-09-05 1999-08-12 Siemens Ag Lernfähiges Bildverarbeitungssystem zur Klassierung
DE29916927U1 (de) * 1999-09-28 2000-01-20 Weiss Andreas Vorrichtung für die Überprüfung der Echtheit von Banknoten

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10117250A1 (de) * 2001-04-06 2002-10-17 Giesecke & Devrient Gmbh Verfahren zum Test von Meßsystemen
DE10145608A1 (de) * 2001-09-15 2003-05-08 Eads Deutschland Gmbh Modellbasierte Objektklassifikation und Zielerkennung
DE10145608B4 (de) * 2001-09-15 2006-01-26 Eads Deutschland Gmbh Modellbasierte Objektklassifikation und Zielerkennung
US8005261B2 (en) 2001-09-15 2011-08-23 Eads Deutschland Gmbh Model-based object classification and target recognition
DE102004036229A1 (de) * 2004-07-26 2006-02-16 Giesecke & Devrient Gmbh Verfahren für die Prüfung von Banknoten
DE102005044092A1 (de) * 2005-09-15 2007-03-22 Giesecke & Devrient Gmbh Banknotenerkennung
DE102008000758B4 (de) 2007-04-09 2018-09-06 Denso Corporation Vorrichtung zum Erkennen eines Objekts in einer Abbildung
DE102010021803A1 (de) * 2010-05-27 2011-12-01 Giesecke & Devrient Gmbh Vorrichtung zur Echtheitsprüfung von Wertdokumenten
US8917386B2 (en) 2010-05-27 2014-12-23 Giesecke & Devrient Gmbh Apparatus for checking the authenticity of value documents

Also Published As

Publication number Publication date
AU2001291857A1 (en) 2002-03-26
WO2002023492A2 (de) 2002-03-21
WO2002023492A3 (de) 2002-11-07

Similar Documents

Publication Publication Date Title
EP0692089B1 (de) Produktionsnahe farbkontrolle mit bildgebenden sensoren
DE10157958B4 (de) Bildverarbeitungsverfahren und-vorrichtung
EP0585724A2 (de) Verfahren und Vorrichtung zur Erkennung von Druckbildern auf Dokumenten
DE2801536A1 (de) Zeichenerkennungsvorrichtung
EP0560023A1 (de) Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze
DE3738304A1 (de) Vorrichtung zum pruefen von banknoten
CH684856A5 (de) Verfahren zur Klassifizierung eines Musters - insbesondere eines Musters einer Banknote oder einer Münze - und Einrichtung zur Durchführung des Verfahrens.
CH651145A5 (de) Verfahren und vorrichtung zum identifizieren des wertes einer banknote.
EP1576553A2 (de) Verfahren und vorrichtung für die überprüfung von banknoten
DE2921862A1 (de) Maschine fuer die automatische qualitaetskontrolle an frisch gedruckten banknoten und wertpapieren
EP3287951A1 (de) Verfahren für die urheberschaftsbewertung eines gemäldes sowie eine entsprechende verwendung
DE10045360A1 (de) Verfahren zur Klassifizierung von Dokumenten
WO2006133974A1 (de) Verfahren und vorrichtung zur erkennung einer münze unter verwendung ihres prägebildes
WO2011082792A1 (de) Verfahren zur prüfung von wertdokumenten
EP3111426A1 (de) Verfahren zum ermitteln eines sortierergebnisses für ein wertdokument und mittel zur durchführung des verfahrens
DE102005040662A1 (de) Verfahren zur Identifizierung von zu sortierenden Sendungen
EP2096578A2 (de) Verfahren und Vorrichtung zur Charakterisierung der Formation von Papier
WO2010089157A1 (de) Verfahren und vorrichtung zum verifizieren von dokumenten unter verwendung einer wavelet-transformation
EP1567991B1 (de) Verfahren und vorrichtung zur prüfung von wertdokumenten
EP3435056A1 (de) Druckinspektionsvorrichtung zur optischen inspektion eines druckbildes eines druckobjekts
EP1139285B1 (de) Verfahren und Vorrichtung zur Prüfung bzw. Untersuchung von Gegenständen
DE19917899C2 (de) Verfahren zur Fehlererkennung und Fehlerbewertung von Druckprodukten
DE10024559B4 (de) Verfahren zur Erkennung von Objekten
DE10066189B4 (de) Verfahren zur Erkennung von Objekten
DE10040614A1 (de) Verfahren zur automatischen Erkennung einer gerichteten Struktur

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8110 Request for examination paragraph 44
R016 Response to examination communication
R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final

Effective date: 20130926