-
Die
Erfindung betrifft ein Verfahren zum Identifizieren von Gegenständen bei
dem zu jedem Gegenstand eine Signatur erstellt wird, die charakteristische
Merkmale des Gegenstands umfasst, und die Gegenstände mehreren
Gegenstandsgruppen zugeordnet werden. Die Erfindung betrifft außerdem eine Vorrichtung
zum Identifizieren von Gegenständen
mit einer Recheneinheit zur Bildung einer Signatur zu einem Gegenstand,
die charakteristische Merkmale des Gegenstands umfasst, und zur
Zuordnung der Gegenstände
zu mehreren Gegenstandsgruppen.
-
Manche
industrielle Prozesse oder Verwaltungsprozesse, bei denen eine Vielzahl
gleichartiger Gegenstände
bearbeitet werden, erfordern eine bildhafte Identifizierung der
einzelnen Gegenstände. Beispielhaft
kann ein postalischer Prozess herangezogen werden, bei dem Postgut,
beispielsweise eine große
Anzahl von Briefsendungen, bearbeitet wird. Die Sendungen werden
zunächst
bildhaft registriert, wobei charakteristische Merkmale der einzelnen Sendungen
erfasst und daraus eine Signatur gebildet wird, die später im Prozess
oder in einem nachfolgenden Prozess als Unterscheidungskriterium
für jede
Sendung herangezogen werden kann, so dass eine Sendung wiedergefunden
werden kann. Eine solche Registrierung und Identifizierung ist beispielsweise
aus der
EP 1 222 037
B1 oder der
DE
40 00 603 C2 bekannt.
-
Zur
Identifikation einer Sendung wird die Oberfläche der Sendung erneut abgetastet
und eine erneute Signatur gebildet, die mit den hinterlegten Signaturen
der registrierten Sendungen verglichen wird. Hierzu werden die Signaturen
als Vektoren in einem Merkmalsraum betrachtet und der Abstand der erneuten
Signatur mit den bekannten Signaturen gebildet. Eine Sendung gilt
dann als identifiziert, wenn der Abstand zweier Vektoren minimal
wird.
-
Für die zuverlässige Anwendung
dieses Verfahren ist es notwendig, dass die Identifikation mit einer
geringen Fehlerrate durchgeführt
werden kann. Hierfür
werden Gewichte einzelner Merkmale und Zurückweisungskriterien für eine Zurückweisung
von nicht identifizierten Gegenständen experimentell bestimmt,
indem große
Mengen von denkbaren Gegenständen
identifiziert werden und daraus die experimentellen Ergebnisse gewonnen
werden. Gerade bei einem Vergleich von sehr verschiedenen Sendungen aus
Briefkastenpost und zusätzlich
sehr ähnlichen Massensendungen
kann es hierbei jedoch zu Fehlern kommen, da bei sehr ähnlichen
Massensendungen strengere Zurückweisungskriterien
angewendet werden sollten, um eine Fehlidentifizierung zu vermeiden,
als bei sehr verschiedener Briefkastenpost.
-
Es
ist daher die Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung
zum Identifizieren von Gegenständen
anzugeben, mit denen Gegenstände,
deren Unterschiedlichkeit sehr inhomogen ist, zuverlässig identifiziert
werden können.
-
Die
auf das Verfahren gerichtete Aufgabe wird durch ein Verfahren der
Eingangs genannten Art gelöst,
bei dem erfindungsgemäß zur Identifizierung der
Gegenstände
ein Unterscheidungskriterium zur Unterscheidung der Gegenstände einer
Gegenstandsgruppe in Abhängigkeit
einer Eigenschaft der Gegenstandsgruppe erstellt wird. Das Unterscheidungskriterium
kann speziell an die Gegenstände
der Gegenstandsgruppe angepasst und somit für eine zuverlässige Unterscheidung
besonders angepasst werden.
-
Die
Erfindung geht hierbei von der Überlegung
aus, dass gewisse Merkmale für
manche Gegenstände
eine gute und für
andere Gegenstände eine
schlechte Unterscheidungsfähigkeit
aufweisen, da sich die Gegenstände
gerade in dieser Eigenschaft sehr ähnlich sind. Während ein
erstes Merkmal für
eine Gruppe von Gegenständen
sehr gut zur Unterscheidung herangezogen werden kann, kann es für eine andere
Gruppe weniger geeignet sein.
-
Außerdem können die
einzelnen charakteristischen Merkmale unterschiedliche Wertebereiche aufweisen
und sollten daher zu einer geeigneten Unterscheidung normiert werden.
Die Wertebereiche einzelner Merkmale können je nach Sendungsart sehr
unterschiedlich sein, so dass eine geeignete Normierung für eine erste
Art von Gegenstände
anders ausfallen kann als für
eine andere Art von Gegenstände.
-
Des
Weiteren ist das Finden eines geeigneten Rückweisungskriteriums von großer Bedeutung. So
kann beispielsweise eine Signatur von einem Gegenstand, der gar
nicht registriert ist, z.B. wegen eines Doppelabzugs, zwar einen
geringsten Unterschied oder Abstand zu irgendeinem registrierten Gegenstand
aufweisen, dieser Unterschied wird jedoch in diesem Fall recht groß sein,
da nicht zwei Signaturen des gleichen Gegenstands sondern zwei Signaturen
verschiedener Gegenstände
miteinander verglichen werden. Es muss daher ein Mindestunterschied
oder Mindestabstand zwischen Signaturen gefunden werden, der für eine Identifikation
unterschritten werden muss. Je nach Unterschiedlichkeit von Gegenständen kann
dieser Mindestabstand jedoch für
eine Gruppe von Gegenständen
groß und für eine andere
Gruppe klein sein.
-
Die
Erfindung geht von der weiteren Überlegung
aus, dass die bearbeiteten Gegenstände in Gegenstandsgruppen unterteilbar
sein können,
beispielsweise bei einem Sortierprozess, bei dem alle Gegenstände eines
Sortierziels in einen Behälter
gegeben werden, und eine solche Gegenstandsgruppe in einem nachfolgenden
Identifikationsprozess wieder als Gruppe zusammen in die Vorrichtung
zur Identifikation gegeben wird. Ist diese Gegenstandsgruppe vor
der Identifikation bereits bekannt, so können geeignete Unterscheidungskriterien
speziell für die
Gegenstände
dieser Gegenstandsgruppe gebildet werden, mit denen die Gegenstände dieser
Gegenstandsgruppe zuverlässig
voneinander unterschieden werden können, die jedoch ggf. für die Unterscheidung
von Gegenständen
einer anderen Gruppe weniger geeignet sind. Ein zuverlässiges Unterscheidungskriterium
kann somit aus einer Eigenschaft der Gegenstandsgruppe gewon nen
werden, beispielsweise eine Art der Unterschiedlichkeit der Gegenstände der
Gegenstandsgruppe. Hierdurch kann eine Identifizierung oder Zurückweisung
von Gegenständen
mit einer geringen Fehlerrate erreicht werden.
-
Die
Gegenstände
sind vorzugsweise Postgut, wie Postsendungen, z.B. Briefe aller
Größen, Drucksachen,
Zeitschriften oder dergleichen. Ebenfalls denkbar sind Druckerzeugnisse,
insbesondere Dokumente, Formulare, Belege, Etiketten und Ähnliches.
Die Erfindung ist jedoch nicht auf die genannten Gegenstände beschränkt. Die
charakteristischen Merkmale können
Merkmale der Oberfläche
eines Gegenstands sein, insbesondere optische Merkmale wie Farbe,
Form und Helligkeit von Aufdrucken, Anzahl und Art von aufgedruckten
Bereichen, wie Wörtern,
Zeilen oder Grafiken, und/oder Lagen und Größen von solchen Bereichen absolut
auf dem Gegenstand oder relativ zueinander. Die Identifizierung
des Gegenstands wird zweckmäßigerweise
durch einen Vergleich der Signatur mit einer Vielzahl von in einer früheren Registrierung
gebildeten Signaturen von Gegenständen eines Suchraums erreicht.
-
Die
Eigenschaft der Gegenstandsgruppe kann eine Eigenschaft der Gegenstände dieser
Gegenstandsgruppe sein, wie eine Eigenschaft der Signatur dieser
Gegenstände,
insbesondere ein Unterschied zwischen den Signaturen dieser Gegenstände, beispielsweise
in Abhängigkeit
von einem der charakteristischen Merkmale.
-
In
einer vorteilhaften Ausgestaltung der Erfindung wird das Unterscheidungskriterium
erst gebildet, nachdem alle Gegenstände einer Gegenstandsgruppe
dieser Gegenstandsgruppe zugeordnet wurden. Vor einer Identifizierung
wird daher vorteilhafterweise kein weiterer Gegenstand der Gegenstandsgruppe
zugeführt.
Erst dann ist der Raum aller Signaturen dieser Gegenstandsgruppe
bekannt und das Unterscheidungskriterium kann in einer sogenannten Konsolidierung
an diesen Raum angepasst werden.
-
Eine
einfache Einteilung der Gegenstandsgruppen kann erreicht werden,
wenn die Gegenstandsgruppen nach Sortierkriterien der Gegenstände eingeteilt
werden. Diese können
bereits bei der Registrierung bekannt sein, wodurch eine spätere, separate
Zuordnung der Gegenstände
entfallen kann.
-
Vorteilhafterweise
werden zur Ermittlung der Eigenschaft alle Gegenstände der
Gegenstandsgruppe hinsichtlich zumindest eines charakteristischen
Merkmals miteinander verglichen. Es kann eine Unterschiedlichkeit
der Gegenstände
hinsichtlich dieses Merkmals erfasst und das Unterscheidungskriterium
an diese Unterschiedlichkeit angepasst werden. Zweckmäßigerweise
werden die Gegenstände
hinsichtlich mehrerer Merkmale miteinander verglichen, so dass das
Unterscheidungskriterium an mehrere Unterschiedlichkeiten angepasst werden
kann.
-
Gerade
bei Massensendungen kann es vorkommen, dass ein an sich charakteristisches
Merkmal nicht zu einer Unterscheidung der Gegenstände geeignet
ist, da die Gegenstände
bezüglich
dieses Merkmals gleich sind. Dann ist es zweckmäßig, dieses Merkmal zu erkennen,
um es gegebenenfalls aus dem Katalog von unterscheidungskräftigen Merkmalen
auszuschließen.
Hierfür
wird vorteilhafterweise zumindest eines der charakteristischen Merkmale zur
Erstellung des Unterscheidungskriteriums auf seine Unterscheidungsfähigkeit
innerhalb der Gegenstandsgruppe untersucht.
-
Um
für die
Identifizierung unterscheidungsfähige
gegenüber
weniger unterscheidungsfähigen Merkmalen
hervorzuheben, ist es vorteilhaft, wenn das Unterscheidungskriterium
eine Wichtung von charakteristischen Merkmalen umfasst. Diese Wichtung
berücksichtigt
zweckmäßigerweise
die gefundene Unterscheidungsfähigkeit
der Merkmale innerhalb der Gegenstandsgruppe.
-
Da
einzelne Merkmale unterschiedliche Wertebereiche aufweisen können, sollten
sie geeignet normiert werden, um Merkmale miteinander vergleichen
zu können.
Hierbei können
die Merkmale der Gegenstände
in der Gegenstandsgruppe auf ihre Wertebe reiche untersucht werden,
so dass eine für diese
Gegenstandsgruppe optimale Normierung der Merkmale erreicht wird.
Zweckmäßigerweise
umfasst daher das Unterscheidungskriterium eine Normierung von charakteristischen
Merkmalen.
-
Innerhalb
einer Gegenstandsgruppe, beispielsweise innerhalb von Sendungen
in einem Sendungsbehälter,
kann es vorkommen, dass Untergruppen von verschiedenen Gegenständen vorliegen, z.B.
zwei Arten von Massensendungen. Hierbei kann ein Merkmal für die eine
Untergruppe gut unterscheidend sein, für die andere Untergruppe jedoch
nicht. Eine Einteilung einer Gegenstandsgruppe in Untergruppen,
wobei das Unterscheidungskriterium für die Untergruppen unterschiedlich
festgelegt wird, kann einer solchen Konstellation Rechnung tragen
und dafür
sorgen, dass das Unterscheidungskriterium für beide Untergruppen vorteilhaft
gewählt
ist.
-
Eine
noch feiner differenzierte Festlegung des Unterscheidungskriteriums
kann erreicht werden, wenn es für
mehrere Gegenstände
der Gegenstandsgruppe individuell festgelegt wird, insbesondere
für jeden
Gegenstand der Gruppe individuell festgelegt wird.
-
Ein
zuverlässiges
Zurückweisungskriterium kann
bestimmt werden, wenn das Unterscheidungskriterium einen Mindestunterschied
zwischen den Gegenständen
bezüglich
eines der charakteristischen Merkmale umfasst. Ist die Signatur
eines zu identifizierenden Gegenstands einer hinterlegten Signatur ähnlicher
als der Mindestunterschied festlegt, kann eine weitgehend sichere
Identifizierung angenommen werden. Dadurch dass eine bei einer Registrierung
gebildete Signatur eines Gegenstands geringfügig verschieden sein kann von
der bei einer Identifizierung des selben Gegenstands gebildeten Signatur,
sollte der Mindestunterschied größer sein als
diese Verschiedenheit. Diese Verschiedenheit kann zustande kommen
beispielsweise durch ein zwischen der Registrierung und der Identifizierung aufgebrachtes
Entwertungszeichen oder ein in einem Umschlag verrutschtes Adressfeld
einer Sendung.
-
Hierbei
kann der Mindestunterschied ein globaler Mindestunterschied sein,
der für
alle Gegenstände
der Gruppe gleich ist, oder er kann für manche oder alle Gegenstände der
Gegenstandsgruppe unterschiedlich sein. Vorteilhafterweise ist die
Signatur durch einen Vektor darstellbar und das Unterscheidungskriterium
umfasst einen Abstand zwischen Vektoren.
-
Die
auf die Vorrichtung gerichtete Aufgabe wird durch eine Vorrichtung
zum Identifizieren von Gegenständen
der Eingangs genannten Art gelöst, bei
der die Recheneinheit erfindungsgemäß dazu vorgesehen ist, zur
Identifizierung der Gegenstände ein
Unterscheidungskriterium zur Unterscheidung der Gegenstände einer
Gegenstandsgruppe in Abhängigkeit
einer Eigenschaft der Gegenstandsgruppe zu erstellen. Es kann ein
zuverlässiges
Unterscheidungskriterium aus der Eigenschaft der Gegenstandsgruppe
gewonnen werden, wodurch eine Identifizierung oder Zurückweisung
von Gegenständen mit
einer geringen Fehlerrate erreicht werden kann.
-
Die
Erfindung wird anhand von Ausführungsbeispielen
näher erläutert, die
in den Zeichnungen dargestellt sind. Es zeigen:
-
1 ein
Ablaufschema eines Verfahrens zum Sortieren von Gegenständen, das
ein Verfahren zum Identifizieren von Gegenständen umfasst,
-
2 eine
Recheneinheit, die aus einem Bild eines Gegenstands eine Signatur
erzeugt,
-
3 zwei
Signaturvektoren in einem dreidimensionalen Merkmalsraum,
-
4 eine
Gruppe von Signaturvektoren in einem zweidimensionalen Merkmalsraum,
-
5 einen
Vektorcluster im Merkmalsraum,
-
6 zwei
verschiedene Vektorcluster im Merkmalsraum,
-
7 die
Normierung von Vektoren in einer Merkmalsdimension und
-
8 ein
Abstandsband bildende Abstände zwischen
Merkmalsvektoren.
-
1 zeigt
in einem Übersichtsschema
einen Ablauf eines Verfahrens zum Sortieren von Gegenständen, im
speziellen Fall von Postgut, wie Briefsendungen, das ein Verfahren
zum Identifizieren der Gegenstände
beinhaltet. 2 zeigt eine die Verfahren steuernde
Vorrichtung. In einem ersten Sortierlauf werden Sendungen 2,
wie in 2 schematisch beispielsweise an einem Brief dargestellt,
von einer Kamera 4 abgetastet, und aus dem erfassten Bild wird
in einer Signaturbildung 6 in einer Registrierung von einer
Recheneinheit 8 für
jede Sendung 2 eine Signatur 10 aus charakteristischen
Oberflächenmerkmalen
der jeweiligen Sendung 2 nach einer festgelegten Vorschrift
gebildet. Anschließend
oder vorher wird rein maschinell oder mit Hilfe einer Videokodierung
die Adresse einer jeden Sendung 2 gelesen 12.
Gemäß der Adresse
erfolgt ein Sortieren 14 der Sendungen 2 in eine
Anzahl von Behältern 16,
wobei jedem Behälter 16 beispielsweise
50 Postleitzahlen zugeordnet sind. Jeder Behälter 16 trägt eine
Identifikationsnummer, anhand derer er eindeutig erkannt werden
kann, beispielsweise von der Recheneinheit 8 in Verbindung
mit einem Lesegerät.
-
Ist
ein Behälter 16 voll
oder der Sortierprozess des ersten Sortierlaufs abgeschlossen, so
wird der Behälter 16 insofern
geschlossen 18, als dass ihm von nun an keine Sendungen 2 mehr
zugeordnet werden. Der Behälter 16 ist
von nun an geschlossen, und durch die in ihm lagernden Sendungen 2 wird eine
abgeschlossene Gegenstandsgruppe gebildet. Da die Sendungen 2 nach
ihrer Adresse in die Gesamtheit der Behälter 16 einsortiert
wurden, wurden die Gegenstandsgruppen nach Sortierkriterien der Gegenstände eingeteilt.
Der Recheneinheit 8 ist nun bekannt, welche Sendungen 2 in
einem oder mehreren geschlossenen Behältern 16 sind und
welche in einer Datenbank abgelegten Signaturen 10 diesen Sendungen 2 zugeordnet
sind.
-
In
einer nachfolgenden, zu den 3 bis 8 eingehender
beschriebenen Konsolidierung 20 untersucht die Recheneinheit 8 die
Signaturen 10 der Sendungen 2 in einem oder mehreren
Behältern 16.
Beispielhaft ist diese Konsolidierung anhand eines Behälters bzw.
dessen Gegenstandsgruppe beschrieben. Die Recheneinheit 8 ermittelt
aus den Signaturen 10 der Gegenstandsgruppe ein Unterscheidungskriterium,
mit dem in einer späteren
Identifizierung 26 einer der Sendungen 2 aus dem
Behälter 16 diese
Sendung 2 bzw. dessen Signatur 10 von den anderen
Sendungen 2 bzw. dessen Signaturen 10 unterschieden
werden kann. Das Unterscheidungskriterium wird somit in Abhängigkeit
einer Eigenschaft der Gegenstandsgruppe erstellt, da zur Bildung
dieses Unterscheidungskriteriums einige oder alle Signaturen 10 der
Sendungen im Behälter 16 untersucht werden.
-
Vor,
während
oder nach der Konsolidierung 20 werden die Behälter 16 einem
neuen Sortierlauf zugeführt 22.
Durch die Identifikationsnummer auf dem Behälter kann die Recheneinheit 8 erkennen, welche
Gegenstandsgruppe gerade zur Untersuchung bzw. zum Sortieren ansteht.
Je nachdem, ob die Behälter 16 der
gleichen Sortieranlage oder einer Sortieranlage in einem anderen
Briefzentrum zugeführt
werden, steht für
die Konsolidierung 20 weniger oder mehr Zeit zur Verfügung. Im
neuen Sortierlauf wird von der gleichen oder einer anderen Recheneinheit 8 von
allen Sendungen 2 erneut eine Signatur 10 aus
erneuten Aufnahmen der Sendungen 2 gebildet 24.
Der Recheneinheit 8 ist zusätzlich bekannt, zu welcher
Gegenstandsgruppe diese Signaturen 10 gehören müssten. In
einer anschließenden
Identifizierung 26 wird jede erneut gebildete Signatur 10 mit einigen
oder allen früher
aufgenommenen Signaturen 10 der Gegenstandsgruppe verglichen
und es wird – soweit
möglich – jeder
Signatur 10 eine frühere Signatur 10 zugeordnet.
Die Zuordnung kann hierbei unter Zuhilfenahme der Konsolidierungsergebnisse geschehen,
nach deren Unterscheidungskriterien die Zuordnung erfolgen kann.
Sie muss jedoch nicht nach diesen erfolgen, denn es kann eine auch
ohne diese Kriterien eindeutig identifizierbare Sendung 2 in
der Gegenstandsgruppe sein, beispielsweise eine mit einem eindeutig
identifizierbaren Strichcode. Eine solche Sendung 2 kann
ohne weitere Verfahren identifiziert werden.
-
Durch
die Identifizierung 26 der Sendungen 2 können zur
früheren
Signatur 10 in einem Datensatz zusätzlich abgespeicherte Daten,
wie die Adresse der Sendung 2, deren Größe, Gewicht, Steifigkeit, Frankierung
usw., der Sendung 2 erneut zugeordnet werden, ohne die
Sendung 2 erneut wiegen oder Ähnliches zu müssen. Schließlich werden
die Sendungen 2 anhand der mit der aufgefundenen Signatur 10 verknüpften Adresse
erneut und feiner sortiert 28.
-
Details
der Konsolidierung 20 sind in den 3 bis 8 schematisch
dargestellt. 3 zeigt zwei als Signaturvektoren 30, 32 dargestellte
Signaturen 10 in einem mehrdimensionalen Merkmalsraum,
der der Übersichtlichkeit
halber auf drei Dimensionen beschränkt ist, die durch die charakteristischen
Merkmale A, B und C bestimmt werden. Die beiden Signaturvektoren 30, 32 unterscheiden
sich etwas voneinander, d.h. die von der Kamera 4 abgetastete
Oberflächen
der entsprechenden Sendungen 2 sind etwas verschieden voneinander.
Bezüglich des
Merkmals A weichen die Signaturvektoren 30, 32 um
die Differenz ΔA und bezüglich
des Merkmals B um die Differenz ΔB voneinander ab. Die Gesamtdifferenz ΔAB ist
die vektorielle Summe der beiden Differenzen ΔA und ΔB.
Alle Differenzen ΔA, ΔB, ΔAB können
als Abstände
der beiden Signaturvektoren 30, 32 bezüglich des
Merkmals A, bzw. des Merkmals B oder beider Merkmale A, B zusammen
aufgefasst werden.
-
Bezüglich des
Merkmals C unterscheiden sich die Signaturvektoren 30, 32 nicht
voneinander, so dass hier die Differenz Null ist. Das Merkmal C
eignet sich somit nicht zur Unterscheidung der beiden Signaturvektoren 30, 32 bzw.
der entsprechenden Sendungen 2.
-
In 4 sind
eine Anzahl von Signaturvektoren 34 der Einfachheit halber
als Kreuzchen in einem zweidimensionalen Merkmalsraum der Merkmale
A, B dargestellt. Die Signaturvektoren sind aus Signaturen 10 von
sehr ähnlichen
Sendungen 2, beispielsweise Sendungen 10 eines
Großkunden
oder Postwurfsendungen, gebildet. Bezüglich des Merkmals B unterscheiden sich
die Signaturvektoren 34, wohingegen ihr Unterschied hinsichtlich
des Merkmals A so gering ist, dass dieser Unterschied von einer
Mess- oder Auswertetoleranz beim Aufnehmen bzw. Auswerten der Bilder
der Sendungen 10 herrühren
kann. Das Merkmal A ist somit nicht dazu geeignet, zu einer Unterscheidung
der Signaturen 10 herangezogen zu werden.
-
Stellen,
vereinfacht dargestellt, die Signaturvektoren 34 alle Sendungen 2 eines
Behälters 16 dar, so
wird die Recheneinheit 8 ermitteln, dass das Merkmal A
für eine
spätere
Identifikation einer Sendung 2 aus dieser Sendungsgruppe
ungeeignet ist. Ein Unterscheidungskriterium für die Sendungen 2 dieser Gruppe
kann somit aus einer Eigenschaft der Gruppe gewonnen werden, nämlich dem
Unterschied zwischen den Signaturen 10 dieser Gruppe, in
diesem Fall, dass das Merkmal A gering gedichtet oder zur Unterscheidung
gar nicht herangezogen wird, das Merkmal B jedoch geeignet ist und
herangezogen wird.
-
5 zeigt
einen Cluster 36 von Signaturvektoren 38, die
bezüglich
der Merkmale A und B sehr nahe beieinander liegen. Wird nun bei
der Konsolidierung 20 zur Erstellung eines Unterscheidungskriteriums
eines oder mehrere der charakteristischen Merkmale A, B von der
Recheneinheit 8 auf ihre Unterscheidungsfähigkeit
innerhalb der Gegenstandsgruppe untersucht, so wird die Recheneinheit 8 ermitteln,
dass sich diese Signaturvektoren 38, bzw. die hinter ihnen
stehenden Massensendungen, nicht anhand der Merkmale A, B unterscheiden
lassen. Das Unterscheidungskriterium umfasst somit die Information,
dass die Merkmale A, B nicht ausreichend unterscheidungskräftig sind
und zu einer Identifizierung andere Merkmale verwendet werden müssen, bei
einem Ausschließen
oder einem geringen Wichten der Merkmale A, B.
-
Ein
Beispiel hierfür
ist in 6 dargestellt. In einem Behälter 16 befinden sich
eine Vielzahl von zwei unterschiedlichen Massensendungen, deren
Signaturvektoren 40, 42 zwei Cluster 44, 46 bilden.
Sowohl die Signaturvektoren 40 als auch die Signaturvektoren 42 unterscheiden
sich innerhalb ei nes Clusters 44, 46 nur durch
geringe Abstände ΔA, ΔB.
Die Signaturvektoren 40 lassen sich jedoch anhand der Merkmale
A, B leicht von den Signaturvektoren 42 unterscheiden.
Die Recheneinheit 8 wird daher als ein Unterscheidungskriterium
festlegen, dass die Merkmale A, B dazu dienen können, den Suchraum auf einen
der Cluster 44, 46 zu beschränken. Innerhalb der Cluster 44, 46 müssen andere
Merkmale zur Unterscheidung gefunden werden.
-
Aus
dem Vergleich der Signaturen 10 in der Konsolidierung 20 ermittelt
die Recheneinheit 8 beispielsweise, dass das Merkmal C,
z.B. die Zeichenanzahl der Adressen – ermittelt aus der Größe eines Graubereichs
eines grob aufgelösten
Bilds der Sendungen 2, zur Unterscheidung der Signaturvektoren 40 des
Clusters 44 dienen kann. Außerdem ist das Merkmal D geeignet,
z.B. die Zeichenzahl des Zielorts der Adresse. Hinsichtlich des
Clusters 46 stellt die Recheneinheit 8 fest, dass
zwar das Merkmal C ebenfalls geeignet ist, das Merkmal D allerdings
nicht, da die Grauwerte bezüglich
des Zielorts alle gleich sind. In diesem Beispiel haben die Sendungen 2 alle
den gleichen Zielort, z.B. Hamburg. Anstelle des Merkmals D legt
die Recheneinheit ein weiteres Merkmal E zur Unterscheidung der
Signaturvektoren 42 des Clusters 46 fest, z.B.
die Länge
des Empfängernamens
bzw. der zweiten Zeile der Adresse.
-
Wird
in einem Identifikationsprozess 26 eine Signatur 10 durch
die Merkmale A, B einem der Cluster 44, 46 zugeordnet,
so wird die Recheneinheit 8 diese Signatur 10 bzw.
dessen Signaturvektor 40, 42 je nach Cluster 44, 46 anhand
der Merkmale C und D oder C und E von den anderen Signaturvektoren 42, 44 zu
unterscheiden suchen. Auf diese Weise kann eine Gegenstandsgruppe
in Untergruppen eingeteilt werden und das Unterscheidungskriterium
kann für die
Untergruppen unterschiedlich festgelegt werden. Eine Untergruppe
kann im Extremfall aus einer einzigen Sendung 2 bestehen,
so dass ein Unterscheidungskriterium für diesen – oder noch extremer – für jeden
Gegenstand der Gruppe individuell festgelegt wird.
-
In 7 sind
Signaturvektoren 48 dargestellt, die sich hinsichtlich
der Merkmale A und B unterscheiden. Die Signaturvektoren 48 sind
in 7 in Abhängigkeit
des Merkmals B als diagonale Kreuzchen und in Abhängigkeit
des Merkmals A als gerade Kreuzchen aufgetragen. Die Abhängigkeit
der Signaturvektoren 48 von den Merkmalen A, B ist jedoch
dadurch gekennzeichnet, dass die Werte der Signaturvektoren 48 bezüglich des
Merkmals B viel kleiner sind als bezüglich des Merkmals A. Das Merkmal
B sei in diesem Beispiel jedoch zur Unterscheidung ebenso wichtig
wie das Merkmal A. Um eine der Wichtigkeit angepasste Unterscheidung
mit den Merkmalen A, B zu ermöglichen,
werden die Signaturvektoren 48 hinsichtlich des Merkmals
B so normiert, dass ihre Werte denen des Merkmals A entsprechen.
Dies ist in 7 durch die gestrichelten Pfeile
ausgedrückt.
Es werden hierbei die Signaturvektoren 48' gebildet mit in den Merkmalen
A, B ähnlichen
Werten, und diese Signaturvektor 48' werden zur Unterscheidung herangezogen.
-
In 8 ist
mit Abständen 50 zwischen
Signaturvektoren ein weiteres Unterscheidungskriterium dargestellt.
Es kann vorkommen, dass eine Sendung 2 bei dem Verfahrensschritt
der Identifikation 26 nicht identifiziert werden kann und
zurückgewiesen
werden muss. Eine Ursache kann sein, dass zwei aneinander heftende
Sendungen 2 in einem Doppelabzug zusammenhängend vereinzelt
werden und die hintere Sendung 2 bei der Signaturbildung 6 der
Registrierung nicht erfasst wurde, die Sendung 2 jedoch
in den gleichen Behälter 16 wie
die vordere Sendung 2 sortiert wurde. Wird im späteren Sortierlauf
die Signatur 10 der zuvor hinteren Sendung 2 in
den Signaturen 10 der Gegenstandsgruppe des Behälters 16 gesucht,
kann die Signatur 10 nicht einer ersten Signatur 10 zugewiesen
und die Sendung 2 dadurch nicht erkannt werden. Zu einer
Zurückweisung
ist als spezielles Unterscheidungskriterium ein Zurückweisungskriterium
nötig.
-
Die
Bildung eines solchen Zurückweisungskriteriums
ist in 8 schematisch dargestellt. Zunächst werden zur Ermittlung
der Eigenschaft der Gegenstandsgruppe alle Signaturvektoren der art hinsichtlich
zumindest eines charakteristischen Merkmals miteinander verglichen,
dass ein Abstand 50 ΔA eines Signaturvektors zu allen anderen
Signaturvektoren bezüglich
eines Merkmals ermittelt wird. Es ist auch möglich, den Abstand 50 auf
mehrere oder alle Merkmale A, ... Z zu beziehen, so dass sich – bei einem
auf alle Merkmale bezogenen Abstand – jeweils ein Abstand 50 ΔGes ergibt.
Es ergibt sich hierdurch für
diesen Signaturvektor eine Anzahl von Abständen 50 ΔGes oder ΔA zu
allen anderen Signaturvektoren. Analog wird mit allen Signaturvektoren
verfahren, so dass schließlich
jeder Abstand 50 von jedem Signaturvektor zu jedem anderen
Signaturvektor bekannt ist. Diese Abstände 50 bilden ein
Abstandsband 52 mit einer Unterkante, die einen Mindestabstand 54 darstellt,
und einer Oberkante 56. Dieser Mindestabstand 54 stellt
ein Zurückweisungskriterium
dar.
-
Wird
nun bei einer Identifizierung 26 ein neuer Signaturvektor
einer zu identifizierenden Sendung 2 mit den aus der Gruppe
bekannten Signaturvektoren verglichen, so ergibt sich zu einem der
bekannten Signaturvektoren ein geringster Abstand 58, nämlich zu
dem, der dem neuen Signaturvektor am ähnlichsten ist. Der neue Signaturvektor
ist daher diesem bekannten Signaturvektor am nächsten. Liegt dieser Abstand 58 über dem
Mindestabstand 54, so ist die zu identifizierende Sendung 2 der ähnlichsten
Sendung 2 aus dem Behälter 16 unähnlicher
als eine andere Sendung 2 des Behälters 16. Eine Identifizierung
ist somit kaum zuverlässig
möglich
und die neue Sendung 2 wird als nicht identifiziert oder
als nicht identifizierbar zurückgewiesen.
Liegt ein Abstand 60 jedoch unter dem Mindestabstand 54,
so ist die zu identifizierende Sendung 2 der ähnlichsten
Sendung 2 aus dem Behälter 16 ähnlicher
als jede andere Sendung 2 des Behälters 16. In diesem
Fall gilt die entsprechende neue Sendung 2 als identifiziert.
-
In
einer Verfeinerung des Verfahrens kann ein Mindestunterschied 54 für jede Sendung 2 festgelegt
werden. Betrachtet werden beispielhaft 5 Signaturvektoren aus einer
Gegenstandsgruppe. Jeder dieser Signaturvektoren wird mit allen
anderen Signaturvektoren verglichen. Hierbei hat jeder Signaturvektor
zu einem anderen einen geringsten Abstand, beispielsweise der Signaturvektor
Nr. 1 den geringsten Abstand Δ1min. Dieser geringste Abstand kann bezüglich eines,
mehrerer oder aller Merkmale gewonnen werden, je nach Unterscheidungskriterium, das
beispielsweise wie zu den 3 bis 7 beschrieben
wurde. In dem folgenden Beispiel wird jeweils der Gesamtabstand
bezüglich
aller ausreichend unterscheidenden Merkmale gebildet. Für die beispielhaft
herangezogenen fünf
Signaturvektoren ergebe sich jeweils folgender geringste Gesamtabstand ΔGmin:
- Signaturvektor Nr. 1: ΔG1min = 55,6
- Signaturvektor Nr. 2: ΔG2min = 80,8
- Signaturvektor Nr. 3: ΔG3min = 77,1
- Signaturvektor Nr. 4: ΔG4min = 43,0
- Signaturvektor Nr. 5: ΔG5min = 61,9
-
Der
geringste Gesamtabstand des ersten Signaturvektors zu allen anderen
Signaturvektoren ist somit beispielhaft 55,6, der durch die Unterkante
des Abstandsbands festgelegte globale, für die gesamte Gegenstandsgruppe
geltende Mindestabstand 54 ist 43,0.
-
Wird
in einem Identifizierungsprozess ein neuer Signaturvektor mit allen
bekannten verglichen, ergebe sich beispielsweise, dass der neue
Signaturvektor dem bekannten Signaturvektor Nr. 2 mit einem Abstand
von 51,0 am nächsten
ist. Dieser Wert liegt über
dem Mindestabstand 54 von 43,0, womit der neue Signaturvektor
zurückgewiesen
werden könnte. Nun
ist jedoch der Mindestabstand ΔG2min des zweiten Signaturvektors 80,8. Der
neue Signaturvektor ist somit – obwohl
er über
dem globalen Mindestabstand 54 liegt – dem zweiten Signaturvektor
näher als
alle anderen bekannten Signaturvektoren. In diesem Fall kann der
einzelne Mindestabstand ΔG2min des zweiten Signaturvektors von 80,8
als Zurückweisungskriterium
festgelegt werden, so dass der neue Signaturvektor als identifiziert
gilt.
-
Auf
diese Weise können
sowohl sehr unterschiedliche Sendungen 2 aus Briefkastenpost
als auch sehr ähnliche
Sendungen 2 aus Massensendungen mit einer geringen Zurückweisungsrate
und einer geringen Fehlerquote identifiziert werden.