DE19718805C2 - Verfahren und Anordnung zum Erkennen von Verteilinformationen - Google Patents

Verfahren und Anordnung zum Erkennen von Verteilinformationen

Info

Publication number
DE19718805C2
DE19718805C2 DE19718805A DE19718805A DE19718805C2 DE 19718805 C2 DE19718805 C2 DE 19718805C2 DE 19718805 A DE19718805 A DE 19718805A DE 19718805 A DE19718805 A DE 19718805A DE 19718805 C2 DE19718805 C2 DE 19718805C2
Authority
DE
Germany
Prior art keywords
distribution information
list
credibility
video coding
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE19718805A
Other languages
English (en)
Other versions
DE19718805A1 (de
Inventor
Richard Suchenwirth-Bauersachs
Walter S Rosenbaum
Udo Miletzki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE19718805A priority Critical patent/DE19718805C2/de
Priority to TW087103716A priority patent/TW394905B/zh
Priority to CA002289229A priority patent/CA2289229C/en
Priority to PCT/DE1998/000897 priority patent/WO1998050173A1/de
Priority to DE59805321T priority patent/DE59805321D1/de
Priority to KR10-1999-7010159A priority patent/KR100524477B1/ko
Priority to US09/423,211 priority patent/US6587572B1/en
Priority to JP54759998A priority patent/JP2001523161A/ja
Priority to EP98928086A priority patent/EP0980293B1/de
Priority to CN98801669A priority patent/CN1127380C/zh
Publication of DE19718805A1 publication Critical patent/DE19718805A1/de
Application granted granted Critical
Publication of DE19718805C2 publication Critical patent/DE19718805C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/20Arrangements for facilitating the visual reading of addresses, e.g. display arrangements coding stations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Description

Die Erfindung betrifft ein Verfahren und eine Anordnung nach den Oberbegriffen der unabhängigen Ansprüche und ist besonders vorteilhaft bei der Ermittlung von in nichtalphabetischen Schriften geschriebenen Verteilinformationen auf Sendungen einsetzbar.
Systeme zum automatischen Lesen von Verteilinformationen, insbesondere Adres­ sen (OCR) sind auf dem Gebiet der Briefbearbeitung wohlbekannt und z. B. in der DE 195 31 392 beschrieben. Mit modernen OCR-Briefsortieranlagen sind Bearbei­ tungsraten von 10 Briefen pro Sekunde, d. h. 36.000 Briefen pro Stunde und mehr erreichbar. Die Erkennungszuverlässigkeit variiert jedoch stark mit der Schriftart und Gesamtqualität der auf die Oberfläche der Briefe aufgebrachten Adreßinforma­ tion. Im Falle einer erfolgreichen Erkennung kann der betreffende Brief mit einem maschinenlesbaren Barcode versehen werden. Dieser Barcode erlaubt eine weitere mechanische Bearbeitung bis zu einer beliebigen gewünschten Sortierordnung. Insbesondere ermöglicht die Verwendung von Barcodes eine Sortierung der Briefe bis zur Sortierebene des Postgangs, bei der Briefe entsprechend der Reihenfolge ihrer Verteilung durch den Zusteller sortiert werden.
Ökonomische Trends und ein zunehmendes Postaufkommen im asiatischen Raum haben zu erhöhten Anstrengungen bei der automatischen Erkennung von östlichen Schriften geführt, um Kosten zu begrenzen und den Postservice zu erhöhen. Dabei treten gegenüber der Situation in westlichen Ländern, in denen die Postautomation eine bereits etablierte Technologie darstellt, neue Anforderungen an die Erken­ nungssysteme auf, die daher stammen, daß in den meisten Staaten des asiati­ schen Beckens chinesische Schriftzeichen zum lokalen Adressieren der Post ein­ gesetzt werden. Chinesische Schriftzeichen sind, anders als die Buchstaben west­ licher alphabetischer Schriften, als Ideogramme aufgebaut. Jedes dieser Ideo­ gramme kann ein Wort repräsentieren. Statt eines Alphabets mit einer Menge von dreißig bis sechzig Buchstaben sind 3.000 bis 6.000 verschiedene chinesische Schriftzeichen im täglichen Gebrauch, jedes mit einer eigenen charakteristischen Form. Diese praktische Nichtabgeschlossenheit des chinesischen Schriftzeichen­ systems und die ideographische Struktur der einzelnen Zeichen führt zu einer ver­ minderten Effektivität von OCR-Systemen im Vergleich zu westlichen alphabeti­ schen Schriftsystemen. Darüber hinaus werden Probleme dadurch verursacht, daß auf den Postsachen die Adresse entweder in vertikaler oder horizontaler Richtung orientiert erscheint und daß häufig Mischungen aus chinesischen und westlichen Schriften auftreten ("Kanji Recognition and Reconstruction in Postal Address", IBM Disclosure Bulletin, Vol. 37 No. 07, July 1994, Seiten 563/564).
Da generell die Erkennungsraten der automatischen Lesesysteme sowohl für west­ liche als auch für chinesische Schriftzeichen sehr variieren, ist es notwendig, diese durch verschiedene Formen von manueller Intervention zu unterstützen. Die ein­ fachste Intervention ist bei Zurückweisung nicht automatisch lesbarer Briefe die Durchführung eines Handsortierverfahrens. Allerdings sind die dadurch entstehen­ den Kosten mit zunehmenden Arbeitskosten unökonomisch hoch. Hinzu kommt, daß solche handsortierte Post auch zu einem späteren Zeitpunkt nicht mehr ohne weiteres mechanisch weitersortiert werden kann, so daß zwei voneinander ge­ trennte Ströme von Sendungen erzeugt werden, die wiederum manuell zu einem bestimmten Zeitpunkt verschmolzen werden müssen.
Um diese Nachteile manueller Sortierung von OCR-zurückgewiesenen Sendungen zu vermeiden, sind verschiedene Verfahren für eine manuelle Codierung von Post­ stücken entwickelt worden. Alle diese Verfahren verwenden Interventionen durch Operateure, um Barcodes auf die Sendungen auf eine Weise aufzubringen, die konsistent ist mit dem Erfordernis, eine mechanische Sortierung durch die gleichen Maschinen vorzunehmen, die OCR-gelesene und barcodierte Post bearbeiten.
Ein weiteres Verfahren, um zurückgewiesene Poststücke zu codieren, verwendet sogenannte manuelle Codierplätze. An diesen manuellen Codierplätzen werden die Sendungen physikalisch hintereinander einem Operateur vorgeführt, wobei der Operateur für jedes dieser Sendungen so viel Information codiert wie notwendig ist, um den Bestimmungsort eindeutig zu identifizieren. Dabei wird die eingegebene Adresse mittels eines Verzeichnisses in einen Sortierbarcode umgewandelt, der auf die Sendung aufgebracht wird. Die codierten Sendungen werden dann mittels Bar­ codesortierern (BCS), die mechanisch identisch mit OCR-geeigneten BCS sind, weiterbearbeitet. Solche manuellen Codierplätze wurden als erste von der US-Post und der Royal Mail in den 70er Jahren eingeführt. Die Hauptnachteile solcher Vor­ richtungen bestehen in der notwendigen Entfernung von Sendungen aus dem OCR- Sendungsstrom und ergonomischen Schwierigkeiten für den Operator beim Erken­ nen der ihm vorbeigeführten Sendungen.
Der nächste Fortschritt in der Behandlung von OCR-zurückgewiesener Sendungen war die Entwicklung von On-line-Videocodiersystemen (OVS). In einem OVS wird ein Videobild der Sendung einem Operator zum Codieren vorgeführt, statt der phy­ sikalischen Sendung bei den manuellen Codierplätzen. Das Videobild wird dem Operator gezeigt, während die physikalische Sendung in Verzögerungsstrecken gehalten wird. In diesen Verzögerungsstrecken wird normalerweise die Sendung in Bewegung gehalten für eine Zeitdauer, die ausreicht, damit der OVS-Operator die notwendige Sortierinformation für das betreffende Bild eingibt. Die üblichen Verzö­ gerungsstrecken erlauben eine Verzögerung zwischen 10 und 30 Sekunden. Je länger die Verzögerungsstrecke, desto größer sind die Kosten sowie die Erforder­ nisse für Wartung und die physische Größe der Anlage.
Aus der EP 0 726 540 A2 ist ein Verfahren zum Erkennen von Adressen auf Sen­ dungen mithilfe von Videocodierplätzen bekannt, an denen die aus den abgespei­ cherten Abbildern ermittelten Adressen mit Wörterbüchern abgeglichen werden.
Das Hauptproblem bei der Verwendung von OVS ist, daß die zur Verfügung ste­ hende Zeit lediglich ausreicht für eine sorgfältige Eingabe der Postleitzahl (ZIP) oder des Postcodes (PC), es sei denn, daß unpraktikabel lange Verzögerungs­ strecken verwendet werden.
Solange ein ZIP oder PC vorhanden ist, kann OVS auch für mit chinesischen Zei­ chen adressierte Sendungen effektiv eingesetzt werden. Allerdings ist der Anteil solcher Sendungen in vielen östlichen Ländern sehr gering und wird es auch in der vorhersehbaren nächsten Zukunft bleiben.
Daher wurden spezielle Codierverfahren entwickelt, um die notwendige On-line- Verzögerungszeit möglichst gering zu halten.
Um die Codierproduktivität zu erhöhen und/oder die Angabe von sämtlichen Adre­ ßelementen, d. h. ZIP/PC, Straße/Postfach, Adressat/Postfach, Adressat/Firma, zu ermöglichen, sind im Stand der Technik verschiedene Methoden entwickelt worden. Im wesentlichen sind dies:
Vorschau-Codierung
Bei der Vorschau-Codierung erfolgt ein simultanes Display der Bilder von zwei Sendungen erfolgt; eines über dem anderen. Hierbei ist das niedrigere Bild das ak­ tive, d. h. dessen Daten codiert werden. Nach einem geeigneten Training ist es Operatoren möglich, die Information auf dem unteren Bild zu codieren, während sie bereits die Adreßinformation vom oberen Bild visuell erfassen. Das obere Bild wird anschließend aktiv und der Prozeß wird fortgesetzt. Mit der Vorschau-Codierung ist es möglich, durch eine vollständige Überlappung der kognitiven und motorischen Funktionen beim Codieren aufeinanderfolgender Abbilder die Operator-Produktivität zu verdoppeln.
Extraktionscodierung
Da bei den praktisch erreichbaren On-line-Verzögerungs-Zeiten lediglich die ZIP/PC Adresselemente verläßlich vom Operator eingegeben werden können, werden beim Extraktionscodieren bestimmte Schlüsselbestandteile der sich auf die Straße bezie­ henden Adressbestandteile eingegeben. Üblicherweise basiert die Extraktionsco­ dierung auf speziell entwickelten Regeln, bei denen ein Code fester Länge als Zu­ gangsschlüssel zu einem Adressverzeichnis verwendet wird. Zum Beispiel verwen­ det die Royal Mail eine Extraktionsformel, die auf den ersten drei und den letzten zwei Buchstaben basiert. Dabei müssen Sonderregeln vom Operator auswendig gelernt werden, um überflüssige Adressinformationen zu vermeiden und bestimmte unterscheidende Merkmale wie z. B. Richtungen zu berücksichtigen, z. B. Ost, West oder Kategorien z. B. Street, Lane, Road.
In der US 4921107 A wird ein Postsortiersystem mit Videocodierung beschrieben, bei dem der Operateur nur die ersten Buchstaben des Namens eingibt und aus ei­ ner dann angezeigten Liste den richtigen Namen auswählt.
Extraktionscodierung besitzt trotz ihrer gewissen Effektivität einige größere Nach­ teile; insbesondere komplexe Extraktionsregeln, die häufig die Berücksichtigung des Endes eines Straßennamens erfordern, während diese Bestandteile bei hand­ geschriebenen Sendungen üblicherweise am unklarsten geschrieben sind. Außer­ dem findet man eine signifikant hohe Rate von nicht eindeutigen Extraktionen, bei denen mehrere Einträge in einem Verzeichnis dem Extraktionscode entsprechen, so daß keine eindeutige Sortierentscheidung getroffen werden kann. Desweiteren ist zu berücksichtigen, daß die Eingabeproduktivität der Operateure vermindert wird, sobald vom Operateur Entscheidungen getroffen werden müssen, statt einer einfa­ chen repetitiven Tastatureingabe.
Komplettierungscodierung
Bei der Komplettierungscodierung wird im Kontrast zur Extraktionscodierung für jede zu kodierende Adresse eine variable Eingabe vorgenommen. Im wesentlichen wird bei der Adreßeingabe ein Abgleich mit dem Adreßverzeichnis vorgenommen, bis eine eindeutige Übereinstimmung erreicht ist. Durch die Darstellung des Rests der Adresse, sobald eine eindeutige Teilübereinstimmung identifiziert worden ist, wird ein Beschleunigungseffekt erreicht. Probleme treten bei dieser Technik jedoch dadurch auf, daß dem Operateur ein Eingabestop-Signal zugeführt werden muß und eine Darstellung des identifizierten Adressrests notwendig ist, was zu einer verminderten Eingabeproduktivität führt und eine Vorausschaucodierung unmöglich macht.
Theoretisch können alle beschriebenen Videocodiertechniken auch für Sendungen mit chinesischen Schriftzeichen eingesetzt werden, obwohl das Fehlen von schnel­ len Eingabetechniken für chinesische Schriftzeichen ihre Brauchbarkeit marginal bleiben lassen.
Operator-assistierte OCR-Technik
Zur Erhöhung der on-line zu verarbeitenden Adreßinformation hat die US Post mit operator-assistierten OCR-Techniken experimentiert. Hierbei wird zur Erhöhung der Effektivität der Teil des Adreßbildes hervorgehoben, bei dem die OCR-Erkennung versagt hat. Da die Operateure bei der Entzifferung von fehlenden Buchstaben langsam sind und zum Teil auch komplexe Erkennungsfehler, z. B. Segmentie­ rungsprobleme auftreten, ist bei diesem Verfahren die Operateurproduktivität häufig niedriger als bei einfachen Wiedereingabe der betreffenden Adresse.
Off-line Codierung
Da bei keiner der oben erwähnten Codierungstechniken eine ausreichend hohe Produktivität bei reiner On-line-Codierung erreicht wird, wurde kürzlich ein off-line Codiersystem eingeführt, wie in der US PS 49 92 649 beschrieben. Bei diesem Sy­ stem werden Sendungen mit nicht erkannten Adressen mit einer zusätzlichen In­ formation, einer tracking identification (TID) versehen. Die nicht erkannten Sendun­ gen werden extern gespeichert, während die Bilder dieser Sendungen Operateuren zum Codieren präsentiert werden, wobei keine zeitlichen Einschränkungen im Se­ kundenbereich vorliegen. Anschließend werden die Sendungen TID-Lesegeräten vorgeführt. Die TID wird mit der eingegebenen Adreßinformation verknüpft. Darauf basierend kann auch eine übliche Barcode-Sortierinformation auf die Sendung auf­ gebracht werden, so daß die betreffende Sendung wie üblicherweise OCR- gelesene Sendungen bearbeitet werden können. Obwohl das off-line-Videocodier­ verfahren eine effektive Methode zur Codierung sämtlicher Adreßbestandteile dar­ stellt, werden zusätzlich Kapazitäten für die Weiterverarbeitung von mit nichtge­ lesenen Adressen versehenen Sendungen und eine entsprechend komplexe Logi­ stik verlangt.
Auch die operateurassistierten OCR-Techniken sind grundsätzlich für die Verarbei­ tung von Sendungen mit chinesischen Schriftzeichen geeignet, ermöglichen jedoch bisher keine schnelle Eingabe solcher Zeichen. Diese unbefriedigende Situation wird noch dadurch verschärft, daß an den Opera­ teur relativ hohe Anforderungen hinsichtlich des notwendigen Trainings und erfor­ derlicher Kenntnisse gestellt werden.
In "Postal Scale with Speech Recognition Feature", IBM Technical Disclosure Bulle­ tin, Vol. 37 No. 10, October 1994, Seiten 667/668 wird eine Postwaage beschrieben, die zur Reduzierung hoher manueller Eingabeaufwände eine Spracheingabe be­ sitzt. Dabei werden gesprochene Adreßangaben, die auch zur nachfolgenden Sor­ tierung verwendet werden können, erkannt.
Aufgabe der in den unabhängigen Ansprüchen 1 und 5 angegebenen Erfindung ist deshalb die Erhöhung der Erkennungssicherheit von Verteilinformationen in Form von auf Sendungen befindlichen Adressen, insbesondere in handgeschriebenen nichtalphabetischen Schriften, beim Videocodieren unter Verwendung einer Spracheingabe.
Dies wird erreicht, indem gleichzeitig in einer OCR-Einheit die Adresse ausgewertet wird und die Verteilinformationsvorschläge mit den über die Eingabeprozedur er­ haltenen Vorschlägen zu einer Gesamtliste von Verteilinformationsvorschlägen mit neuen Glaubwürdigkeiten zusammengefaßt werden.
Die Codiereingabe mittels Spracheingabeeinheit ermöglicht eine sehr schnelle Ein­ gabe der Adreßinformationen auch für relativ ungeübtes Personal und ist beson­ ders vorteilhaft bei der Kodierung handgeschriebener Adressen in chinesischen Schriftzeichen ohne Postcode (ZIP).
Vorteilhafte Ausführungsformen der Erfindung sind den abhängigen Ansprüchen zu entnehmen.
So können nach Anspruch 2 die Verteilinformationsvorschläge der OCR-Einheit mit den über Tasten eingegebenen Daten korreliert werden, um Fehler zu korrigieren. In einer weiteren vorteilhaften Ausgestaltung der Erfindung werden mittels stati­ stisch ermittelter Schwellwerte für Glaubwürdigkeitsmaße nach Anspruch 3 unplau­ sible Verteilinformationsvorschläge aus der Gesamtliste entfernt, so daß schneller und sicherer eine endgültige Auswahl getroffen werden kann.
Vorteilhaft ist es auch, nach Anspruch 4 besonders häufig adressierte größere Ziel­ gebiete mit einer Funktionstaste zu kennzeichnen.
Nachfolgend wird die Erfindung anhand von Zeichnungen näher erläutert. Dabei zeigen
Fig. 1 eine schematische Darstellung einer erfindungsgemäßen Anordnung
Fig. 2 einen Datenfluß bei der Codierung von Sendungen
Fig. 1 zeigt eine schematische Darstellung einer Briefverteilanlage zur Ausführung des erfindungsgemäßen Verfahrens. Ein OCR-Briefsortierer 10 besteht aus einer Zuführeinrichtung 11, die sukzessive Sendungen aus einem Magazin 12 abzieht und mit ca. 10 Sendungen pro Sekunde zu einem hochauflösenden Videoscanner 17 als Vorrichtung zur Gewinnung von Abbildern der Sendungen transportiert. An­ schließend werden die Sendungen in einer Verzögerungsstrecke 13 transportiert. Die Sendungen weisen üblicherweise auf ihrer Oberfläche Verteil-, insbesondere Adreßinformationen auf. In einer OCR-Einheit 20 erfolgt eine Auswertung der Adreßinformationen der Abbilder der Sendungen, die vom Videoscanner 7 gewon­ nen wurden. Im Fall einer vollständigen Auswertung wird ein Barcodedrucker 4 an­ gesteuert und die Sendung wird mit einem entsprechenden Barcode für die an­ schließende Sortierung in Sortierfächer 16 versehen. Die OCR-Einheit 20 besteht aus einem oder mehreren Microprozessoren 21 mit assoziiertem Speicher 22, um Abbilder der Sendungen zu speichern. Weiterhin beinhaltet die OCR-Einheit ein Wörterbuch 23 mit ZIP-Codes, Städtenamen und Straßennamen und evtl. weiterer adreßbezogener Information. Bei der Auswertung der Adreßinformation aufweisen­ den Abbilder erfolgt vorzugsweise eine merkmalsgesteuerte Reduktion der aus dem Adreßverzeichnis gewonnenen Eintragung, so daß eine Art Teilwörterbuch erzeugt wird. Den einzelnen Eintragungen werden dabei Glaubwürdigkeiten zugeordnet, so daß bei der Auswertung eine Anzahl von Daten von als richtig erkannten Adressen erzeugt werden. Die Vorrichtung enthält weiterhin eine Verarbeitungseinheit 30 so­ wie eine Anzahl Videocodierplätze 40, die mit der Verarbeitungseinheit 30 direkt oder durch ein lokales Netzwerk (LAN) 31 verbunden sind. Vorzugsweise werden Workstations als Videocodierplätze eingesetzt. Falls die OCR-Auswertung eines Abbildes nicht vollständig erfolgreich war, wird dieses Bild von der OCR-Einheit 20 zur Verarbeitungseinheit 30 transferiert, die u. a. einen TID Barcodedrucker 15 steuert und das entsprechende Bild zu einem der Videokodierplätze 40 sendet. Der TID Barcodeprinter 15 bringt auf die entsprechende Sendung einen Identifi­ kationskode TID auf, der es zu einem späteren Zeitpunkt ermöglicht, die ausgewer­ tete Adreßinformation mit der physikalischen Sendung zu knüpfen. Die Auswer­ tung der Abbilder erfolgt in diesem Fall vorzugsweise off-line, obwohl grundsätzlich bei einer genügend langen Verzögerungszeit auch eine on-line-Auswertung durch Videocodierung möglich ist. Im letzteren Fall kann der TID auch zu einem späteren Zeitpunkt, d. h. wenn die Videocodierung innerhalb einer bestimmten vorgegebenen Zeit nicht zu einer vollständigen Auswertung geführt hat, auf die Sendungen aufge­ bracht werden.
Wie schematisch angedeutet, ist an jeden Videocodierplatz 40 eine Tastatur 50 zur Tasteneingabe und eine Spracheingabeeinheit, bestehend aus einem Mikrofon 60 und einem Spracherkennungsmodul 70, angeschlossen.
Gemäß Fig. 2 liegt als Eingabe das Bild (in 2 oder mehr Graustufen) einer Sendung (z. B. Brief, Großbrief, Paket) mit Zusatzinformationen über Ergebnisse der vorheri­ gen Verarbeitung (z. B. Orientierung, Lage des Adreßblocks) an; als Ausgabe wird eine Zeichenkette bereitgestellt, die die dem Sendungsbild zugeordnete Verteilin­ formation enthält.
Das Sendungsbild wird auf dem Bildschirm des Videocodierplatzes dargestellt 100, wobei die möglichen Adreßfelder (ROIs) farbig umrandet und mit laufenden Num­ mern ab 1 gekennzeichnet sind. Die Vorzugs-ROI ist gegenüber den anderen ROIs durch eine andere Farbe (z. B. rot) hervorgehoben. Der Operateur entscheidet, ob das Sendungsbild einen sichtbaren und zur vorgesehenen Verteilung ausreichen­ den Postcode (ZIP) enthält 110. Falls ja, gibt er diesen über die Tastatur ein 120. Nach Abschluß der Eingabe wird die Gültigkeit des ZIP anhand einer Liste zulässi­ ger ZIPs geprüft 130, 140. Bei ungültigem ZIP wird ein Warnsignal (z. B. akusti­ sches Signal) gegeben 150 und erneute Eingabe erwartet 120. Bei gültigem ZIP wird dieser als Ergebnis ausgegeben und die Bearbeitung dieser Sendung ist be­ endet.
Falls das Sendungsbild keinen ausreichenden ZIP enthält, drückt der Operateur eine Warntaste 121 (z. B. ESC) und prüft, ob die Orientierung und ausgewählte Adreßregion (ROI) des Sendungsbildes korrekt bestimmt sind 200. Falls dies nicht der Fall ist, wählt er die korrekte Orientierung über Funktionstasten und/oder die korrekte ROI über Zifferntasten 210.
Die Zeichenerkennung (OCR) wird eingeleitet durch eine Entscheidung, ob in der Vorzugs-ROI Handschrift oder Maschinenschrift vorliegt. Diese Entscheidung wird über einen statistisch adaptierten Klassifikator vorbereitet 300 und vom Operateur bestätigt (über Leertaste) bzw. korrigiert (über z. B. die Tasten "H" bzw. "M") 310/400.
Liegt eine handschriftliche Adresse vor, so wird die multimediale Erkennung mittels Spracheingabe und Handeingabe angesteuert. Hierzu werden gleichzeitig die Vor­ zugs-ROI durch die Hand-OCR 320 bearbeitet; der Operateur gibt den Namen der Stadt (falls definiert) über Funktionstaste sowie die numerischen Bestandteile der Adresse (z. B. Hausnummer) über Zifferntasten ein 330; gleichzeitig spricht er den Namen der Stadt (falls nicht auf Funktionstaste definiert) oder andernfalls den Na­ men der Straße in das angeschlossene Mikrofon 340. Das analoge Sprachsignal vom Mikrofon wird in digitale Daten gewandelt und vom Spracherkennungsmodul bearbeitet 341, wobei eine mit Glaubwürdigkeitsmaßen bewertete Liste von Kandi­ daten erstellt wird.
Das Ergebnis der Hand-OCR 320 wird mit den eingegebenen Tastencodes 330 dergestalt korreliert 350, daß der Städtenamen, falls vorhanden, mit dem Städ­ tenamen, der sich aus der Hand-OCR ergibt, verglichen und jener im Konfliktfall korrigiert wird, und daß die Ziffernsequenz, die für die numerischen Adreßbestand­ teile steht, in Position und Wert mit dem OCR-Ergebnis verglichen und jenes im Konfliktfall korrigiert wird. Als Ergebnis der Korrelation liegt eine mit Glaubwürdig­ keitsmaßen bewertete Liste aus keiner, einer oder mehreren Zeichenketten vor, die jeweils für eine wohlgeformte Adresse stehen.
Das Ergebnis der Spracherkennung 341 wird mit den eingegebenen Tastencodes 330 derart zusammengesetzt 360, daß die Adreßbestandteile (Stadtname, Stra­ ßenname, Hausnummer usw.) in einer Zeichenkette in der richtigen Reihenfolge aufgereiht werden. Für jeden Kandidaten aus der Spracherkennung 341 wird eine entsprechende Zeichenkette erzeugt.
Die in den Schritten 350 und 360 erstellten Listen von Zeichenketten werden zu einer Gesamtliste in einheitlichem Format und mit bei Gleichheit der Zeichenketten kumulierten Glaubwürdigkeitsmaßen zusammengefaßt 370. Anhand von statistisch adaptierten Schwellwerten für Glaubwürdigkeitsmaße werden hinreichend unplau­ sible Ergebnisse aus der Gesamtliste entfernt 380. Als Ergebnis liegt hiernach eine Liste von Adreßalternativen vor.
Liegt eine maschinenschriftliche Adresse vor, so wird die Vorzugs-ROI in her­ kömmlicher Weise von einer auf Maschinenschrift parametrisierten OCR bearbeitet 410.
Das Ergebnis der Schritte 380 oder 410 werden mit einer herkömmlichen Adreßin­ terpretation 500 bearbeitet, die die syntaktische Wohlgeformtheit und lexikalische Existenz für jede Adreßalternative prüft, den entsprechenden ZIP aus dem Wörter­ buch bestimmt und eine oder mehrere Ergebnisalternativen, jeweils bestehend aus dem ZIP und der vollständigen oder hinlänglich eindeutigen Adreßzeichenfolge, als Ergebnis bereitgestellt.
Das Ergebnis der Adreßinterpretation wird in Form eines Auswahlmenüs (multiple choice) auf dem Bildschirm dargestellt 500, wobei diejenige Ergebnisalternative mit größter Glaubwürdigkeit an erster Position erscheint. Der Operateur prüft nun durch Vergleich des Sendungsbildes 100 und des Menüs 500, ob das der Sendung entsprechende Ergebnis im Menü enthalten ist 520. Ist dies der Fall, so markiert er durch Zifferntaste (bzw. durch Leertaste, die der ersten Alternative entspricht) das zutreffende Ergebnis 530. Der der ausgewählten Alternative zugeordnete ZIP wird als Ergebnis ausgegeben, und die Bearbeitung dieser Sendung ist beendet.
Ist das korrekte Ergebnis nicht im Menü enthalten, so schreibt der Operateur die Adresse über Buchstabentasten mit abgekürzt phonetischer oder einer anderen geeigneten Codierung ab 600. Die eingegebene Zeichenfolge wird mit einem weite­ ren Aufruf der herkömmlichen Adreßinterpretation bearbeitet und das Ergebnis wiederum in Menüform dargestellt 610. Der Operateur wählt das korrekte Ergebnis wie bei Schritt 530 aus 630 bzw. falls das korrekte Ergebnis nicht im Menü enthal­ ten ist, betätigt er die REJECT-Taste 640, was zu einem endgültigen Verwerfen der aktuellen Sendung führt. Diese muß dann mit Handverteilung o. ä. weiter bearbeitet werden.

Claims (5)

1. Verfahren zum Erkennen von Verteilinformationen auf Sendungen mit Hilfe von Videocodierplätzen (40) mit Bildschirm, Tastatur und Spracheingabeeinheit be­ stehend aus Mikrofon (60) und Spracherkennungsmodul (70), an die die aufge­ nommenen, digitalisierten und abgespeicherten Abbilder der die Verteilinforma­ tionen enthaltenden Sendungsoberflächen weitergeleitet werden, wobei
  • 1. mindestens die numerischen Teile der auf dem Bildschirm des Videocodier­ platzes (40) dargestellten jeweiligen Verteilinformation mittels der Tastatur (50) und Namen mittels der angeschlossenen Spracheingabeeinheit eingegeben werden,
  • 2. für jede Verteilinformation die mittels Tastatur (50) eingegebenen Daten und die über die Spracheingabeeinheit ermittelten, nach Glaubwürdigkeit bewerte­ ten Namenskandidaten zu einer Liste vollständiger Verteilinformationsvor­ schläge zusammengefaßt werden,
  • 3. nach Wörterbuchabgleich der oder die vorgeschlagenen Kandidaten mit den höchsten Glaubwürdigkeiten für die gültige Verteilinformation zur Bestäti­ gung/Auswahl auf den Bildschirm des Videocodierplatzes (40) gegeben wer­ den,
dadurch gekennzeichnet, daß für die jeweilige Verteilinformation zusätzlich in einer OCR-Einheit (20) eine Liste von nach Glaubwürdigkeiten bewerteten Verteilinformationsvorschlägen er­ zeugt wird, und diese Liste mit der über Tastatur und Spracheingabe ermittelten Liste der nach Glaubwürdigkeit bewerteten Verteilinformationsvorschläge zu einer Gesamtliste im einheitlichen Format mit sich aus beiden Listen ergebenden Glaubwürdigkeiten zusammengefaßt wird, aus der nach Wörterbuchabgleich der oder die Kandidaten mit den höchsten Glaubwürdigkeiten zur Bestätigung/­ Auswahl auf den Bildschirm des Videocodierplatzes (40) gegeben werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Verteilinformationsvorschläge der OCR-Einheit (20) mit den über die Ta­ sten eingegebenen Daten korreliert werden und im Konfliktfall eine Korrektur er­ folgt und die im Ergebnis erhaltene Liste der nach Glaubwürdigkeit bewerteten Verteilinformationsvorschläge zur Bildung der Gesamtliste verwendet wird.
3. Verfahren nach einem der Ansprüche 1 und 2, dadurch gekennzeichnet, daß in einem Plausibilitätsfilter mittels statistisch ermittelter Schwellwerte für die Glaubwürdigkeitsmaße unplausible Verteilinformationsvorschläge aus der Ge­ samtliste entfernt werden.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß neben den numerischen Teilen der Adreßinformation über Zifferntasten die umfangreicheren Sendungsziele über Funktionstasten eingegeben werden.
5. Anordnung zum Erkennen von Verteilinformationen auf Sendungen, die
  • 1. eine Vorrichtung zur Gewinnung von Abbildern von Sendungen (17),
  • 2. eine OCR-Einheit (20) zur automatischen Auswertung der Verteilinformationen aufweisenden Abbilder der Sendungsoberflächen,
  • 3. eine Vorrichtung zur Videocodierung der die Verteilinformationen enthaltenden Abbilder der Sendungsoberflächen, mit mindestens einem Videocodierplatz, ent­ haltend zur Dateneingabe neben einer Tastatur (50) eine Spracheingabeeinheit für Namen, die aus einem Mikrofon (60) und einem Spracherkennungsmodul (70) besteht,
  • 4. eine Verarbeitungseinheit (30), die die Datenflüsse zwischen den Ein- und Aus­ gabeeinheiten der Vorrichtung zur Videocodierung und der OCR-Einheit (20) steuert,
enthält,
dadurch gekennzeichnet, daß in der Verarbeitungseinheit (30) aus den über Sprach- und Tasteneingabe ermittelten, nach Glaubwürdigkeiten bewerteten Verteilinformationsvorschlägen eine Gesamtliste von Verteilinformationsvorschlägen mit sich aus beiden Listen ergebenden Glaubwürdigkeiten erzeugt wird, deren glaubwürdigste Vorschläge zu einem Videocodierplatz (40) übertragen und dort angezeigt werden.
DE19718805A 1997-05-03 1997-05-03 Verfahren und Anordnung zum Erkennen von Verteilinformationen Expired - Fee Related DE19718805C2 (de)

Priority Applications (10)

Application Number Priority Date Filing Date Title
DE19718805A DE19718805C2 (de) 1997-05-03 1997-05-03 Verfahren und Anordnung zum Erkennen von Verteilinformationen
TW087103716A TW394905B (en) 1997-05-03 1998-03-13 Method and arrangement to recognize distribution-information
PCT/DE1998/000897 WO1998050173A1 (de) 1997-05-03 1998-03-27 Verfahren und anordnung zum erkennen von verteilinformationen
DE59805321T DE59805321D1 (de) 1997-05-03 1998-03-27 Verfahren und anordnung zum erkennen von verteilinformationen
KR10-1999-7010159A KR100524477B1 (ko) 1997-05-03 1998-03-27 우편물 분배 정보를 인식하기 위한 방법 및 장치
US09/423,211 US6587572B1 (en) 1997-05-03 1998-03-27 Mail distribution information recognition method and device
CA002289229A CA2289229C (en) 1997-05-03 1998-03-27 Mail distribution information recognition method and arrangement
JP54759998A JP2001523161A (ja) 1997-05-03 1998-03-27 配送情報を認識する方法および装置
EP98928086A EP0980293B1 (de) 1997-05-03 1998-03-27 Verfahren und anordnung zum erkennen von verteilinformationen
CN98801669A CN1127380C (zh) 1997-05-03 1998-03-27 识别邮件分配信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19718805A DE19718805C2 (de) 1997-05-03 1997-05-03 Verfahren und Anordnung zum Erkennen von Verteilinformationen

Publications (2)

Publication Number Publication Date
DE19718805A1 DE19718805A1 (de) 1998-11-19
DE19718805C2 true DE19718805C2 (de) 1999-11-04

Family

ID=7828580

Family Applications (2)

Application Number Title Priority Date Filing Date
DE19718805A Expired - Fee Related DE19718805C2 (de) 1997-05-03 1997-05-03 Verfahren und Anordnung zum Erkennen von Verteilinformationen
DE59805321T Expired - Fee Related DE59805321D1 (de) 1997-05-03 1998-03-27 Verfahren und anordnung zum erkennen von verteilinformationen

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE59805321T Expired - Fee Related DE59805321D1 (de) 1997-05-03 1998-03-27 Verfahren und anordnung zum erkennen von verteilinformationen

Country Status (9)

Country Link
US (1) US6587572B1 (de)
EP (1) EP0980293B1 (de)
JP (1) JP2001523161A (de)
KR (1) KR100524477B1 (de)
CN (1) CN1127380C (de)
CA (1) CA2289229C (de)
DE (2) DE19718805C2 (de)
TW (1) TW394905B (de)
WO (1) WO1998050173A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008044833A1 (de) 2008-08-28 2010-03-04 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Steuern des Transports eines Gegenstands zu einem vorgegebenen Zielpunkt

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU747357B2 (en) * 1999-02-12 2002-05-16 Siemens Dematic Ag Method for reading document entries and addresses
DE19933984C2 (de) * 1999-07-20 2001-05-31 Siemens Ag Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen
US6539098B1 (en) 1999-09-24 2003-03-25 Mailcode Inc. Mail processing systems and methods
JP2001134716A (ja) * 1999-11-09 2001-05-18 Toshiba Corp 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置
DE10010241C1 (de) * 2000-03-02 2001-03-01 Siemens Ag Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen
JP3372925B2 (ja) * 2000-03-21 2003-02-04 日本電気株式会社 郵便情報入力装置とそのデータの表示方法
JP2004532735A (ja) * 2001-06-29 2004-10-28 シーメンス アクチエンゲゼルシヤフト 自動区分装置による送付物の仕分け方法
US20070102329A1 (en) * 2001-10-04 2007-05-10 Siemens Aktiengesellschaft Parcel dispatch manager system and method
FR2841160B1 (fr) * 2002-06-19 2004-07-23 Solystic Procede de traitement d'objets postaux utilisant la synthese vocale
EP1534440B1 (de) * 2002-09-03 2006-04-19 Siemens Aktiengesellschaft Verfahren und vorrichtung zum lesen der adressen von sendungen
US20040074964A1 (en) * 2002-10-22 2004-04-22 Ingrid Falkenrich-Wesche Multi-modal items tracking heritage
US20050264584A1 (en) * 2004-05-27 2005-12-01 Zhu-Min Di [method for fast input of chinese character]
DE102005017228A1 (de) * 2005-04-14 2006-10-19 Siemens Ag Verfahren und Anordnung zum Erkennen von Objekten in Sendungsbildern, ihrer Lage und Lesen ihrer postalischen Angaben
EP1951448A1 (de) * 2005-10-27 2008-08-06 Siemens Aktiengesellschaft Verfahren und vorrichtung zum lesen der adressen von sendungen
AU2007253305A1 (en) * 2006-05-23 2007-11-29 Siemens Aktiengesellschaft System and method for sorting objects using OCR and speech recognition techniques
US7925046B2 (en) * 2007-05-02 2011-04-12 Lockheed Martin Corporation Implicit video coding confirmation of automatic address recognition
US8005260B2 (en) * 2008-05-15 2011-08-23 Graham Packaging Company L.P. Correcting video coding errors using an automatic recognition result
KR101128507B1 (ko) * 2008-12-17 2012-03-28 한국전자통신연구원 영상 인식 기반 다국어 접수 정보 처리 방법 및 시스템
US8494857B2 (en) 2009-01-06 2013-07-23 Regents Of The University Of Minnesota Automatic measurement of speech fluency
US8380501B2 (en) * 2009-08-05 2013-02-19 Siemens Industry, Inc. Parcel address recognition by voice and image through operational rules
DE102009052062B3 (de) * 2009-11-05 2011-04-14 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transportieren von Gegenständen abhängig von Zielpunkt-Angaben
CN101804404B (zh) * 2009-11-28 2012-11-28 常州铭赛机器人科技有限公司 硅微型麦克风检测分拣机
DE102010034356A1 (de) 2010-08-16 2012-02-16 Siemens Aktiengesellschaft Verfahren zur nachweisbaren Auslieferung eines Gegenstands
DE102012200576A1 (de) 2011-02-02 2012-08-02 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transport eines Gegenstands unter Verwendung eines dreidimensionalen Modells dieses Gegenstands
DE102011007707A1 (de) 2011-04-19 2012-10-25 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Überwachen des Transports eines Gegenstandes
WO2013138633A1 (en) 2012-03-15 2013-09-19 Regents Of The University Of Minnesota Automated verbal fluency assessment
FR3008005B1 (fr) * 2013-07-04 2015-06-19 Solystic Procede pour trier des objets postaux au casier avec affichage d'une pile virtuelle d'images d'objet
CN103785620B (zh) * 2014-01-21 2016-01-27 珠海市迅时通信科技有限公司 一种布草防差错分拣方法及系统
CN105710041A (zh) * 2016-03-16 2016-06-29 宣邦智能科技(上海)有限公司 一种基于语音的智能仓库拣选系统及方法
US11615789B2 (en) * 2019-09-19 2023-03-28 Honeywell International Inc. Systems and methods to verify values input via optical character recognition and speech recognition
JP2022097138A (ja) * 2020-12-18 2022-06-30 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4921107A (en) * 1988-07-01 1990-05-01 Pitney Bowes Inc. Mail sortation system
US4992649A (en) * 1988-09-30 1991-02-12 United States Postal Service Remote video scanning automated sorting system
EP0726540A2 (de) * 1995-02-08 1996-08-14 Kabushiki Kaisha Toshiba Gerät und Verfahren zum Videokodieren
DE19531392C1 (de) * 1995-08-26 1997-01-23 Aeg Electrocom Gmbh Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
DE19624977A1 (de) * 1996-06-22 1998-01-02 Siemens Ag Verfahren zur Verarbeitung von Postsachen

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2591512B3 (fr) 1985-12-17 1988-03-11 Millet Jean Claude Procede d'indexation de courrier postal et systeme mettant en oeuvre un tel procede
DE3942932A1 (de) * 1989-12-23 1991-06-27 Licentia Gmbh Verfahren zum verteilen von paketen o. ae.
DE4324255C2 (de) * 1993-07-20 1998-02-05 Siemens Ag Verfahren und Vorrichtung zum Sortieren von mit Adreßinformationen versehenen Sendungen
US5558232A (en) * 1994-01-05 1996-09-24 Opex Corporation Apparatus for sorting documents
DE4419430A1 (de) * 1994-06-03 1995-12-07 Licentia Gmbh Verfahren zur Steuerung der Eingabestation für eine Briefsortieranlage
US5770841A (en) * 1995-09-29 1998-06-23 United Parcel Service Of America, Inc. System and method for reading package information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4921107A (en) * 1988-07-01 1990-05-01 Pitney Bowes Inc. Mail sortation system
US4992649A (en) * 1988-09-30 1991-02-12 United States Postal Service Remote video scanning automated sorting system
EP0726540A2 (de) * 1995-02-08 1996-08-14 Kabushiki Kaisha Toshiba Gerät und Verfahren zum Videokodieren
DE19531392C1 (de) * 1995-08-26 1997-01-23 Aeg Electrocom Gmbh Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
DE19624977A1 (de) * 1996-06-22 1998-01-02 Siemens Ag Verfahren zur Verarbeitung von Postsachen

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Kanji Recognition and Reconstruction in Postal Address" IBM Technical Disclosure Bulletin, Vol. 37, No. 07, July 1994, S. 563/564 *
"Postal Scale with Speech Recognition Feature" IBM Technical Disclosure Bulletin, Vol. 37, No. 10, October 1994, S. 667/668 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008044833A1 (de) 2008-08-28 2010-03-04 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Steuern des Transports eines Gegenstands zu einem vorgegebenen Zielpunkt

Also Published As

Publication number Publication date
CA2289229C (en) 2005-07-26
CN1243462A (zh) 2000-02-02
TW394905B (en) 2000-06-21
WO1998050173A1 (de) 1998-11-12
KR20010012210A (ko) 2001-02-15
CN1127380C (zh) 2003-11-12
DE59805321D1 (de) 2002-10-02
US6587572B1 (en) 2003-07-01
JP2001523161A (ja) 2001-11-20
EP0980293A1 (de) 2000-02-23
EP0980293B1 (de) 2002-08-28
CA2289229A1 (en) 1998-11-12
DE19718805A1 (de) 1998-11-19
KR100524477B1 (ko) 2005-10-31

Similar Documents

Publication Publication Date Title
DE19718805C2 (de) Verfahren und Anordnung zum Erkennen von Verteilinformationen
EP0975442B2 (de) Verfahren zur verarbeitung von postsachen
EP1015138B1 (de) Verfahren und anordnung zum erkennen von verteilinformationen auf sendungen
EP0938719B1 (de) Verfahren und vorrichtung zur erkennung von verteilinformationen auf sendungen
DE10021734C1 (de) Verfahren und Vorrichtung zum Ermitteln von Gebieten mit Verteilinformationen auf Sendungen
EP1259932B1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
EP1402462B1 (de) Verfahren und vorrichtung zum automatischen lesen von adressen in mehr als einer sprache
EP1534440B1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
DE19933984A1 (de) Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen
EP1546996B1 (de) Verfahren zum erzeugen von lern- und/oder teststichproben
EP1485865B1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
DE69629859T2 (de) Gerät und Verfahren zum Videokodieren
DE10064529C1 (de) Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
EP1229483B1 (de) Verfahren und Vorrichtung zum Lesen von Sendungsadressen mit Postkodes
DE10064226B4 (de) Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
EP1229484B1 (de) Verfahren und Vorrichtung zum Lesen von Sendungsadressen mit Postkodes
WO2007048452A1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee