DE19547812C2

DE19547812C2 - Lesegerät für Schriftzeichenketten

Info

Publication number: DE19547812C2
Application number: DE19547812A
Authority: DE
Inventors: Toshikazu Fukushima; Eiki Ishidera; Masahiko Hamanaka; Daisuke Nishiwaki
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1994-12-20
Filing date: 1995-12-20
Publication date: 1999-08-05
Anticipated expiration: 2015-12-21
Also published as: US6014460A; JP2734386B2; DE19547812A1; JPH08171614A

Description

Die vorliegende Erfindung bezieht sich auf ein Lesegerät für Schriftzei chenketten zum Lesen von Schriftzeichenketten von Eingabebilddaten und, genauer, auf ein Lesegerät zum Lesen von auf Postsendungen oder auf eine Liste geschriebenen Adressen, ein Gerät zum Lesen von Sätzen in einem Schriftstück, ein Schreibstifteingabegerät zum Schreiben von Sätzen in einen Computer mit einem Eingabestift (stylus pen) oder ähnlichem.

Die hierbei erwähnten Schriftzeichen können sowohl die Buchstaben des Alphabets als auch z. B. chinesische Schriftzeichen sein.

Bei einem herkömmlichen Lesegerät für Schriftzeichenketten werden zunächst Bilddaten eingegeben, und dann wird ein jedem Schriftzeichen entsprechendes Segment aus den Bilddaten herausgeschnitten. Daraufhin wird für jedes Segment einzeln die Schriftzeichenerkennung durchgeführt. In einigen Fällen wird das Leseresultat einer Schriftzeichenkette bereits auf dieser Stufe ermittelt. Um jedoch das Leseresultat genauer zu machen, werden Einschränkungen für eine Aneinanderreihung von Schriftzeichen oder Worten für die Schriftzeichen der Segmente verwendet. In diesem Fall wird eine Kette von Schriftzeichenkandidaten als ein individuelles Erkennungsresultat mit einem Wörterbuch verglichen, um eine korrekte Schriftzeichenkette als Aneinanderreihung von Schriftzeichen oder Worten zu erhalten.

Das Lesen von Adressen gemäß der oben beschriebenen Verarbei tungsweise wird mit Bezugnahme auf Fig. 1A beschrieben.

Um eine Adresse zu lesen, werden die Bilddaten auf der Adressie rungsfläche einer Postsendung oder auf einer Liste eingegeben. In diesem Fall bedeuten "Worte" die Teile von Adressen, wie etwa die Stadt, den Bezirk, das Land, die Straße, die Namen von Staaten etc. In Japan sind es z. B. die Adressenteile To, Do, Fu und Ken.

Eine solche Unterteilung ist sowohl bei einer Adresse in Deutschland wie auch in einem anderen Land, z. B. in Japan, sinnvoll. Die nachfolgenden Erläuterungen beziehen sich dabei auf das Erkennen von in chinesischen Schriftzeichen geschriebenen japanischen Adressen, analog könnten jedoch auch mit Buchstaben des Alphabets geschriebene deutsche Adressen gelesen werden.

In Fig. 1A wird ein Segment 20, das jeweils einem Schriftzeichen entspricht, zunächst aus den zu lesenden Bilddaten 10 herausgeschnitten, und dann wird für jedes ausgeschnittene Segment 20 eine Schriftzeichenerkennung durchgeführt, um so verschiedene Schriftzeichenkandidatenketten 30 zu erhalten. Diese Schriftzeichenkandidatenketten 30 entsprechen Feldern von Schriftzeichenkandidaten, die als den korrekten Schriftzeichen der Bilddaten 10 ähnelnde Schriftzeichen ausgewählt wurden. Bei diesem Schritt werden mehrere mögliche Schriftzeichenkandidaten für ein einzelnes zu lesendes Segment ausgewählt. Z. B. werden in Fig. 1A drei Schriftzeichenkandidaten, nämlich die Zeichen <nishi<, <shina< und <dai< als Schriftzeichenkandidaten ausgewählt, die dem Segment 20 ganz links im Block 10 von Fig. 1A entsprechen bzw. diesem ähneln. Im Text der vorliegenden Beschreibung wird ein Wort, das durch ein chinesisches Schriftzeichen repräsentiert wird, in seiner Darstellung durch die Buchstaben des Alphabets (japanisch: "romaji") wiedergegeben. Insbesondere wird verwiesen auf die Fig. 1B, in der die in der vorliegenden Beschreibung verwendeten Schriftzeichen zusammen mit ihrer Wiedergabe durch die Buchstaben des Alphabets ("romaji") zusammengestellt sind. Die in spitzen Klammern wiedergegebenen Buchstabenfolgen entsprechen also jeweils der Aussprache bzw. Lesart eines chinesischen Schriftzeichens. Es ist jedoch noch anzumerken, daß für die meisten chinesischen Schriftzeichen verschiedene Aussprachemöglichkeiten, sogenannte verschiedene Lesungen, existieren. Im allgemeinen kann jedes japanische oder chinesische Schriftzeichen auf zwei oder mehr Arten gelesen, d. h. ausgesprochen werden, je nachdem, in welcher Form es mit anderen Schriftzeichen kombiniert wird. Die Zusammenstellung von Fig. 1B ist daher nicht notwendigerweise die einzige mögliche Lesart der dort dargestellten Schriftzeichen, sie gibt jedoch zumindest eine mögliche Lesart der Schriftzeichen wieder. Die Bedeutung des Schriftzeichens bleibt jedoch unabhängig von der Art, wie es gelesen wird, immer gleich.

Durch das Vergleichen der Schriftzeichenketten 30 mit einem Wörterbuch für Adressenelemente, welches tatsächlich existierende Adressenelemente enthält, wird eine Kombination von Adressenelementen, nämlich (<shina< <kawa< <ku<) (<naka<<nobu<) als beste Kombination ausgewählt, und diese Kombination wird schließlich als ein Adreßleseresultat 90 ausgewählt.

Diese Art von herkömmlichem Adressenlesegerät wird den "OCR Address Reading/Letter Sorting Machine for the Ministry of Posts and Telecommunications of Japan" (Druckschrift 1, Ishikawa et al., NEC Technical Journal, Bd. 44, Nr. 3, 1991), in "Japanese Address Reader-Sorter, Model TR-17" (Druckschrift 2, Torimoto et al., Toshiba Review, Bd. 45, Nr. 2, 1990), in der japanischen Offenlegungsschrift Hei-5-324899 "Recognition Device for Addresses written an Mails" (Druckschrift 3) und in der japanischen Offenlegungsschrift Hei-3- 189780 "Address Recognition Device" (Druckschrift 4) beschrieben.

Darüber hinaus werden herkömmliche Geräte zum Lesen von Sätzen in einem Schriftstück und herkömmliche Geräte zur Eingabe von Sätzen mit einem Schreibstift in "Implementation and Evaluation of Post Processing for Japanese Document Readers" (Druckschrift 5, Takao et al., Transactions of Information Processing Society of Japan, Bd. 30, Nr. 11, 1989), in "A method of detecting and correcting errors in the Japanese OCR" (Druckschrift 6, Ito et af., Transactions of Information Processing Society of Japan, Bd. 33, Nr. 5, 1992), in "Natural language processing in text recognition" (Druckschrift 7, Nishino, Journal of Information Processing Society of Japan, Bd. 34, Nr. 10, 1993, Seite 1274-1280), und in "On-line handwritten character recognition system" Sho-61-086883 (Druckschrift 8) beschrieben.

Nicht alle Schriftzeichen, die eine korrekte Schriftzeichenkette bilden, sind notwendigerweise in den Schriftzeichenkandidaten als einzelnes Schrift zeichenerkennungsresultat enthalten. Im Fall von Fig. 1A entspricht die korrekte zu lesende Schriftzeichenkette 10 einer Kombination der Schriftzeichenkandidaten, die in den Schriftzeichenkandidatenketten 30 enthalten sind. Wenn jedoch z. B. <kawa< in der zweiten Spalte der Schriftzeichenkandidatenketten 30 nicht enthalten ist und als Schriftzeichenkandidaten die in Block 30 von Fig. 2A dargestellten Schriftzeichen ausgewählt werden, so kann die korrekte Schriftzeichenkette <shina<<kawa<<ku<<naka<<nobu< nicht durch eine Kombi nation der Schriftzeichenkandidaten der Schriftzeichenkandidatenketten 30 erhalten werden.

Um schließlich das Leseresultat in einem solchen Fall zu ermitteln, wird gemäß einem ersten Verfahren bei der Schriftzeichenerkennung ein Vergleich mit einem Lesesprung (unvollständige Übereinstimmung) gestattet. Im Falle der Schriftzeichenkandidatenketten 30 aus Fig. 2A besteht die Möglichkeit, daß <shina<<kawa<<ku< <naka<<nobu< oder <shina<<kawa<<ku< <nishi<<naka<<nobu< als Kandidaten für das Adreßleseresultat 91 erhalten werden. Wird <shina<<kawa<<ku< <nishi<<naka<<nobu< ausgewählt, so findet diese Auswahl unter dem Gesichtspunkt der Beurteilung statt, daß ein Segment aufgrund der Mehrdeutigkeit des Ausschneidens von Schriftzeichen ein Segment zwei Schriftzeichen abdeckt.

Bei einem zweiten Verfahren wird die Anzahl von Schriftzeichen kandidaten zunächst vergrößert, um die Wahrscheinlichkeit des Auslassens eines korrekten Schriftzeichens zu verringern, und diese Schriftzeichenkandidaten werden mit einem Wörterbuch verglichen. In der japanischen Offenlegungsschrift Sho-62-251986 "Erroneously-read character correcting processing device" (Druckschrift 9) ist beschrieben, daß jedem Schriftzeichenkandidaten nach der Schriftzeichenerkennung ein weiteres Schriftzeichen, das diesem ähnelt, hinzugefügt wird, und dann werden diese Schriftzeichen auch mit einem Wörterbuch verglichen. Wird dieses Verfahren auf den Fall von Fig. 2A angewendet, so wird <kawa< den Schriftzeichenkandidaten als ein in seiner Form (ebenfalls bestehend aus drei nahezu senkrechten Strichen) dem Schriftzeichen <ko< in der zweiten Spalte des Blocks 30 aus Fig. 2A ähnelndes Schriftzeichen hinzugefügt.

Gemäß einem dritten Verfahren wird eine Schriftzeichenüber einstimmungsbedingung für den Vergleich erweitert, wenn der Vergleich mit dem Wörterbuch fehlschlägt. Z. B. wird in der japanischen Patentanmeldung Hei-3- 73086 "Character recognition post-processing system" (Druckschrift 10) beschrieben, daß die Schriftzeichenübereinstimmung bejaht wird, wenn die Anzahl der Striche in einem chinesischen Schriftzeichenkandidaten der des zu lesenden Schriftzeichens am nächsten kommt. Im Falle von Fig. 2A wird, da die Anzahl der Striche von <ko< aus der Gruppe von {<ko<, <hachi<, <yama<} nahe bei der von <kawa< liegt, entscheidet sich das System für die Übereinstimmung des zu beurteilenden Segments mit dem Schriftzeichen <kawa<.

Gemäß einem vierten Verfahren wird ein Schriftzeichenkandidat durch ein anderes Schriftzeichen ersetzt, wenn der Vergleich des Schriftzeichenkan didaten mit dem Wörterbuch fehlschlägt, und dann wird der neue Schriftzeichen kandidat mit dem Wörterbuch erneut verglichen. Bei der japanischen Offen legungsschrift Sho-58-4490 "Character recognition device" (Druckschrift 11) wird eine erste Schriftzeichenkandidatenkette mit dem Wörterbuch verglichen. Schlägt der Vergleich fehl, wird ein Kandidat durch einen neuen oder mehrere neue ersetzt, und die resultierende Schriftzeichenkette mit einem neuen Kandidaten wird erneut mit dem Wörterbuch verglichen. Darüber hinaus wird in der japanischen Offenlegungsschrift Hei-5-46814 "Character reading device" (Druckschrift 12) ein Schriftzeichenkandidat durch ein anderes Schriftzeichen ersetzt, das eine Form aufweist, die der Form des zu ersetzenden Schriftzeichenkandidaten ähnelt, und dann wird die Schriftzeichenkette erneut mit dem Wörterbuch verglichen.

Gemäß einem fünften Verfahren wird eine Vergleichsbedingung oder ähnliches geändert und die Verarbeitung wird vom Schritt der Schriftzeichen erkennung an erneut ausgeführt. In der japanischen Offenlegungsschrift Hei-2- 300972 "Electronic dictionary" (Druckschrift 13) wird ein Rastermaß, mit dem Bilddaten digitalisiert werden, verändert, und die Schriftzeichenerkennung wird erneut ausgeführt.

Berücksichtigt man, daß die Schriftzeichenerkennung auch auf verschiedene Schriftzeichenketten angewendet wird, die handgeschriebene Schriftzeichenketten enthalten, so besteht eine geringe Wahrscheinlichkeit, daß alle Schriftzeichen, die eine korrekte Schriftzeichenkette bilden, als Schrift zeichenkandidaten mit dem herkömmlichen Verfahren des Ausschneidens und der Schriftzeichenerkennung als Resultat erhalten werden. Dementsprechend ist es extrem selten, daß die korrekte Schriftzeichenkette von einem Lesegerät für Schriftzeichen ausgelesen wird, wenn dieses auf der Annahme basiert, daß alle Schriftzeichen, die die korrekte Schriftzeichenkette bilden, in den Schrift zeichenkandidaten, die als individuelle Erkennungsresultate erhalten werden, enthalten sind.

Es ist deshalb unabdinglich, daß ein Verfahren geschaffen wird, welches ein exaktes Lesen selbst dann ermöglicht, wenn nicht alle korrekten Schriftzeichen als individuelles Erkennungsresultat zur Verfügung stehen. Die oben erwähnten fünf Verfahren wurden vorgeschlagen, um diese Forderung zu erfüllen, jedoch haben die Verfahren (erstes bis fünftes Verfahren) die folgenden Nachteile.

Das erste Verfahren ist ein grundlegendes Verfahren, aber es bringt den Nachteil mit sich, daß eine große Anzahl von Schriftzeichenkandidaten als Leseresultat ausgewählt werden muß (d. h. es existiert eine große Anzahl von Möglichkeiten bzw. möglichen Kandidaten), und somit ist die Informationsmenge zu gering, um ein exaktes Leseresultat durch das Überprüfen einer großen Anzahl von Kandidaten (Einengen der Möglichkeiten) zu bestimmen.

Bei dem zweiten Verfahren wird die Anzahl der Möglichkeiten bzw. Kandidaten zuvor vergrößert, so daß viele Fälle auftreten können, bei denen eine große Anzahl von Möglichkeiten (Kandidaten) als endgültiges Leseresultat aus gewählt werden. Darüber hinaus wird, da die Anzahl von Schriftzeichenkandidaten vergrößert wird, auch die zu verarbeitende Datenmenge und die Verarbeitungszeit im allgemeinen entsprechend der Anzahl der Kombinationen vergrößert.

Bei dem dritten Verfahren wird eine große Anzahl von Kandidaten überprüft, es wird jedoch eine große Anzahl von Leseresultaten erzeugt, die in der Anzahl der Striche der chinesischen Schriftzeichen nahe beieinanderliegen, so daß der tatsächliche Effekt dieser zusätzlichen Einschränkung nicht ausreicht. Bei dem vierten und fünften Verfahren ist die Verarbeitungseffizienz gering, da der Vergleich mit dem Wörterbuch jedesmal erneut durchgeführt wird, wenn ein Schriftzeichenkandidat verändert wird.

Darüber hinaus kann in einigen Fällen, selbst wenn das korrekte Schriftzeichen in einer Schriftzeichenkandidatenkette enthalten ist, ein weiteres Leseresultat, das auf einem anderen Schriftzeichenkandidaten basiert, existieren. Gemeint ist, daß für mehr als eine Schriftzeichenkandidatenkette der Vergleich mit dem Wörterbuch positiv ausfällt. In einem solchen Fall stehen die beiden positiven Vergleichsresultate gegeneinander, und es muß entschieden werden, welches Resultat nun tatsächlich den Bilddaten entspricht. Ein solcher Fall wird in Fig. 2B gezeigt. Hier existieren im vierten Segment von links aus die Kandidaten <nishi< und <minami<, somit sind als Resultat die Schriftzeichenketten (<shina<<kawa< <ku< <nishi<<shina<<kawa<) und (<shina<<kawa<<ku< <minami<<shina<<kawa<) möglich, welche beide bei einem Vergleich mit dem Wörterbuch in diesem auch aufgefunden werden. Ein analoger Fall in der deutschen Sprache wäre z. B. die Erkennung "oben" und "Ofen", welche beide bei einem Vergleich mit einem Wörterbuch aufgefunden würden.

Die herkömmlichen oben beschriebenen Verfahren eins bis fünf wie oben beschrieben basieren auf der Annahme, daß das Schriftzeichenlesen nicht zufriedenstellend ausgeführt wird, oder daß ein Lesesprung auftritt, und somit sind diese Verfahren nicht zur exakten Auswahl eines Schriftzeichenkandidaten anwendbar, wenn mehrere Leseresultate (Schriftzeichenkandidaten) erhalten werden, bei denen kein Lesesprung auftritt. In solch einem Fall, wenn mehrere Kandidaten miteinander im Wettbewerb stehen, verwenden diese herkömmlichen Verfahren die Zuverlässigkeit der Erkennung eines Schriftzeichenkandidaten bestenfalls als einen Hilfsfaktor.

Hat z. B. im Falle von Fig. 2B <nishi< als Schriftzeichenkandidat eine höhere Zuverlässigkeit was das Lesen anbetrifft (d. h. eine höhere Kandida tenordnung) als <minami<, so wird <shina<<kawa<<ku< <nishi<<shina<<kawa< vorzugsweise als endgültiges Leseresultat ermittelt. Wenn jedoch ein Schrift zeichenkandidat unter der Bedingung ermittelt werden muß, daß ausreichende Informationen nicht erhalten werden, wenn mehrere Schriftzeichenkandidaten hintereinander im Wettbewerb stehen, so tritt ein Lesefehler auf.

Aus EP 0,312,905 ist ein Verfahren zur automatischen Zeichenerkennung bekannt, bei dem aus den mit Hilfe eines Zeichenklassifikators erechneten Einzelzeichen durch Wortanfang und Wortende markierte Zeichenfolgen gebildet werden, die mit gespeicherten Vergleichsstrings eines Kontext-Lexikons in Bezug auf Identität oder Ähnlichkeit überprüft werden. Das Kontext-Lexikon wird durch fortlaufendes Einle sen von keinerlei Rückweisungszeichen enthaltenen Strings fortlaufend aktualisiert, wobei das wiederholte Einlesen identischer Strings gezählt wird. Aktuelle Strings werden mit den Strings des Kontext-Lexikons verglichen und der in Bezug auf Ähn lichkeit und Häufigkeit bestmögliche String zur weiteren Auswertung ausgewählt. Eine aufgrund des Kontextvergleichs vorgesehene Korrektur wird nur dann durch geführt, wenn der Substitutionsübergang aufgrund der Klassifikatorcharakteristik für die jeweils in Betracht kommenden Zeichen wahrscheinlich ist.

Aus EP 0,553,745 ist ferner eine Zeichenerkennungsvorrichtung bekannt, bei der eine Zeichenkorrektureinheit einen korrigierten Zeichenstring von einem Satz von Zeichenkandidaten von der Zeichenerkennungseinheit auswählt, welcher in Bezug auf Grammatik und Vokabular korrekt ist.

Aus US 5,050,218 ist ferner eine Vorrichtung zur Erkennung einer Adresse auf ei ner Postsendung bekannt. Hierzu wird zunächst eine Schlüsselwort-/Postleitzahl- Erkennung durchgeführt, um die Anzahl der zur Ermittlung der endgültigen Adresse zu verwendenen Wörterbücher einzuschränken.

Eine Aufgabe der vorliegenden Erfindung besteht darin, ein Lesegerät für Schriftzeichenketten zu schaffen, welches in der Lage ist, eine genaue bzw. zutreffende Schriftzeichenleseoperation mit hoher Effizienz selbst dann durchzuführen, wenn nicht notwendigerweise korrekte Schriftzeichen in einem Auschneide-/Schriftzeichenerkennungsresultat enthalten sind, und welches auch in der Lage ist, eine genaue bzw. zutreffende Beurteilung durchzuführen, wenn ein korrektes Schriftzeichen mit einem anderen Schriftzeichenkandidaten im Wettbewerb steht, wodurch eine genaue bzw. zutreffende Schriftzeichenleseoperation durchgeführt wird.

Ein Lesegerät gemäß der vorliegenden Erfindung ist in Patentanspruch 1 definiert. Die abhängigen Ansprüche definieren besondere Ausführungsformen der Erfindung.

Ein Lesegerät für Schrift zeichenketten zum Lesen von Schriftzeichenketten aus Eingabebilddaten umfaßt gemäß einem Ausführungsbeispiel der Erfindung: eine Ausschneide-Erkennungseinrichtung, um ein Segment, das einem Schriftzeichen aus den Bilddaten entspricht, auszuschneiden, um individuelle Schriftzeichen erkennung für jedes Segment durchzuführen, einen Erkennungsresultatzwi schenspeicher, um ein Erkennungsresultat von der Ausschneide-Erkennungsvor richtung zu speichern, eine Wortsucheinrichtung, um einen Wortkettenkandidaten, der einer Kombination von Schriftzeichenkandidaten in dem Erkennungsresultat zwischenspeicher entspricht, zu suchen, einen Wortkettenkandidatenzwischen speicher, um ein Suchresultat der Wortsucheinrichtung zu speichern, eine Prüfanteilbestimmungsvorrichtung, um einen Prüfobjektanteil und eine vermutete Schriftzeichenkette des Prüfobjektanteils auf der Basis des Resultats in dem Wortkettenkandidatenzwischenspeicher zu ermitteln, und eine Prüfeinrichtung, um die Wahrscheinlichkeit des Vorliegens der vermuteten Schriftzeichenkette in dem Prüfanteil zu beurteilen.

Gemäß der vorliegenden Erfindung wird die Wahrscheinlichkeit des Vorliegens einer vermuteten Schriftzeichenkette dann überprüft, wenn ein korrektes Schriftzeichen nicht in einer Schriftzeichenkandidatenkette enthalten ist, und somit ein Lesesprung ausgeführt wird, oder wenn mehrere Leseresultate (Schriftzeichenkandidaten) auftreten, weil ein Schriftzeichenkandidat vorliegt, der mit einem korrekten Schriftzeichenkandidat im Wettbewerb steht.

Im Falle von Fig. 2A wird mit Bezug auf den ersten der Kandidaten 91 für ein Adreßleseresultat, bestehend aus <shina<<kawa<<ku<<naka<<nobu< das Zeichen <kawa<, welches übersprungen wird, weil es nicht in den Schriftzeichenkandidaten enthalten ist, als eine vermutete Schriftzeichenkette überprüft. Darüber hinaus wird mit Bezug auf den zweiten der Kandidaten 91 für ein Adreßleseresultat bestehend aus <shina<<kawa<<ku<<nishi<<naka<<nobu< die Schriftzeichenkette <kawa<<ku< als eine vermutete Schriftzeichenkette überprüft.

Im Falle von Fig. 2B werden mit Bezug auf die zwei Kandidaten 91 für ein Adreßleseresultat bestehend aus <shina<<kawa<<ku<<nishi<<shina<<kawa< und <shina<<kawa<<ku<<minami<<shina<<kawa< die beiden Schriftzeichen <nishi< und <minami<, welche miteinander im Wettbewerb stehen, als vermutete Schriftzeichenketten überprüft. Die zu lesenden Bilddaten sind dabei sowohl im Falle von Fig. 2A als auch im Falle von Fig. 2B die des Blocks 10 aus Fig. 1A.

Durch die Überprüfung wird die Information über einen zu überprü fenden Anteil zum Zwecke der Beurteilung vergrößert, und die Leseoperation kann mit größerer Genauigkeit durchgeführt werden, indem die vergrößerte Informa tionsmenge verwendet wird.

Darüber hinaus müssen nicht alle zu erkennenden Objekte erneut über prüft werden, sondern es genügt, lediglich Prüfobjektanteile zu überprüfen, und die Wahrscheinlichkeit eines Vorliegens einer vermuteten Schriftzeichenkette zu beurteilen, so daß im Vergleich zum herkömmlichen Verfahren die Verarbeitung effizienter durchgeführt werden kann.

Die Erfindung wird anhand verschiedener Zeichnungen im Detail erläutert, welche im einzelnen folgendes darstellen.

Fig. 1A zeigt ein Diagramm, welches den Verarbeitungsfluß einer herkömmlichen Adreßleseoperation darstellt;

Fig. 1 B zeigt eine Zusammenstellung von japanischen bzw. chinesi schen Schriftzeichen und ihrer Darstellung mit Hilfe von Buchstaben des Alphabets ("romaji");

Fig. 2A und 2B sind Diagramme, welche Schriftzeichenkandidatenketten und Kandidaten für Adreßleseresultate darstellen;

Fig. 3 ist ein Blockdiagramm, welches den Aufbau eines Lesegeräts für Schriftzeichenketten in einer Ausführungsform gemäß der vorliegenden Erfindung darstellt;

Fig. 4 ist ein Diagramm, welches die Operation eines ersten Verfahrens zur Realisierung der Prüfeinrichtung darstellt;

Fig. 5 zeigt ein Diagramm, welches die Operation eines zweiten Verfahrens zur Realisierung der Prüfeinrichtung darstellt;

Fig. 6 zeigt ein Blockdiagramm, welches ein erstes Verfahren zur Realisierung der Wortsucheinrichtung 5 darstellt;

Fig. 7 zeigt eine Markierungsverbindung durch ein erstes Realisie rungsverfahren der Markierungsverbindungssucheinrichtung;

Fig. 8 zeigt eine Markierungsverbindung durch eine zweites Realisie rungsverfahren der Markierungsverbindungssucheinrichtung;

Fig. 9 zeigt eine Markierungsverbindung durch eine drittes Realisie rungsverfahren der Markierungsverbindungssucheinrichtung;

Fig. 10 zeigt eine Liste von Adressenelementen;

Fig. 11 zeigt ein Beispiel des Inhalts eines Markierungswörter buchspeichers;

Fig. 12 zeigt ein Beispiel des Inhalts eines Markierungsinformations zwischenspeichers;

Fig. 13 zeigt ein Beispiel eines Musters eines Prüfobjektanteils;

Fig. 14 zeigt ein Beispiel eines Wörterbuchs, in dem ein Kontaktmodus zum Suchen nach Trennungspunkten registriert ist; und

Fig. 15 zeigt ein Beispiel der Erkennung der Trennungspunkte.

Im folgenden werden die bevorzugten Ausführungsbeispiele der vor liegenden Erfindung mit Bezugnahme auf die beiliegenden Zeichnungen erläutert.

Fig. 3 zeigt ein Blockdiagramm, welches das Lesegerät für Schriftzei chenketten gemäß einem Ausführungsbeispiel der vorliegenden Erfindung dar stellt.

In Fig. 3 umfaßt das Lesegerät für Schriftzeichenketten gemäß der vorliegenden Erfindung eine Bildeingabeeinrichtung 1 zur Eingabe von Bilddaten, einen Bildzwischenspeicher 2 zur Speicherung von Bilddaten, welche durch die Bildeingabeeinrichtung 1 eingegeben wurden, eine Ausschneide-Erkennungsein richtung 3 zum Ausschneiden eines Segments, welches jeweils einem Schrift zeichen der Bilddaten entspricht und zur Durchführung individueller Schriftzeichen erkennung für jedes ausgeschnittene Segment, einen Erkennungsresultatzwi schenspeicher 4 zum Speichern eines Resultats der Ausschneide-Erkennungs einrichtung 3, eine Wortsucheinrichtung 5 zum Suchen eines Wortkettenkandi daten, welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungsresultatzwischenspeicher 4 entspricht, einen Wortkettenkandidaten zwischenspeicher 6 zum Speichern eines Suchresultats der Wortsucheinrichtung 5, eine Prüfanteilbestimmungsvorrichtung 7 zum Bestimmen eines Prüfobjekt anteils und einer vermuteten Schriftzeichenkette des Prüfobjektanteils auf der Basis des Resultats in dem Wortkettenkandidatenzwischenspeicher 6; und eine Prüfeinrichtung 8 zur Beurteilung der Wahrscheinlichkeit des Vorliegens der vermuteten Schriftzeichenkette des Prüfobjektanteils, welcher durch die Prüfanteilbestimmungseinrichtung 8 bestimmt wurde.

Der Bildzwischenspeicher 2, der Erkennungsresultatzwischenspeicher 4 und der Wortkettenkandidatzwischenspeicher 6 können durch eine Speicher einrichtung wie z. B. einen IC-Speicher, eine magnetische Speicherplatte oder ähnliches realisiert werden. Die Bildeingabeeinrichtung 1 kann durch einen Bildscanner realisiert werden. Die Auschneide-Erkennungseinrichtung 3, die Wortsucheinrichtung 5, die Prüfanteilbestimmungseinrichtung 7 und die Prüfeinrichtung 8 können durch eine Zentraleinheit (CPU) eines Computers oder auch durch kundenspezifische Schaltungen realisiert werden.

Bezugnehmend auf Fig. 3 entspricht das vorher beschriebene herkömmliche Lesegerät für Schriftzeichenketten einer Zusammenstellung aller Elemente bis auf die Prüfanteilbestimmungseinrichtung 7 und die Prüfeinrichtung 8, d. h., das herkömmliche Lesegerät umfaßt eine Zusammenstellung bestehend aus der Bildeingabeeinrichtung 1, dem Bildzwischenspeicher 2, der Ausschneide- Erkennungseinrichtung 3, dem Erkennungsresultatzwischenspeicher 4, der Wortsucheinrichtung 5 und dem Wortkettenkandidatenzwischenspeicher 6, und der Verarbeitungsfluß des Lesegeräts ist identisch mit dem der herkömmlichen Technik, wie sie oben mit Bezugnahme auf Fig. 1A beschrieben wurde. Ein Verfahren zur Realisierung der oben beschriebenen Verarbeitungsweise wird in den Druckschriften 1 bis 13 wie oben beschrieben erläutert.

Die Prüfanteilbestimmungseinrichtung 7 und die Prüfeinrichtung 8, welche die Hauptmerkmale der vorliegenden Erfindung bilden, werden auf der Basis des folgenden Ausführungsbeispiels beschrieben.

Die nachfolgenden zwei Verfahren werden in der Prüfanteil bestimmungseinrichtung 7 zur Bestimmung eines Prüfobjektanteils verwendet.

(A) Bezüglich eines Wortkettenkandidaten (ein Kandidat bestehend aus einem Leseresultat oder auch Leseresultatkandidat) wird ein Anteil als Prüfobjektanteil ausgewählt, für den kein Schriftzeichenkandidat vorliegt, der einem den Wortkandidaten bildenden Schriftzeichen entspricht (d. h. ein Lesesprung-Anteil). In diesem Fall wird eine Schriftzeichenkette an dem Lesesprung-Anteil als vermutete Schriftzeichenkette festgelegt.

(B) Eine Vielzahl von Wortkettenkandidaten (Leseresultatkandidaten) werden miteinander verglichen, und ein Anteil, in dem sich diese Wortket tenkandidaten unterscheiden, wird als Prüfobjektanteil festgelegt. In diesem Fall wird eine Schriftzeichenkette an einem Anteil, bei dem teilweise Unterschiede festgestellt werden, als vermutete Schriftzeichenkette festgelegt.

Eine solche Beurteilung wird gemäß der folgenden Prozedur durch geführt. Dabei wird hier angenommen, daß der Wortkettendandidatenzwischen speicher 6, auf den während der Beurteilung Bezug genommen wird, gefüllt ist mit einer Schriftzeichenkette von Leseresultatkandidaten, mit Beurteilungsinformationen für jedes die Schriftzeichenkette bildende Schriftzeichen über das jeweilige Vorliegen oder Nichtvorliegen von einem Schriftzeichenkandidaten, welcher dem Schriftzeichen entspricht, sowie mit Informationen über eine entsprechende Segmentposition, wenn ein solcher Schriftzeichenkandidat vorliegt. Diese Informationen treten notwendigerweise während der Verarbeitung in der Wortsucheinrichtung 5 auf, und diese Informationen können gemäß dem Stand der Technik leicht von der Wortsucheinrichtung 5 ausgegeben werden.

Die Beurteilungsprozedur gemäß Verfahren (A) geschieht folgender maßen:

[Schritt A1]

Das Vorliegen oder Nichtvorliegen eines Schriftzeichenkandidaten wird für jeden Leseresultatkandidaten überprüft. Wird das "Nichtvorliegen" des Schriftzeichenkandidaten festgestellt, so wird die folgende Verarbeitung gemäß [Schritt A2] für aufeinanderfolgende derartige Leseresultatkandidaten gemeinsam ausgeführt.

[Schritt A2]

Eine Segmentposition, die einem Anteil entspricht, bei dem das "Nichtvorliegen" des Schriftzeichenkandidaten festgestellt wird (nachfolgend als "Nichtvorliegen-Anteil" bezeichnet), wird ermittelt, und diese Position wird als Prüfobjektanteil festgelegt. Darüber hinaus wird eine aus dem "Nichtvorliegen- Anteil" bestehende Schriftzeichenkette als vermutete Schriftzeichenkette festgelegt.

Die Beurteilungsprozedur gemäß Verfahren (B) geschieht folgender maßen:

[Schritt B1]

Eine Vielzahl von Schriftzeichenketten, die Leseresultatkandidaten darstellen, werden miteinander verglichen, um einen Anteil zu ermitteln, in dem sich die Schriftzeichenketten voneinander unterscheiden (nachfolgend bezeichnet als "Unterscheidungs-Anteil"). Die Verarbeitung gemäß [Schritt B2] wird dann für jeden Unterscheidungs-Anteil durchgeführt.

[Schritt B2]

Eine Segmentposition, welche einem Unterscheidungs-Anteil entspricht, wird ermittelt, und sie wird als Prüfobjektanteil festgelegt. Darüber hinaus wird eine sich unterscheidende Schriftzeichenkette als vermutete Schriftzeichenkette festgelegt.

Bei einer solch einfachen Beurteilung wie oben gemäß (B) beschrieben wird die Beurteilung mit einer äußerst hohen Rate "positiv" (d. h. die Häufigkeit des Feststellens von Unterschieden ist äußerst hoch), wenn mehrere Lese resultatkandidaten ausgewählt werden. Deshalb kann auch eine Einschränkung für die Anzahl von Schriftzeichen eines Unterscheidungs-Anteils gewählt werden (z. B. kann der Unterscheidungs-Anteil auf einen Anteil beschränkt werden, bei dem der Unterschied innerhalb von zwei Schriftzeichen auftritt.

Wenden wir uns nun wieder Fig. 2A zu. Im Fall von Fig. 2A treten zwei Leseresultatkandidaten 91 auf. Somit sieht der Inhalt des Wortketten kandidatenzwischenspeichers 6 folgendermaßen aus:

Leseresultatkandidat 1:

<shina< [Leseresultatkandidat "liegt vor", Segment (

1

,

1

)]
<kawa< [Schriftzeichenkandidat "liegt nicht vor", -]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (

3

,

1

)]
<naka< [Schriftzeichenkandidat "liegt vor", Segment (

4

,

1

)]
<nobu< [Schriftzeichenkandidat "liegt vor", Segment (

5

,

1

)]

Leseresultatkandidat 2:

<shina< [Schriftzeichenkandidat "liegt vor", Segment (

1

,

1

)]
<kawa< [Schriftzeichenkandidat "liegt nicht vor", -]
<ku< [Schriftzeichenkandidat "liegt nicht vor", -]
<nishi< [Schriftzeichenkandidat "liegt vor", Segment (

3

,

1

)]
<naka< [Schriftzeichenkandidat "liegt vor", Segment (

4

,

1

)]
<nobu< [Schriftzeichenkandidat "liegt vor", Segment (

5

,

1

)]

Wird die Beurteilung gemäß Verfahren (A) für diese Kandidaten durch geführt, so werden die folgenden Prüfobjektanteile und vermutete Schriftzeichen ketten bestimmt:

für den Leseresultatkandidaten 1,
Prüfobjektanteil: Segment (2, 1)
vermutete Schriftzeichenkette: <kawa<

für den Leseresultatkandidaten 2,
Prüfobjektanteil: Segment (2, 1)
vermutete Schriftzeichenkette: <kawa<<ku<

Bei der obigen Darstellung (n, m) der Segmentposition repräsentiert n die Kopfposition eines Segments und m repräsentiert die Breite eines Segments.

Hierbei ist erneut anzumerken, daß die Leseresultatkandidaten aus dem Vergleich der Schriftzeichenketten in Block 30 von Fig. 1A mit einem Wörterbuch resultieren. Bei dem Vergleich mit einem Wörterbuch findet man als tatsächlich existierende Kandidaten die beiden Leseresultatkandidaten 91, nämlich die erste Zeile <shina<<kawa<<ku< <naka<<nobu<, und die zweite Zeile <shina<<kawa<<ku< <nishi<<naka<<nobu<. Diese beiden Leseresultatkandidaten existieren als tatsächliche Adreßelemente. Beim Vergleich der ersten Zeile der Leseresultatkandidaten 91 mit Block 30 stellt man fest, daß das zweite Schriftzeichen <kawa< nicht in der zweiten Spalte des Blocks 30 aus Fig. 2A enthalten ist. Für die anderen Schriftzeichen der Leseresultatkette existiert ein entsprechendes Schriftzeichen in Block 30. Aus diesem Grund wird die Segmentposition (2, 1) für den Prüfobjektanteil festgelegt. Bei der Zeile darunter liegt der Fall etwas anders. Hier sind das erste Schriftzeichen <shina<, das vierte Schriftzeichen <nishi<, das fünfte Schriftzeichen <naka< und das sechste Schriftzeichen <nobu< in dem Block 30 der Schriftzeichenkandidaten aus Fig. 2A enthalten. Nicht enthalten sind dagegen das zweite und das dritte Schriftzeichen des unteren Leseresultatkandidaten 91, nämlich die Schriftzeichen <kawa< und <ku<. Es liegt also keine Entsprechung zwischen der zweiten Spalte von Block 30 und dem Leseresultatkandidaten vor. Aus diesem Grund wird bezüglich des Leseresultatkandidaten 2 das zweite Schriftzeichen als Prüfobjektanteil festgelegt, d. h. das Segment (2, 1) wird als Prüfobjektanteil festgelegt. Die diesem Prüfobjektanteil entsprechende vermutete Schriftzeichenkette ist <kawa<<ku<.

Des weiteren sieht im Falle von Fig. 2B der Inhalt des Wortketten kandidatenzwischenspeichers 6 folgendermaßen aus:

Leseresultatkandidat 1:

<shina< [Schriftzeichenkandidat "liegt vor", Segment (

1

,

1

)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (

2

,

1

)]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (

3

,

1

)]
<nishi< [Schriftzeichenkandidat "liegt vor", Segment (

4

,

1

)]
<shina< [Schriftzeichenkandidat "liegt vor", Segment (

5

,

1

)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (

6

,

1

)]

Leseresultatkandidat 2:

<shina< [Schriftzeichenkandidat "liegt vor", Segment (

1

,

1

)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (

2

,

1

)]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (

3

,

1

)]
<minami< [Schriftzeichenkandidat "liegt vor", Segment (

4

,

1

)]
<shina< [Schriftzeichenkandidat "liegt vor", Segment (

5

,

1

)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (

6

,

1

)]

Wird die Beurteilungsprozedur gemäß (B) für diese Kandidaten durch geführt, so werden die folgenden Prüfobjektanteile und vermutete Schriftzeichen ketten ermittelt:

für die Leseresultatkandidaten 1 und 2,
Prüfobjektanteil: Segment (4, 1)
vermutete Schriftzeichenkette: <nishi< und <minami<

Als nächstes wird ein Verfahren zur Realisierung der Prüfeinrichtung 8 beschrieben. Verschiedene Methoden zur Realisierung der Prüfeinrichtung können entsprechend dem Bestimmungsverfahren des Prüfobjektanteils (A) oder (B) wie oben beschrieben in Betracht gezogen werden.

Eine erste Methode zur Realisierung der Prüfeinrichtung 8 basiert auf der Annahme, daß der Prüfobjektanteil auf die Beurteilung gemäß (A) wie oben beschrieben festgelegt wird. Bei diesem Verfahren wird die Größe eines Prüfobjektanteils mit der Anzahl von Schriftzeichen einer vermuteten Schrift zeichenkette verglichen, und wenn das Vergleichsresultat nicht einer vorbestimm ten Bedingung genügt, so wird die Möglichkeit des Vorliegens einer vermuteten Schriftzeichenkette verneint. Hierbei besteht die "vorbestimmte Bedingung" z. B. darin, daß die Größe oder Fläche des Prüfobjektanteils durch eine Standard schriftzeichengröße geteilt wird, und das Resultat mit der Anzahl von Schriftzeichen einer vermuteten Schriftzeichenkette des Prüfobjektanteils ver glichen wird und das Vergleichsresultat (das Verhältnis) in einem Bereich von 0,5 bis 2,0 liegt. Die Standardschriftzeichengröße kann dabei vorher festgelegt werden, oder sie kann durch Berechnung des Durchschnitts der Schrift zeichengrößen der Schriftzeichen vor und hinter dem Prüfobjektanteil berechnet werden, oder sie kann auch als Durchschnittswert der Größe der lesbaren Schriftzeichen berechnet werden. Die Bedingung des obigen numerischen Bereichs für das Vergleichsresultat ist lediglich ein Beispiel und soll somit nicht als strenge Beschränkung verstanden werden. Es kann z. B. auch eine solche Bedingung verwendet werden, bei der unter Berücksichtigung der Anzahl der Schriftzeichen einer vermuteten Schriftzeichenkette beurteilt wird, ob der Prüfobjektanteil eine angemessene Größe aufweist.

Fig. 4 zeigt einen Fall, bei dem der Leseresultatkandidat 91 mit Hilfe der ersten Realisierungsmethode der Prüfeinrichtung 8 verworfen wird. Die zu lesenden Bilddaten befinden sich über dem Block 30 der Fig. 4A, und sie werden korrekt mit <shina<<kawa<<ku< <to<<go<<tan< <ta< gelesen. Der Anteil <to<<go<<tan< kann jedoch nicht exakt in einzelne Schriftzeichen aufgetrennt werden, da die Schriftzeichen diesen Anteils eng beieinander stehen, und somit werden die Schriftzeichen dieses Anteils als ein einzelnes Segment erkannt. Die Schriftzeichenkandidatenketten, welche im Block 30 von Fig. 4 dargestellt sind, bestehen deshalb nicht aus sieben Schriftzeichen, wie die zu erkennenden Bilddaten, sondern lediglich aus fünf Schriftzeichen.

Für den Adreß-Leseresultatkandidaten 91 aus Fig. 4, nämlich <shina<<kawa<<ku<<yutaka<<machi< existiert kein korrekter Schriftzeichenkan didat in dem Segment, welches <yutaka<, d. h. dem vierten Schriftzeichen des Leseresultatkandidaten 91, entspricht. Somit wird dieses als Prüfobjektanteil 70 festgelegt. Nun hat jedoch der Prüfobjektanteil 70 eine Fläche, welche etwa drei Schriftzeichen entspricht, während jedoch die vermutete Schriftzeichenkette <yutaka< aus lediglich einem Schriftzeichen besteht. Dementsprechend ist das Verhältnis 3/1 = 3, und somit erfüllt es nicht die oben beschriebene Bedingung. Aus diesem Grund wird der Adreß-Leseresultatkandidat 91, welcher aus <shina<<kawa<<ku<<yutaka<<machi< besteht, verworfen. Es ist hierbei wieder anzumerken, daß der Leseresultatkandidat aus einem Vergleich mit einem Wörterbuch resultiert, d. h. er besteht aus einem tatsächlich existierenden Adreßanteil. Er wird jedoch aufgrund des Anwendens der oben beschriebenen Einschränkung verworfen.

Eine zweite Realisierungsmethode der Prüfungseinrichtung 8 basiert auf dem Fall, in dem der Prüfobjektanteil durch eine Beurteilung entsprechend dem Verfahren (A) wie auch bei der ersten Realisierungsmethode festgelegt wird. Die Anzahl von Strichen von Schriftzeichenkandidaten in dem Erkennungsresultat zwischenspeicher 4, welche als Prüfobjektanteil ausgewählt werden, wird mit der Anzahl von Strichen einer vermuteten Schriftzeichenkette verglichen, und die Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette wird verworfen, wenn das Vergleichsresultat nicht einer vorbestimmten Bedingung genügt. Hierbei bedeutet die "vorbestimmte Bedingung", daß die Differenz zwischen der durchschnittlichen Anzahl von Strichen der Schriftzeichenkandidaten für das Segment, welches dem Prüfobjektanteil entspricht, und der Anzahl von Strichen der vermuteten Schriftzeichen ≦ 5 ist.

Des weiteren kann ein Verfahren vorgesehen werden, um ein Segment oder eine vermutete Schriftzeichenkette von einem Prüfobjekt auszuschließen, wenn die Anzahl von Schriftzeichen des Segments oder der vermuteten Schrift zeichenkette nicht gleich Eins ist. Weiter kann ein Verfahren vorgesehen werden, bei dem ein Durchschnittswert oder ein Summenwert von Strichzahlen des Prüfobjektanteils und der vermuteten Schriftzeichenkette miteinander verglichen werden. Auch muß nicht notwendigerweise die erlaubte Differenz ≦ 5 sein. Auch kann man sich etwa vorstellen, daß der Vergleich in zwei Fälle aufgeteilt wird, etwa derart, daß im ersten Falle eines der zu vergleichenden Schriftzeichen eine Strichzahl von größer gleich 10 aufweist, im zweiten Fall die Strichzahl beider Zeichen kleiner 10 ist, und der erlaubte Differenzwert entsprechend geändert wird. Ferner kann man sich vorstellen, daß die Bedingung nicht auf der durchschnittlichen Anzahl von Strichen der Schriftzeichenkandidaten des Prüfobjektanteils basiert, sondern z. B. auf deren maximaler Anzahl von Strichen oder der minimalen Anzahl von Strichen, oder die Bedingung könnte auch auf der Strichzahl eines ersten Schriftzeichenkandidaten des Prüfobjektanteils basieren.

Fig. 5 zeigt einen Fall, bei dem der Leseresultatkandidat 91 mit Hilfe der zweiten Realisierungsmethode der Prüfeinrichtung 8 verworfen wird. Die zu erkennenden Bilddaten sind wieder über dem Block 30 angeordnet, sie werden korrekt gelesen als <shina<<kawa<<ku<<yutaka<<machi<. Der Leseresultat kandidat 91 von Fig. 5 wird gelesen als <shina<<kawa<<ku<<hiro<<machi<. Man erkennt bei einem Blick auf den Block 30, welcher die Schriftzeichenkandidaten enthält, daß für das vierte Schriftzeichen der zu erkennenden Bilddaten, nämlich <yutaka<, kein korrekter Schriftzeichenkandidat ausgewählt wurde. Die vierte Spalte des Blocks 30 enthält kein Schriftzeichen, welches dem vierten Schrift zeichen <yutaka< der zu erkennenden Bilddaten entspricht. Der durch Wörter buchvergleich ausgewählte Leseresultatkandidat lautet <shina<<kawa<<ku< <hiro<<machi<. Für das vierte Schriftzeichen <hiro< dieses Leseresultatkandi daten 91 findet sich im Block 30 kein entsprechender Schriftzeichenkandidat. Dementsprechend wird als Prüfobjektanteil 70 das <hiro< entsprechende Segment ausgewählt. Die diesem Segment entsprechenden Schriftzeichenkandidaten des Blocks 30 <ha< (Zeile 1, Spalte 4), <shina< (Zeile 2, Spalte 4) und <shio< (Zeile 3, Spalte 4) wurden als Schriftzeichenkandidaten für das dem Prüfobjektanteil 70 entsprechende Segment ausgewählt. Die Anzahl der Striche ist für den Schriftzeichenkandidaten <ha< 12, für den Schriftzeichenkandidaten <shima< 10 und für den Schriftzeichenkandidaten <shio< 15 Striche. Die durchschnittliche Anzahl ist dementsprechend 12 Striche. Andererseits ist die Strichzahl des vermuteten Schriftzeichens <hiro< lediglich fünf Striche. Dementsprechend beträgt die Differenz zwischen der durchschnittlichen Anzahl von Strichen der Schriftzeichenkandidaten aus der vierten Spalte von Block 30 und dem vermuteten Schriftzeichen 7 Striche. Diese Differenz ist größer als die vorbestimmte Anzahl von Fünf, und somit wird der Kandidat 91 des Adreß-Leseresultats <shina<<kawa< <ku<<hiro<<machi< verworfen.

Die eben beschriebene Methode basiert auf dem Ausführungsbeispiel, welches lediglich die Anzahl von Strichen verwendet. Darüber hinaus kann auch ein Komplexitätsindex ("complexity Index") wie in "SIG Reports of the Institute of Electronics, Information and Communication Engineers, PRL 73-14" beschrieben, als ein Index verwendet werden, welcher die Komplexität einer Kombination von Strichen eines Schriftzeichens darstellt. Im Fall von Fig. 5 wird die Komplexität des Schriftzeichenkandidaten des Segments, welches dem Prüfobjektanteil 70 entspricht, ebenfalls gleichzeitig mit der Überprüfung der Differenz der Gesamtstrichzahl berechnet, um so zu beurteilen, ob der berechnete Kom plexitätswert nahe bei dem Komplexitätswerts des vermuteten Schriftzeichens liegt. Die abschließende Beurteilung wird auf der Basis einer Kombination der eben erwähnten Komplexitätsbeurteilung und dem Vergleichsresultat der Gesamtstrich zahl durchgeführt.

Die Komplexität wird sowohl in vertikaler als auch in horizontaler Richtung der Schriftzeichen berechnet. Deshalb kann, selbst wenn die Differenz in der Anzahl von Strichen zwischen dem vermuteten Schriftzeichen und den Schriftzeichenkandidaten als nicht signifikant beurteilt wird, eine detailliertere Beurteilung auf der Basis der Komplexität der Striche in vertikaler Richtung und der Komplexität der Striche in horizontaler Richtung durchgeführt werden. So sei z. B. das vermutete Schriftzeichen <kawa< und der Schriftzeichenkandidat des Segments <san< (siehe Fig. 1B, <kawa< steht in Zeile 4, Spalte 1 des ersten Blatts von Fig. 1B, <san< steht in Zeile 11, Spalte 2 des ersten Blatts von Fig. 1B). Die Anzahl von Strichen sowohl des vermuteten Schriftzeichens <kawa< und des Schriftzeichenkandidats des Segments <san< ist 3, und somit besteht keine Differenz in der Anzahl von Strichen. Der Komplexitätsindex von <kawa< ist jedoch in horizontaler Richtung ungefähr Vier und in vertikaler Richtung ungefähr Eins. <kawa< besteht näherungsweise aus drei vertikalen Strichen. Der Komplexitäts index von <san< ist etwa gleich Eins in horizontaler Richtung und in etwa gleich Vier in vertikaler Richtung, <san< besteht näherungsweise aus drei vertikalen Strichen. Somit weisen bezüglich des Komplexitätsindex in horizontaler und vertikaler Richtung die beiden Schriftzeichen vollständig gegensätzliche Tendenzen auf. Entsprechend kann mit Hilfe dieses Resultats das vermutete Schriftzeichen als ein nicht angemessenes Leseresultat beurteilt werden, und ein Adreß-Leseresuftatkandidat, welcher das vermutete Schriftzeichen <kawa< enthält, wird aus all den Leseresuftatkandidaten verworfen. Bei diesem eben beschriebe nen Ausführungsbeispiel wird die Berechnung der Komplexität des Schrift zeichenkandidaten des Segments für den ersten Schriftzeichenkandidaten durchgeführt, man kann sich jedoch auch vorstelle, daß ein Durchschnittswert von Komplexitätsindizes verwendet wird, welcher auch nachfolgende Schriftzeichen kandidaten mit einbezieht.

Wie die erste und zweite Realisierungsmethode basiert auch eine dritte Realisierungsmethode der Prüfeinrichtung 8 darauf, daß ein Prüfobjektanteil durch eine Beurteilung gemäß Verfahren (A) bestimmt wird. Ist die Anzahl von Segmen ten im Erkennungsresultatzwischenspeicher 4, welche einem Prüfobjektanteil entspricht, gleich der Anzahl von Schriftzeichen einer vermuteten Schriftzeichen kette, so wird die individuelle Schriftzeichenerkennung der Segmente, die der vermuteten Schriftzeichenkette entsprechen, erneut durchgeführt, unter Verwen dung einer individuellen Schriftzeichenerkennungseinrichtung, welche sich von der Ausschneide-Erkennungseinrichtung 3 unterscheidet. Wenn ein Schriftzeichen kandidat, der durch den erneuten Versuch erhalten wird, mit der vermuteten Schriftzeichenkette übereinstimmt, so wird das Vorliegen der vermuteten Schriftzeichenkette als wahr angenommen. Wenn die Anzahl von Segmenten in dem Prüfobjektanteil mit der Anzahl von Schriftzeichen der vermuteten Schrift zeichenkette übereinstimmt, so wird angenommen, daß die Segmentunterteilung korrekt ist, und lediglich die Schriftzeichenerkennung für jedes Segment des Prüfobjektanteils wird erneut durchgeführt. In diesem Fall wird lediglich ein Standardschriftzeichenmustersatz für Vergleichszwecke ausgetauscht und ein Teil der Verarbeitung der Ausschneide-Erkennungsvorrichtung 3 kann verwendet werden. Um einen Unterschied zwischen dem Fall, in dem die Ausschneide-Erken nungseinrichtung 3 verwendet wird, und dem Fall, in dem die individuelle Schriftzeichenerkennung verwendet wird, zu erzielen, kann ein anderes Erkennungswörterbuch, in dem z. B. ein Standardschriftzeichenmustersatz, welcher eine Neigung der Schriftzeichen (Kursivschrift) enthält, verwendet werden. Es könnte auch ein Standardschriftzeichenmustersatz verwendet werden, bei dem z. B. ein anderer Font verwendet wird.

Bei dem Kandidaten 91 des Adreß-Leseresultats von <shina<<kawa< <ku<<naka<<nobu< aus Fig. 2A existiert für das <kawa< entsprechende Segment kein geeigneter Schriftzeichenkandidat, und somit wird dieses Segment als Prüfobjektanteil festgelegt. Taucht bei Verwendung der dritten Realisierungs methode der Prüfeinrichtung 8 <kawa< als ein Schriftzeichenkandidat neu auf, so können alle Schriftzeichen von <shina<<kawa<<ku<<naka<<nobu< als korrekt gelesen betrachtet werden.

Wie die erste, zweite und dritte Realisierungsmethode basiert auch eine vierte Realisierungsmethode der Prüfeinrichtung 8 darauf, daß der Prüfobjektanteil durch eine Beurteilung gemäß (A) festgelegt wird. Wenn die Anzahl von Segmenten in dem Erkennungsresultatzwischenspeicher 4, welche als Prüfobjekt anteil ermittelt werden, nicht mit der Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette übereinstimmt, so wird die Ausschneideoperation der Segmente aus den Bilddaten für eine Fläche, welche dem Prüfobjektanteil entspricht, erneut durchgeführt, wobei die Form der vermuteten Schriftzeichenkette oder die Anzahl von Schriftzeichen in dieser berücksichtigt werden, und die individuelle Erkennung wird für jedes Segment durchgeführt. Wenn der Schriftzeichenkandidat des Schriftzeichenerkennungsresultats mit der vermuteten Schriftzeichenkette übereinstimmt, so wird das Vorliegen der vermuteten Schriftzeichenkette angenommen. In diesem Fall wird die gleiche Verarbeitung wie sie von der Ausschneide-Erkennungseinrichtung 3 durchgeführt wird, für den Prüfobjektanteil erneut durchgeführt. Da zu diesem Zeitpunkt die Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette bekannt ist, wird die Ausschneideoperation so durchgeführt, daß die Anzahl von Segmenten mit der Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette übereinstimmt, da ja die Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette bekannt ist. Um die Anzahl von Segmenten mit einer gegebenen Anzahl in Übereinstimmung zu bringen, können die Teilungspunkte der Segmente der Kandidatenpositionen so gewählt werden, daß die Teilungspunkte ausgehend von den Orten größter Wahrscheinlichkeit des Vorliegens von Teilungspunkten hin bis zum Vorliegen der vorbestimmten Anzahl von Segmenten ausgewählt werden.

Dabei kann auch berücksichtigt werden, daß nicht nur einfach die Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette mit der Anzahl der Teilungssegmente in Übereinstimmung gebracht wird, sondern daß auch die Teilungspunkte so gesetzt werden, daß die Form der vermuteten Schrift zeichenkette berücksichtigt wird. Als Beispiel wird unter Bezugnahme auf Fig. 13 ein einzelnes vertikal geschriebenes Segment, welches <to<<kyo< als eine vermutete Schriftzeichenkette enthält, aufgeteilt. Das in Fig. 13 dargestellte Segment enthält die beiden Schriftzeichen <to< und <kyo<, welche man wieder in ihrer Reinform in Fig. 1B findet. <to< ist dabei das oberste Zeichen der zweiten Spalte von Fig. 1B, <kyo< ist das oberste Zeichen der dritten Spalte von Fig. 1B. Vergleicht man diese beiden Zeichen aus Fig. 1B mit dem in Fig. 13 dargestellten Segment, so erkennt man, daß die Grenze zwischen <to< und <kyo< verwischt ist. Es scheint, als gehörten die beiden obersten Striche des Zeichens <kyo< noch zum Zeichen <to<. Dieser obere Bestandteil des Zeichens <kyo<, welcher hier scheinbar zum Zeichen <to< gehört, ist ein Bestandteil, welcher häufig in chinesischen Schriftzeichen vorkommt. Er wird mit einem eigenen Namen, nämlich mit "nabebuta" bezeichnet. Nachfolgend wird bezugnehmend auf Fig. 13 die vermutete Schriftzeichenkette, die <to<<kyo< als ein einzelnes Segment enthält, aufgeteilt.

Dabei ist es angemessen, den Teilungspunkt so zu setzen, daß er in vertikaler Richtung im Zentrum liegt. Unangemessen ist es, die Schriftzeichen an einer Lückenposition zu unterteilen, welche wahrscheinlich unterhalb des "nabebuta", d. h. des oberen Teils von <kyo< liegt, da sonst der obere Teil von <kyo< als zu <to< zugehörig beurteilt würde. Wenn als allgemeine Methode für die Unterteilung ein Schatten (eine Projektion) eines Musters, d. h. Kumulationswert oder Histogrammwert von schwarzen Bildelementen, in einer bestimmten Richtung für jedes Bildelement in einem Bild des Prüfobjektanteils aufgenommen wird, so daß ein Histogramm wie in Fig. 13 dargestellt entsteht, und wenn im allgemeinen die Schriftzeichenkette an einer Stelle unterteilt wird, an der keine Schattenkomponente oder Projektionskomponente existiert, so wird die Stelle unter dem "nabebuta" als Teilungspunkt gesetzt, und somit wird die Ausschneideoperation nicht korrekt durchgeführt. Wenn jedoch angenommen wird, daß <to<<kyo< sich miteinander in Kontakt befinden, so gibt es viele Fälle, bei denen der Strich, der sich im Zentrum von <to< befindet und sich in vertikaler Richtung erstreckt, mit dem "nabebuta" des Schriftzeichens <kyo< in Kontakt kommt. Deshalb kann, falls das Muster des Kontakts gespeichert wird, der Teilungspunkt auf der Basis dieses gespeicherten Kontaktmusters exakt bestimmt werden. Diese Beurteilung unter Verwendung des Kontaktmusters ist nicht auf <to<<kyo< beschränkt. Es gibt viele Fälle, bei denen der Strich eines ersten Schriftzeichens mit dem eines zweiten Schriftzeichens in Kontakt gerät, und somit können individuelle Kontaktmuster von Fall zu Fall gespeichert werden, wenn Schriftzeichen miteinander in Kontakt kommen.

Eine Methode zur Speicherung von Kontaktmustern wird in Fig. 14 gezeigt. Ein Teil, für den der Schriftzeichenkontakt auftritt, wie etwa das Zentrum, das untere Ende, das rechte Ende etc., wird im voraus als Merkmal des Teilungspunkts registriert. Dies geschieht in Abhängigkeit davon, ob die Schriftzeichen von links nach rechts (horizontal) oder von oben nach unten (vertikal) aneinandergereiht werden. Beides ist bei chinesischen Schriftzeichen möglich. Je nach Schreibweise, ob horizontal oder vertikal, sind die Kontaktstellen der Kandidaten unterschiedlich. Für die Kandidaten in Zeile vier und Zeile fünf gilt z. B., daß die Kontaktposition bei vertikaler Schreibweise am rechten Ende des linken Schriftzeichens liegt (Zeile vier), bei horizontaler Schreibweise (Zeile fünf) jedoch in der Mitte des linken Schriftzeichens. Mit Hilfe dieser Registrierung kann zwischen horizontaler und vertikaler Schreibweise unterschieden werden, und Teilungspunkte, welche mit einer vermuteten Schriftzeichenkette in Überein stimmung gebracht werden, können erhalten werden.

Um in korrekter Weise einen Teilungspunkt überhalb des "nabebuta" des Schriftzeichens <kyo< von dem einem Prüfobjektanteil entsprechenden Muster, welches als <to< <kyo< vermutet wird, zu erhalten, wird ein Anteil, in dem der Teilungspunkt enthalten ist, auf der Basis eines Wörterbuchs von Teilungs punkten von Strichen wie in Fig. 14 gezeigt überprüft. Im vorliegenden Fall wird der Teilungspunkt als im zentralen Teil des Schriftzeichens befindlich betrachtet. Daraufhin wird, wenn der Teilungspunkt im Zentralbereich zu ermitteln ist, ein Prüfobjektgebiet wie in Fig. 15 gezeigt in eine Streifenform in Richtung der Schriftzeichenkette unterteilt, und Schattenkomponenten werden für ein schmales rechteckiges Gebiet (einer der Streifen) im Zentralbereich erneut ermittelt, und ein Anteil, bei dem die Schattenkomponente schnell anwächst, wird als der dem breiten vertikalen Strich des "nabebuta" des Schriftzeichens <kyo< entsprechende Anteil beurteilt. Deshalb wird der Teilungspunkt an eine Position gesetzt, welche leicht oberhalb der "nabebuta" - Position liegt, d. h. so, daß auch der kleine Vertikalstrich des "nabebuta" - Anteils auch noch zum Schriftzeichen <kyo< gehört.

Das oben beschriebene Ausführungsbeispiel verwendet ein Wörter buch, in dem Orte, an denen ein Schriftzeichenkontakt auftritt, für jede Schrift zeichenkandidatenkette registriert sind, es kann jedoch auch nur ein erstes Schriftzeichen der Schriftzeichenkandidaten einer Schriftzeichenkandidatenkette auf der Liste registriert sein.

Eine fünfte Realisierungsmethode der Prüfeinrichtung 8 basiert darauf, daß der Prüfobjektanteil durch eine Beurteilung gemäß dem Verfahren (B), das weiter oben beschrieben wurde, bestimmt wird. Unter Verwendung einer indivi duellen Schriftzeichenerkennungseinrichtung, welche sich von der Ausschneide- Erkennungseinrichtung 3 unterscheidet, wird die individuelle Schriftzeichener kennung von Segmenten, welche einer vermuteten Schriftzeichenkette entspre chen, erneut durchgeführt, und das Vorliegen der vermuteten Schriftzeichenkette wird angenommen, wenn die Zuverlässigkeit eines durch erneuten Versuch erhaltenen Schriftzeichenkandidaten einer vorbestimmten Bedingung genügt. Das Erfüllen einer vorbestimmten Bedingung meint einen Fall, bei dem ein Grenzwert von Zuverlässigkeit, welcher auf einen bestimmten Wert festgelegt wird, überschritten wird, einen Fall, in dem eine große Differenz an Zuverlässigkeit für einem nachgeordneten Schriftzeichenkandidaten vorliegt, oder ähnliches.

Um einen Unterschied zwischen der Verwendung der Ausschneide- Erkennungseinrichtung 3 und dem Fall des Verwendens der individuellen Schrift zeichenerkennungseinrichtung zu erzielen, kann diese zum Beispiel ein unter schiedliches Erkennungswörterbuch verwenden, in dem ein Standardschrift zeichenmustersatz enthalten ist, welcher um ein zusätzliches Merkmal, wie etwa eine seitliche Neigung (Kursivschrift) erweitert ist, oder einen Standardschrift zeichenmustersatz, in dem ein Merkmal wie etwa ein Font variiert ist, wie auch bei der dritten Realisierungsmethode der Prüfeinrichtung 8. Wenn die Bestimmung des Prüfobjektanteils basierend auf der Beurteilung gemäß (B) durchgeführt wird, treten darüberhinaus viele Fälle auf, bei denen die Schriftzeichen, welche einander relativ stark ähneln, wie etwa <minami< und <nishi<, <to< und <hon<, etc. als teilweise unterschiedliche Schriftzeichen ausgewählt werden. Es wird hier wieder auf Fig. 1B verwiesen, aus der man erkennt, daß sich die Schriftzeichen <minami< und <nishi< relativ stark ähneln, so wie, daß sich die Schriftzeichen <to< und <hon< relativ stark ähneln. Deshalb kann zum Beispiel eine individuelle Erkennungseinrichtung verwendet werden, um lediglich die Unterscheidung dieser Schriftzeichen mit hoher Präzision durchzuführen. Zum Beispiel werden lediglich die Arten von Schriftzeichen, welche ähnliche Schriftzeichenpaare bilden, ausgewählt, um ein Erkennungswörterbuch zu bilden, in dem Variationen von Deformationen dieser Schriftzeichen in möglichst großer Zahl gespeichert sind, und ein Vergleich mit diesem Erkennungswörterbuch wird mit einer relativ strengen Erkennungsbedingung durchgeführt. Darüberhinaus kann zum Beispiel eine Schriftzeichenerkennung durchgeführt werden, während die Größe oder die Neigung des Musters eines Prüfobjektanteils variiert wird.

Das Lesegerät für Schriftzeichenketten aus Fig. 3 kann zum Beispiel auch so gesteuert werden, daß in einer ersten Stufe nicht alle Schriftzeichenkandidaten in einer Anfangsstufe von der Wortsucheinrichtung 5 verwendet werden. Das heißt, in einer ersten Stufe werden lediglich höherrangige Kandidaten von all den Schriftzeichenkandidaten verwendet, um den Wortsuchprozeß mit der Wortsucheinrichtung 5 durchzuführen, und wenn die Prüfeinrichtung 8 ihre Arbeit ausführt, werden auch niederrangige Kandidaten der Schriftzeichenkandidaten verwendet.

In einem solchen Fall wird in der Prüfanteilbestimmungseinrichtung 7 das folgende Verfahren (C) angewendet, welches sich von den Verfahren (A) und (B) zur Bestimmung des Prüfobjektanteils unterscheidet.

(C) Bezüglich eines Wortkettenkandidaten (Leseresultatkandidat) wird ein Anteil als Prüfobjektanteil festgelegt, bei dem ein Schriftzeichenkandidat, welcher einem Schriftzeichen entspricht, das den Wortkettenkandidaten bildet, nicht höherrangig ist. In diesem Fall wird die Schriftzeichenkette des Anteils als vermutete Schriftzeichenkette festgelegt.

Im Falle von Fig. 2A wird für den Kandidaten 91 des Adress-Lese resultats <shina<<kawa<<ku<<naka<<nobu< der Anteil <kawa< als Prüfobjekt anteil gemäß Methode (A) gesetzt. Nehmen wir hier an, daß zu den höherrangigen Kandidaten die Kandidaten zählen, die in der ersten oder zweiten Zeile auf tauchen, so wird der Anteil <naka<, welcher in der dritten Zeile der vierten Spalte auftaucht, ebenfalls als Prüfobjektanteil festgelegt.

Als eine sechste Realisierungsmethode der Prüfeinrichtung 8 wird in diesem Fall das Vorliegen einer vermuteten Schriftzeichenkette dann angenom men, wenn einer der niederrangigen Schriftzeichenkandidaten im Erkennungs resultatzwischenspeicher 4, welcher dem Prüfobjektanteil entspricht, mit einer vermuteten Schriftzeichenkette übereinstimmt. Diese Prüfmethode hat für <naka< aus Fig. 2A Erfolg.

Desweiteren wird die Wortsucheinrichtung 5 wie in den Druckschriften 1 bis 13 beschrieben realisiert durch das Erzeugen einer Kombination von Schrift zeichenkandidaten im Erkennungsresultatzwischenspeicher 4, um zu suchen, ob die Kombinationen im Wörterbuch vorliegen, oder durch ein Verfahren, bei dem gesucht wird, ob ein aus dem Wörterbuch gelesenes Wort als eine Kombination von Schriftzeichenkandidaten in den Schriftzeichenkandidatenketten im Erken nungsresultatzwischenspeicher 4 gefunden werden kann. Eine in Fig. 6 gezeigte Methode kann als eine Realisierungsmethode, die sich von den oben erwähnten Methoden unterscheidet, verwendet werden.

Die in Fig. 6 gezeigt Wortsucheinrichtung 5 umfasst die folgenden Elemente.

Ein Markierungswörterbuchspeicher 50 dient dazu, für jedes Schrift zeichen Informationen über zumindest drei Bestandteile zu speichern, und zwar "das Wort U, welches das Schriftzeichen enthält, die Schriftzeichenkettenlänge L von U, und die Position P des Schriftzeichens in U". Für einen Schriftzeichen kandidaten im Erkennungsresultatzwischenspeicher 4 sucht eine Markierungser zeugungseinrichtung 51 die dreiteilige Information, welche dem Schriftzeichenkan didaten aus dem Markierungswörterbuchspeicher 50 entspricht. Ein Markierungs informationszwischenspeicher 52 speichert das Resultat der Markierungserzeu gungseinrichtung 51. Ein Wortverbindungs-Einschränkungsspeicher 53 beschreibt eine Verbindungseinschränkung zwischen Worten. Eine Markierungsketten- Sucheinrichtung 54 verbindet zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformationszwischenspeicher 52 durch Verwendung der Positionsbeziehung der Segmente, welche der dreiteiligen Information und der Beziehung zwischen U1, L1, P1, U2, L2, P2 entsprechen, um dadurch den Wortkettenkandidaten an den Wortkettenkandidatenzwischenspeicher 6 auszugeben, der einer Kombination von Schriftzeichenkandidaten im Erkennungsresultatzwischenspeicher 4 entspricht. Der Markierungswörterbuch speicher 50, der Markierungsinformationszwischenspeicher 52 und der Wortverbindungs-Einschränkungsspeicher 53 werden durch eine Speichereinrichtung wie zum Beispiel einen IC-Speicher, eine Magnetplatte, oder ähnliches realisiert. Die Markierungserzeugungseinrichtung 51 und die Markierungskettensucheinrichtung 54 werden durch die Zentraleinheit (CPU) eines Computers oder durch einen speziell dafür vorgesehenen Schaftkreis realisiert.

Wenn Adressen, die auf Briefen oder Formularen geschrieben werden, gelesen werden, wird eine höherrangig-niederrangig-Beziehung von Adressen, welche durch eine hierarchische Struktur wie in Fig. 10 gezeigt repräsentiert wird, in dem Wortverbindungs-Einschränkungsspeicher 50 gespeichert. Dies heißt, daß für eine Adressenstruktur <shina<<kawa<<ku< aus Fig. 10, <shina<<kawa<<ku< niederrangiger ist als <to<<kyo<<miyako<, und daß andere Namen von Stadt bezirken wie etwa <e<<hara<, <hata<<no<<dai<, etc. noch niederrangiger sind als <shina<<kawa<<ku<. Hierbei ist anzumerken, daß <to<<kyo<<miyako< den Namen der Stadt angibt, <shina<<kawa<<ku< den Namen des Bezirks, und <e<<hara< oder <hata<<no<<dai< die Namen von Unterbezirken sind. Im Falle von Adressen wird die grundlegende höherrangig-niederrangig-Beziehung in der Reihenfolge des Namens der Stadt, des Bezirks, und der Unterbezirke realisiert. In Japan sind dies z. B. "To, Do, Fu und Präfekturen". Es kann auch Fälle geben, in denen die Unterbezirke wiederum in Unter-Unterbezirke unterteilt sind. Im Falle von Adressen dient die höherrangig-niederrangig-Beziehung von Adreßelementen direkt als Einschränkung für die Anordnung von Adreßelementen. Das heißt, die Adressen sind von einem höherrangigen Adreßelement zu einem niederrangigen Adreßelement hingeordnet. Ein analoges Ordnungssystem für eine deutsche Adresse bestünde in "Stadt-Straße-Hausnummer".

Im Falle von Fig. 10 wird also die Anordung (<to<<kyo<<miyako<) - (<shina<<kawa<<ku<) - (<naka<<nobu<) gestattet, eine Anordnung wie etwa (<to<<kyo<<miyako<) - (<naka<<nobu<) oder (<naka<<nobu<) - (<hata<<no< <dai<) wird nicht gestattet, da diese keine sinnvolle Aneinanderreihung von Stadt- Bezirk-Unterbezirk ergeben. Eine Realisierungmethode der Verbindungsein schränkung wie oben beschrieben besteht etwa darin, daß das Gestatten oder Nichtgestatten der Verbindung von allen Kombinationen von zwei Adreßelementen beschrieben wird, oder in einem Verfahren des Auflistens von Adreßelementen, welche direkt vor oder nach ein Adreßelement angefügt werden können. Wenn eine Schriftzeichenkette eines allgemeinen Dokuments gelesen wird, wird das Gestatten oder Nichtgestatten der Verbindung von Worten nicht auf der Basis einer hierarchischen Struktur wie für Adressen beschrieben, sondern auf der Basis einer grammatikalischen Wortanordnung und deren Regeln durchgeführt.

Der Markierungswörterbuchspeicher 50 speichert dreiteilige Informa tionen, und zwar "Schriftzeichenkette U von Worten, die Schriftzeichenkettenlänge L von U, und die Position P eines Schriftzeichens in U", für jedes Schriftzeichen, welches Worte bildet, die in einem Leseobjekt auftreten. Fig. 11 zeigt ein Beispiel des Inhalts des Markierungswörterbuchspeichers 50 für eine solche Adreßelementengruppe, wie sie in Fig. 10 gezeigt ist. In Fig. 11 repräsentiert ein Schlüsselschriftzeichen 40 links von dem Doppelpunkt [:] jedes Schrift zeichen, das in einem Adreßelement auftaucht, und auf der rechten Seite ist die entsprechende dreiteilige Information angeordnet. Die dreiteilige Information besteht zum Beispiel daraus, daß das Schriftzeichen <e< das erste Schriftzeichen von zwei Schriftzeichen eines Adreßelements (<e<<hara<) ist, wenn die dreiteilige Information aus [<e<<hara<, 2, 1] besteht, und dem Schriftzeichen <e< entspricht. Da es einige Fälle gibt, in denen ein Schriftzeichen in verschiedenen Adreß elementen auftritt, zum Beispiel, wenn <nobu< in (<nishi<<naka<<nobu<, 3, 3], in [<naka<<nobu<, 2, 2], und in [<to<<naka<<nobu<, 3, 3] auftritt, ist das Schrift zeichen <nobu< das dritte Schriftzeichen von dreien des Adreßelements [<nishi<<naka<<nobu<], oder das zweite Schriftzeichen von zwei Schriftzeichen des Adreßelements [<naka<<nobu<], oder das dritte Schriftzeichen von drei Schriftzeichen des Adreßelements [<to<<naka<<nobu<]. Das Adreßelement (Wort) U in der dreiteiligen Information wird in Fig. 11 durch eine Schriftzeichenkette dargestellt, es kann jedoch auch anstelle von durch eine Schriftzeichenkette durch einen Codewert, welcher dem Adreßelement (Wort) entspricht, dargestellt werden.

Die Markierungserzeugungseinrichtung 51 sucht den Markierungs wörterbuchspeicher 50 für jedes in dem Erkennungsresultatzwischenspeicher 4 gespeicherte Segment ab, indem jeder der Schriftzeichenkandidaten, welcher dem Segment entspricht, als ein Schlüssel verwendet wird. Wenn ein geeignetes Schriftzeichen in dem Schlüsselschriftzeichen 40 des Markierungswörterbuch speichers 50 existiert, so wird die dreiteilige Information, welche dem Schrift zeichen entspricht, ausgelesen und dann in den Markierungsinformations zwischenspeicher 52 geschrieben. Fig. 12 zeigt ein Beispiel eines in den Markierungsinformationszwischenspeicher 52 geschriebenen Resultats, wenn der in Fig. 11 gezeigte Markierungswörterbuchspeicher 50 nach der in Fig. 1A gezeigten Schriftzeichenkandidatenkette abgesucht wird.

Die folgenden Verfahren können verwendet werden, um zwei dreiteilige Informationen in dem Markierungsinformationszwischenspeicher 52 miteinander zu verbinden und um einen Kandidaten für ein Leseresultat in der Markierungsketten sucheinrichtung 54 zu ermitteln.

Gemäß einer ersten Realisierungsmethode der Markierungsketten sucheinrichtung 54 werden die nachfolgenden Bedingungen für zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformations zwischenspeicher 6 gesetzt:
Bedingung 2a: Das [U1, L1, P1] entsprechende Segment ist vor dem [U2, L2, P2] entsprechenden Segment angeordnet;
Bedingung 2b: U1 = U2 und P1 < P2; und
Bedingung 2c: U1 kann vor U2 existieren.

In diesem Falle wird, wenn die Bedingung 2a und die Bedingung 2b oder 2c erfüllt sind, [U2, L2, P2] nachfolgend mit [U1, L1, P1] verbunden, um alle möglichen Kombinationen zu bilden, und dann wird die Kostenfunktion für jede Kombination berechnet, um die beste Kombination (oder höherrangige Kom bination) auszuwählen.

Fig. 7 zeigt einen Fall, in dem die Markierungsverbindung auf der Basis des Markierungsinformationszwischenspeichers 52 wie in Fig. 12 gezeigt gemäß der ersten Realisierungsmethode wie oben beschrieben durchgeführt wird. In Fig. 7 werden zwei Markierungen (dreiteilige Informationen, die in dem Markierungsinformationszwischenspeicher 52 gespeichert sind) und für die Bedingung 2a und die Bedingung 2b oder Bedingung 2c erfüllt sind, miteinander durch eine durchgezogene Linie verbunden. Zum Beispiel wird die Markierung [<shina<<kawa<<ku<, 3, 2] von einem Segment (2, 1) mit der Markierung [<shina<<kawa<<ku<, 3, 3] eines Segments (3, 1) verbunden, und die Bedin gungen 2a und 2b sind zwischen diesen beiden Markierungen erfüllt. Die Erfüllung der Bedingung 2a basiert auf der Tatsache, daß die Endposition 2 des Segments (2, 1) vor der Kopfposition des Segments (3, 1) angeordnet ist. Die Erfüllung der Bedingung 2b basiert auf der Tatsache, daß U1 = U2 = [<shina<<kawa<<ku<], und daß P1 = 2 < P2 = 3. Die Markierung [<shina<<kawa<<ku<, 3, 2] des Segments (2, 1) und die Markierung (<hira<<tsuka<, 2, 1) des Segments (4, 1) werden miteinander verbunden, da die Bedingung 2a und die Bedingung 2c erfüllt sind. Da U1 = [<shina<<kawa<<ku<] ein höherrangiges Adreßelement als U2 = [<hira< <tsuka<] ist, wird festgestellt, daß die Bedingung 2c erfüllt ist.

Bei der ersten Realisierungsmethode der Markierungskettensuch einrichtung wie oben beschrieben werden alle Markierungsverbindungen, welche durch durchgezogene Linien in Fig. 7 dargestellt sind, gebildet, und dann wird die Kostenberechnung für die Kombinationen davon ausgeführt, um die Kombination mit der besten Kostenfunktion (höherrangige Kombination) auszuwählen.

Gemäß einer zweiten Realisierungsmethode der Markierungsketten sucheinrichtung 54 werden die folgenden Bedingungen für zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformations zwischenspeicher 52 gesetzt:
Bedingung 3a: Das [U1, L1, P1] entsprechende Segment liegt neben und direkt vor dem Segment [U2, L2, P2];
Bedingung 3b: Die Bedingung 3a ist nicht erfüllt, das Segment [U1, L1, P1] liegt jedoch vor dem Segment [U2, L2, P2];
Bedingung 3c: U1 = U2 und P1 + 1 = P2;
Bedingung 3d: U1 = U2 und P1 + 1 < P2;
Bedingung 3e: U1 kann direkt vor U2 existieren, und P1 = L1 und P2 = 1; und
Bedingung 3f: Die Bedingung 3e ist nicht erfüllt, U1 kann jedoch vor U2 existieren.

In diesem Fall wird, wenn die Bedingung 3a und die Bedingung 3c oder 3e erfüllt sind, [U2, L2, P2] nachfolgend mit [U1, L1, P1] verbunden, um Kombinationen zu bilden und um die Kostenfunktion von jeder Kombination zu berechnen. Wenn keine Kombination erhalten wird, für die die Kostenfunktion nicht höher als der Grenzwert liegt, werden neue Kombinationen durch weiteres Ver binden von [U1, L1, P1] und [U2, L2, P2] gebildet, bei denen die Bedingung 3b und die Bedingung 3d oder die Bedingung 3f erfüllt sind, und dann wird die Kostenbe rechnung erneut durchgeführt, um die Kombination mit der besten Kostenfunktion (höherrangige Kombination) zu berechnen.

Fig. 8 zeigt einen Fall, in dem die Markierungsverbindung gemäß der zweiten Realisierungsmethode auf der Basis des Markierungsinformations zwischenspeichers 52 wie in Fig. 6 gezeigt durchgeführt wird. In Fig. 8 werden zwei Markierungen, bei denen die Bedingung 3a und die Bedingung 3c oder die Bedingung 3e erfüllt sind, miteinander durch eine durchgezogene Linie verbunden. Zum Beispiel sind die Bedingung 3a und die Bedingung 3c zwischen der Mar kierung [<nishi<<naka<<nobu<, 3, 1] eines Segments (3, 1) und der Markierung [<nishi<<naka<<nobu<, 3, 2] eines Segments (4, 1) erfüllt. Die Erfüllung der Bedin gung 3a basiert auf der Tatsache, daß die Endposition 3 des Segments (3, 1) direkt vor der Kopfposition 4 des Segment (4, 1) liegt. Die Erfüllung der Bedingung 3c basiert auf der Tatsache, daß U1 = U2 = [<nishi<<naka<<nobu<], und daß P1 + 1 = 1 + 1 = 2 = P2. Darüber hinaus sind die Bedingung 3a und die Bedingung 3e zwischen der Markierung [<shina<<kawa<<ku<, 3, 3] des Segments (3, 1) und der Markierung [<naka<<nobu<, 2, 1] des Segments (4, 1) erfüllt. Da U1 = [<shina<<kawa<<ku<] ein um einen Schritt höherrangigeres Adreßelement als U2 = [<naka<<nobu<] ist, kann U1 direkt vor U2 existieren, und P1 = L1 = 3, so daß festgestellt wird, daß die Bedingung 3e erfüllt ist. Andererseits werden Mar kierungen, welche die Bedingung 3b und die Bedingung 3d oder die Bedingung 3f erfüllen, mit einer gestrichelten Linie verbunden. Die Markierungsverbindungen, welche durch gestrichelte Linien in Fig. 8 dargestellt sind, entsprechen den restlichen Markierungsverbindungen, welche erhalten werden, indem man die in Fig. 8 gezeigten Markierungsverbindungen von den mit durchgezogenen Linien dargestellten Markierungsverbindungen in Fig. 7 abzieht.

Gemäß einer zweiten Realisierungsmethode der Markierungsketten sucheinrichtung 54 werden lediglich Markierungsverbindungen, die durch durchge zogene Linien in Fig. 8 dargestellt sind, gebildet, und die Kostenberechnung wird für diese Kombinationen durchgeführt. Wenn eine Kombination von Markierungs verbindungen erhalten wird, welche einen besseren Kostenwert als der Grenzwert aufweist, so werden die Markierungsverbindungen wie sie in Fig. 8 mit gestrichelten Linien dargestellt sind nicht gebildet. Andererseits werden, wenn keine Kombinationen mit einem besseren Kostenwert als der Grenzwert erhalten werden, auch die Markierungsverbindungen, die mit gestrichelten Linien dargestellt sind, gebildet, und dann wird eine Kombination (oder höherrangige Kombination), welche den besten Kostenwert aufweist, ausgewählt.

Gemäß einer dritten Realisierungsmethode der Markierungskettensuch einrichtung 54 werden von einer Vorderseite zu einer Rückseite in der entspre chenden Segmentposition der dreiteiligen Information in dem Markierungsinforma tionszwischenspeicher 52 die folgenden Bedingungen für die dreiteilige Informa tion [U', L', P'], deren Segmentposition vor der von [U, L, P] liegt, gesetzt:
Bedingung 4a: U' = U und P' < P; und
Bedingung 4b: U' kann vor U existieren.

[U', L', P'], welche die Bedingung 4a oder die Bedingung 4b erfüllen, werden nacheinander ausgewählt, so daß der Kostenwert der Kombination am besten wird, wenn sie mit [U, L, P] verbunden wird, wodurch die beste Kosten kombination (höherrangige Kombination) ausgewählt wird.

Die dritte Realisierungsmethode der Markierungskettensucheinrichtung 54 wird unter Verwendung eines Falls von Fig. 9 beschrieben. Bei der dritten Realisierungsmethode wird die Verarbeitung von einer Markierung aus sukzessiv ausgeführt, deren entsprechende Segmentposition in einer Frontposition besteht. In Fig. 9 läuft die Verarbeitung so ab, daß der Kostenwert einer Markierung [<nishi<<go<<tan<<ta<, 4, 1] [<nishi<<oh<<i<, 3, 1] ... [<ko<<yama<<dai<], wel cher dem Segment (1, 1) entspricht, zuerst bestimmt wird, und nachfolgend der Kostenwert einer Markierung [<nishi<<go<<tan<<ta<, 4, 4] [<to<<go<<tan<<ta<, 4, 4] ... [<shina<<kawa<<ku<, 3, 3] bestimmt wird. Wenn der Kostenwert von [<naka< <nobu<, 2, 1] bestimmt wird, welcher einem Segment (4, 1) entspricht, werden zu diesem Zeitpunkt jene Markierungen, welche die Bedingung 4a oder 4b erfüllen, von den Markierungen, welche den Segmenten (1, 1) (2, 1) (3, 1) vor dem Segment (4, 1) entsprechen, gesucht, um Markierungen auszuwählen, welche den besten Kostenwert liefern, wenn diese Markierungen miteinander verbunden werden, und dann wird der Kostenwert von [<naka<<nobu<, 2, 1] auf der Basis der Markie rungsverbindung zu diesem Zeitpunkt bestimmt. Genauer gesagt erfüllt sowohl [<shina<<kawa<<ku<, 3, 1] des Segments (1, 1) als auch [<shina<<kawa<<ku<, 3, 2] des Segments (2, 1) und [<shina<<kawa<<ku<, 3, 3] des Segments (3, 1) die Bedingung für [<naka<<nobu<, 2, 1] des Segments (4, 1), die Verbindung mit [<shina<<kawa<<ku<, 3, 3] des Segments (3, 1) wird jedoch als beste Kombination ausgewählt, welche den besten Kostenwert liefert, wenn jede der obigen drei Markierungen mit der Markierung von [<naka<<nobu<, 2, 1] des Segments (4, 1) verbunden wird.

Die Markierungsverbindungen, die durch gestrichelte Linien und durch gezogene Linien in Fig. 9 dargestellt werden, genügen der Bedingung 4a oder der Bedingung 4b. Die Markierungen, welche den besten Kostenwert liefern, wenn jede Markierung mit einer Frontmarkierung verbunden wird, werden durch durch gezogene Linien dargestellt. Die Methode der sukzessiven Bestimmung des Kostenwerts jeder Markierung von der Frontseite zur der Rückseite bedeutet, daß der Kostenwert auf der Basis der besten Kombination jeder Markierung und einer Markierung vor der Markierung kumuliert wird. Dies bedeutet deshalb, daß die beste Kostenkombination durch Verwendung der sogenannten dynamischen Planungsmethode (Viterbi-Algorithmus) bestimmt wird.

In der Beschreibung wird die Markierungskettensucheinrichtung 54 in der ersten Realisierungsmethode der Wortsucheinrichtung 5 entsprechend der Methode der Verbindung der Markierungen und der Bestimmung des Wortketten kandidaten auf der Basis des Kostenwerts für deren Kombination beschrieben. In diesem Fall können verschiedene Definitionen für den Kostenwert in Betracht ge zogen werden. Zum Beispiel können folgende Definitionen betrachtet werden:

A) Anzahl der verbundenen Markierungen (Anzahl der Verbindungen von dreiteiligen Informationen)
B) Anzahl der Schriftzeichen, welche beim Lesen übersprungen werden (Lesesprünge)
C) Intervall von Segmenten, welche Markierungen entsprechen (physi kalisches Intervall von Markierungen)
D) Differenz zwischen logischem Intervall und physikalischem Intervall von Markierungen
E) Zuverlässigkeit (oder Abstand) bei individueller Erkennung von jedem Schriftzeichen

Im einfachsten Fall, wenn nur (A) für den Kostenwert verwendet wird, kann ein vorbestimmter fester Kostenwert für jede verbundene Markierung addiert werden. Wenn viele Markierungen miteinander von ihrem Kopf aus verbunden sind, so wird der Kumulationswert des Kostenwerts gut, und eine Kombination, welche aus Verbindungen mit der maximalen Anzahl von Markierungen besteht (eine Verbindung, bei der die Anzahl von Markierungen von dreiteiligen Informa tionen maximal ist), hat den besten Kostenwert.

Angenommen für den Kostenwert werden -100 Punkte für jede Mar kierung vorgesehen, so wird im Fall der Markierungskettensuche aus Fig. 7 bis 9 die folgende Markierungskombination als beste Kombination beurteilt, weil ihr Kostenwert -500 Punkte ist.

[<shina<<kawa<<ku<, 3, 1] - [<shina<<kawa<<ku<, 3, 2] - [<shina< <kawa<<ku<, 3, 3] - [<naka<<nobu<, 2, 1] - [<naka<, 2, 2]... (1)

Im Falle von Fig. 7 wird die folgende Kombination, welche denselben Kostenwert -500 von Punkten aufweist, ebenfalls als beste Kombination beurteilt.

[<shina<<kawa<<ku<, 3, 1] - [<shina<<kawa<<ku<, 3, 2] - [<shina< <kawa<<ku<, 3, 3] - [<nishi<<naka<<nobu<, 3, 2] - [<nishi<<naka<<nobu<, 3, 3]... (2)

Um die Beurteilung genauer durchzuführen, können die Faktoren (B), (C), (D) und (E) zur Beurteilung des Kostenwerts verwendet werden.

Für zwei Markierungen [U1, L1, P1] und [U2, L2, P2] ist das logische Intervall der Markierungen (Faktor B) folgendermaßen definiert:

Für U1 = U2 : P2 - P1 - 1

Für U1 ≠ U2 : L1 - P1 + P2 - 1

Das heißt, es entspricht der Anzahl von Schriftzeichen, für welche ein Lesesprung bei bestimmten Anteilen während einer Leseoperation für das Lese resultat durchgeführt wird.

Wenn zum Beispiel die Markierungskombination (2) im Fall von Fig. 7 betrachtet wird, so wird ein Schriftzeichen beim Lesen zwischen [<shina<<kawa< <ku<, 3, 3] und [<nishi<<naka<<nobu<, 3, 2] übersprungen, u 10274 00070 552 001000280000000200012000285911016300040 0002019547812 00004 10155nd zwar wird <nishi< von (<nishi<<shina<<kawa<) beim Lesen übersprungen. Entsprechend ist das logi sche Intervall der zwei Markierungen gleich 1. Das logische Intervall der anderen Markierungen (2) ist gleich 0.

Der Kostenwert der Markierungsverbindung kann so gesetzt werden, daß entsprechend dem logischen Intervall der Kostenwert verschlechtert wird (ein Straffaktor angewendet wird). Wenn zum Beispiel als zusätzlicher Kostenfaktor (logisches Intervall) × 50 Punkte eingeführt wird, so ist der Kostenwert von (2) gleich -450 Punkte, und somit um mehr als -500 Punkte verschlechtert.

Das physikalische Intervall der Markierungen gemäß (C) ist das Intervall der Segmente, welche den Markierungen entsprechen. Zum Beispiel können im Falle von Fig. 7 die Markierung [<nishi<<naka<<nobu<, 3, 1] des Segments (1, 1) und die Markierung [<nishi<<naka<<nobu<, 3, 2] des Segments (4, 1) miteinander verbunden werden. Das logische Intervall zwischen diesen zwei Markierungen ist gleich 0. Andererseits weist das physikalische Intervall zwischen ihnen eine Distanz von zwei Segmenten auf, da zwei Segmente (2, 1) und (3, 1) zwischen ihnen existieren. Als Methode zum Zählen des physikalischen Intervalls kann ein Verfahren der Zählung auf der Basis der Anzahl von Segmenten zwischen zwei Markierungen, ein Verfahren des Zählens auf der Basis der Differenz (Distanz) zwischen den Koordinaten von zwei Segmenten, wenn die Koordinaten definiert sind, oder ein Verfahren des Teilens der Entfernung durch einen Mittelwert und eine Durchschnittssegmentgröße verwendet werden.

Wie im Falle des logischen Intervalls ist im Falle des physikalischen Intervalls der Kostenwert der Markierungsverbindung so gesetzt (zum Beispiel physikalisches Intervall × 50 Punkte), daß der Kostenwert entsprechend dem physikalischen Intervall sich verschlechtert (ein Straffaktor angewendet wird).

Die Differenz zwischen dem logischen Intervall und dem physikalischen Intervall der Markierungen gemäß (D) hat die folgende Bedeutung. Zum Beispiel wird die Verbindung zwischen der Markierung [<shina<<kawa<<ku<, 3, 3] und der Markierung [<nishi<<naka<<nobu<, 3, 2] für die Kombination von (2) im Falle von Fig. 7 betrachtet. Das logische Intervall ist gleich 1, während das physikalische Intervall gleich 0 ist. Das heißt, das bedeutet, daß ein Schriftzeichen als an einer Position befindlich betrachtet wird, für die kein physikalisches Intervall existiert, und somit dieses Lesen unnatürlich ist. Andererseits ist für die Verbindung zwischen der Markierung [<nishi<<naka<<nobu<, 3, 1] des Segments (1, 1) und der Markierung [<nishi<<naka<<nobu<, 3, 2] des Segments (4, 1) das logische Intervall gleich 0, während das physikalische Intervall gleich 2 ist (wenn es auf der Basis der Anzahl von Segmenten gezählt wird). Das bedeutet, daß zwischen den Markierungen eine Art Rauschen existiert, und es ist somit auch eine nicht wünschenswerte Interpretation. Bei der eben ausgeführten Beschreibung ist somit klar, daß wenn eines aus logischem Intervall und physikalischem Intervall gleich 0 ist, es unnatürlich ist, daß das andere nicht gleich 0 ist. Allgemeiner kann der Kostenwert als sich verschlechternd festgestellt werden (Anwenden eines Straf faktors), wenn die Differenz zwischen dem logischen Intervall und dem physika lischen Intervall groß ist.

Der Faktor (E) wurde bisher für die Kostenkalkulation bei einer Symbol leseoperation verwendet, und Zuverlässigkeit oder Unzuverlässigkeit (Abstand) in der individuellen Erkennung wird der Kostenwertbeurteilung hinzugefügt.

Selbst wenn die Wortsucheinrichtung 5 durch die Markierungserzeu gungsmethode wie oben beschrieben realisiert wird, kann die Prüfoperation wie oben beschrieben angewendet werden.

Bei der Markierungserzeugungsmethode wie oben beschrieben können viele Markierungen für ein Schriftzeichen erzeugt werden. In einem solchen Fall besteht eine Möglichkeit, daß die Verarbeitungszeit und die verwendete Speicher menge des Markierungsinformationszwischenspeichers 52 vergrößert wird. Dem entsprechend kann für spezifische Schriftzeichen, für die viele Markierungen erzeugt werden, eine Methode des Ausführens der Prüfoperation ohne die Erzeu gung von Markierungen verwendet werden. Um diese Methode zu realisieren, können die Wortsucheinrichtung 5, die Prüfanteilbestimmungseinrichtung 7 und die Prüfeinrichtung 8 wie folgt konstruiert werden.

Die Wortsucheinrichtung 5 umfaßt die folgenden Elemente.

Der Einschränkungsmarkierungswörterbuchspeicher 55 dient dazu, für jedes Schriftzeichen, ausgenommen spezifischer Schriftzeichen, zumindest dreitei lige Informationen über "das Wort U, welches das Schriftzeichen enthält, die Schriftzeichenkettenlänge L von U, die Position P des Schriftzeichens in U" zu speichern. Die Markierungserzeugungseinrichtung 51 sucht für einen Schrift zeichenkandidaten in dem Erkennungsresultatzwischenspeicher 4 die dreiteilige Information aus dem Einschränkungsmarkierungswörterbuchspeicher 55, welche dem Schriftzeichenkandidaten entspricht. Der Markierungsinformationszwischen speicher 53 speichert das Resultat der Markierungserzeugungseinrichtung 51. Die Wortverbindungseinschränkungseinrichtung 53 beschreibt eine Verbindungsein schränkung zwischen Worten. Die Markierungskettensucheinrichtung 54 verbindet zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungs informationszwischenspeicher 52 durch Verwendung der Positionsbeziehung zwischen Segmenten, welche diesen dreiteiligen Informationen entsprechen, und der Beziehung zwischen U1, L1, P1, U2, L2, P2, um so den Wortkettenkandidaten, welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungs resultatzwischenspeicher 4 entspricht, an den Wortkettenkandidatenzwischen speicher 6 auszugeben.

Die Prüfanteilbestimmungseinrichtung 7 bestimmt die Position eines spezifischen Schriftzeichens in der Schriftzeichenkette des Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher 6 als einen Prüfobjektanteil und bestimmt das spezifische Schriftzeichen als eine vermutete Schriftzeichenkette. Die Prüfeinrichtung 8 bejaht das Vorliegen der vermuteten Schriftzeichenkette, wenn das spezifische Schriftzeichen, welches als vermutete Schriftzeichenkette betrachtet wird, in den Schriftzeichenkandidaten im Erkennungsresultatzwischen speicher 4 existiert, welcher dem Prüfobjektanteil entspricht.

Wenn zum Beispiel <kawa< als spezifisches Schriftzeichen gesetzt wird, so sind in dem Einschränkungmarkierungswörterbuchspeicher 55 keine Markierun gen für <kawa<, so wie etwa [<shina<<kawa<<ku<, 3, 2] [<to<<shina<<kawa<, 3, 3] [<nishi<<shina<<kawa<, 3, 3] [<minami<<shina<<kawa<, 3, 3] [<kita<<shina< <kawa<, 3, 3], registriert. Als ein Resultat ist für die in Fig. 1A gezeigten Schriftzeichenkettenkandidaten <kawa< in den Schriftzeichenkandidaten enthalten, keine Markierung ist jedoch an diesem Anteil vorgesehen. Die Prüfanteilbestimmungseinrichtung 7 bestimmt die Position des spezifischen Schriftzeichens <kawa< als Prüfobjektanteil für den Kandidaten des Adreßleseresultats von (<shina<<kawa< <ku<<naka<<nobu<). Die Prüfeinrichtung 8 beurteilt den Erfolg der Prüfung, da <kawa< in den Schriftzeichenkandidaten (<kawa<, <ya<, <yama<) an dem Prüfobjektanteil enthalten ist.

Wie oben beschrieben werden in dem Lesegerät für Schriftzeichen ketten gemäß der vorliegenden Erfindung der Prüfobjektanteil und die vermutete Schriftzeichenkette dieses Prüfobjektanteils für den Kandidaten des Leseresultats bestimmt, und die Prüfung wird ausgeführt. Als ein Resultat kann eine exakte Leseoperation selbst dann durchgeführt werden, wenn nicht alle korrekten Schriftzeichen notwendigerweise in dem Schriftzeichenausschneide- und Schrift zeichenerkennungsresultat enthalten sind. Darüber hinaus werden die Schrift zeichen präzise beurteilt, und eine korrekte Leseoperation kann selbst dann durchgeführt werden, wenn ein korrektes Schriftzeichen mit einem anderen nicht korrekten Schriftzeichenkandidaten in Wettbewerb steht. Darüber hinaus werden bei der Prüfoperation nicht alle Leseobjekte erneut überprüft, sondern die Prüf objektanteile werden überprüft, und es reicht aus, die Möglichkeit des Vorliegens einer vermuteten Schriftzeichenkette zu beurteilen. Deshalb kann die Verarbeitung effizienter als beim Stand der Technik durchgeführt werden, und die Verarbei tungseffizienz ist hoch.

Darüber hinaus kann, wenn ein Wortkettenkandidat aus Schriftzeichen kettenkandidaten gesucht wird, die Verarbeitungseffizienz der Leseoperation von Schriftzeichenketten weiter verbessert werden, wenn eine Markierung für jedes der Schriftzeichen erzeugt wird, um die Schriftzeichen miteinander zu verbinden, ohne eine Kombination von Schriftzeichenkandidaten mit einem Wörterbuch zu ver gleichen.

Die vorliegende Erfindung wurde nun im wesentlichen anhand ihrer Anwendung auf die Erkennung von aus chinesischen Schriftzeichen bestehenden Zeichenketten beschrieben. Es ist jedoch anzumerken, daß die Erfindung keines wegs darauf beschränkt ist, sondern ganz analog auch zur Erkennung von Zeichenketten, welche aus den Buchstaben des Alphabets bestehen, verwendet werden kann.

Claims

1. Lesegerät für Schriftzeichenketten zum Lesen von Schriftzeichenketten aus Eingabebilddaten, welches aufweist:
eine Ausschneide-Erkennungseinrichtung (3) zum Ausschneiden eines Segments, welches einem Schriftzeichen aus den Bilddaten entspricht, um indivi duelle Schriftzeichenerkennung für jedes Segment durchzuführen;
einen Erkennungsresultatzwischenspeicher (4) zum Speichern eines Er kennungsresultats der Ausschneide-Erkennungseinrichtung (3);
eine Wortsucheinrichtung (5) zum Suchen eines Wortkettenkandidaten, welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungsresul tatzwischenspeicher (4) entspricht;
einen Wortkettenkandidatenzwischenspeicher (6) zum Speichern eines Suchresultats der Wortsucheinrichtung (5);
eine Prüfanteilbestimmungseinrichtung (7) zum Bestimmen eines Prüfobjektanteils, die als Prüfobjektanteil einen Anteil bestimmt, für den ein Teil einer Schriftzeichenkette eines Wortkettenkandidaten in dem Wortkettenkandida tenzwischenspeicher (6) nicht in dem Erkennungsresultatzwischenspeicher erhal ten wird, und zum Bestimmen der Schriftzeichenkette des Anteils als eine vermu tete Schriftzeichenkette;
eine Prüfeinrichtung (8) zur Beurteilung der Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette an dem Prüfanteil, wobei die Prüfeinrichtung (8) eine Fläche des Prüfobjektanteils mit der Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette vergleicht, und die Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette verwirft, wenn das Ver gleichsresultat nicht einer vorbestimmten Bedingung genügt.

2. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil ei nen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortketten kandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in dem Erken nungsresultatzwischenspeicher (4) erhalten wird, und daß sie die Schriftzeichen kette dieses Teils als vermutete Schriftzeichenkette bestimmt, wobei die Prüfein richtung (8) die Anzahl von Strichen der vermuteten Schriftzeichenkette mit der Anzahl von Strichen eines Schriftzeichenkandidaten in dem Erkennungsresultat zwischenspeicher (4), welcher dem Prüfobjektanteil entspricht, vergleicht, und die Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette verwirft, wenn das Vergleichsresultat nicht einer vorbestimmten Bedingung genügt.

3. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Wortsucheinrichtung (5) einen Wortkettenkandidaten aus einer Kombination von höherrangigen Schriftzeichenkandidaten in dem Erkennungsre sultatzwischenspeicher sucht, die Prüfanteilbestimmungseinrichtung (7) als Prüfobjektanteil einen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in höherrangigen Kandidaten in dem Erkennungsresultatzwischenspeicher (4) erhalten wird, und sie die Schriftzeichenkette dieses Anteils als vermutete Schriftzeichenkette bestimmt, wobei die Prüfeinrichtung (8) das Vorliegen der ver muteten Schriftzeichenkette bejaht, wenn ein niederrangiger Schriftzeichenkandi dat, welcher mit der vermuteten Schriftzeichenkette übereinstimmt, unter nieder rangigen Kandidaten in dem Erkennungsresultatzwischenspeicher (4) existiert, welche dem Prüfobjektanteil entsprechen.

4. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Prüfanteilbestimmungseinrichtung (7) als Prüfobjektanteil einen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in dem Erkennungsresultatzwischenspeicher (4) erhalten wird, und sie die Schriftzeichenkette dieses Anteils als vermutete Schriftzeichenkette bestimmt, wobei, wenn die Anzahl von Segmenten in dem Erkennungsresultatzwischenspeicher (4), welche den Prüfobjektanteil entspricht, mit der Anzahl von Schrifzeichen der vermuteten Schriftzeichenkette überein stimmt, die individuelle Schriftzeichenerkennung für das der vermuteten Schrift zeichenkette entsprechende Segment erneut ausgeführt wird, indem eine individuelle Schriftzeichenerkennungseinrichtung verwendet wird, welche sich von der Ausschneide-Erkennungseinrichtung (3) unterscheidet, und das Vorliegen der vermuteten Schriftzeichenkette bejaht wird, wenn der als Resultat des erneuten Versuchs erhaltene Schriftzeichenkandidat mit der vermuteten Schriftzeichenkette übereinstimmt.

5. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil einen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortketten kandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in dem Erkennungsresultatzwischenspeicher (4) erhalten wird, und sie die Schriftzeichenkette dieses Anteils als vermutete Schriftzeichenkette bestimmt, wobei, wenn die Anzahl von Segmenten in dem Erkennungsresultatzwischenspeicher (4), welche dem Prüfobjektanteil entspricht, nicht mit der Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette übereinstimmt, das Ausschneiden eines Segments aus den Bilddaten eines Bereichs, welcher dem Prüfobjektanteil entspricht, unter Berücksichtigung der Form oder der Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette erneut ausgeführt wird, die individuelle Schriftzeichenerkennung für das Segment ausgeführt wird und das Vorliegen der vermuteten Schriftzeichenkette bejaht wird, wenn der Schriftzeichenkandidat des Schriftzeichenerkennungsresultats mit der vermuteten Schriftzeichenkette übereinstimmt.

6. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Prüfanteilbestimmungseinrichtung (7) Schriftzeichenketten mehrerer Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher (6) vergleicht, um als Prüfobjektanteil einen Anteil zu bestimmen, bei dem ein teilweiser Unterschied zwischen den Schriftzeichenketten festgestellt wird, und um als vermutete Schriftzeichenkette mehrere Kombinationen von Schriftzeichenketten, welche unterschiedliche Anteile aufweisen, zu bestimmen, wobei die Prüfeinrichtung (8) die individuelle Schriftzeichenerkennung für das Segment, welches der vermuteten Schriftzeichenkette entspricht, erneut ausführt, indem eine Schriftzeichenerkennungseinrichtung verwendet wird, welche sich von der Ausschneide-Erkennungseinrichtung (3) unterscheidet, und die Prüfeinrichtung (8) das Vorliegen der vermuteten Schriftzeichenkette bejaht, wenn die Zuverlässigkeit des Schriftzeichenkandidaten des Resultats des erneuten Versuchs der Erkennung einer vorbestimmten Bedingung genügt.

7. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Wortsucheinrichtung (5) einen Markierungswörterbuchspeicher (50) umfaßt, um für jedes Schriftzeichen zumindest dreiteilige Informationen bestehend aus "Wort U, welches das Schriftzeichen enthält, Schriftzeichenlänge L von U, Position P des Schriftzeichens in U" zu speichern, eine Markierungserzeugungseinrichtung (51), um für einen Schriftzeichenkandidaten in dem Erkennungsresultatzwischenspeicher (4) die dreiteilige Information aus dem Markierungswörterbuchspeicher (50) zu suchen, die dem Schriftzeichenkandidaten entspricht, einen Markierungsinformationszwischenspeicher (52), um ein Resultat der Markierungserzeugungseinrichtung (51) zu speichern, einen Wortverbindungs- Einschränkungsspeicher (53), um eine Verbindungseinschränkung zwischen Worten zu beschreiben, und eine Markierungskettensucheinrichtung (54), um zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformationszwischenspeicher (52) miteinander zu verbinden, indem die Positionsbeziehung der Segmente, welche der dreiteiligen Information entspre chen, und die Beziehung zwischen U1, L1, P1, U2, L2, P2 verwendet werden, um so den Wortkettenkandidaten auszugeben, welcher einer Kombination der Schrift zeichenkandidaten in dem Erkennungresultatzwischenspeicher (4) entspricht.

8. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn zeichnet, daß die Wortsucheinrichtung einen Einschränkungsmarkierungswörterbuch speicher umfaßt, um für jedes Schriftzeichen ausgenommen eines spezifischen Schriftzeichens zumindest dreiteilige Informationen, bestehend aus "Wort U, welches das Schriftzeichen enthält, Schriftzeichenkettenlänge L von U, Position P des Schriftzeichens in U" zu speichern, eine Markierungserzeugungseinrichtung (51), um für Schriftzeichenkandidaten in dem Erkennungsresultatzwischenspeicher (4) die dreiteiligen Informationen aus dem Einschränkungsmarkierungswörterbuchspeicher zu suchen, welche dem Schriftzeichenkandidaten entsprechen, einen Markierungs informationszwischenspeicher (52), um das Resultat der Markierungserzeugungs einrichtung zu speichern, einen Wortverbindungseinschränkungsspeicher (52), um eine Verbindungseinschränkung zwischen Worten zu beschreiben, und eine Markierungskettensucheinrichtung (54), um zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformationszwischenspeicher (52) miteinander zu verbinden, indem die Positionsbeziehung der Segmente, welche den dreiteiligen Informationen entsprechen, und die Beziehung zwischen U1, L1, P1, U2, L2, P2 verwendet werden, um dadurch den Wortkettenkandidaten auszugeben, welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungsresultatzwischenspeicher (4) entspricht, wobei die Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil die Position des spezifischen Schriftzeichens der Schriftzeichenkette des Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher (6) bestimmt, und sie das spezifische Schriftzeichen als eine vermutete Schriftzeichenkette bestimmt, und wobei die Prüfeinrichtung (8) das Vorliegen der vermuteten Schriftzeichenkette bejaht, wenn das spezifische Schriftzeichen, welches als vermutete Schriftzeichenkette betrachtet wird, unter den Schriftzeichenkandidaten in dem Erkennungsresultatzwischenspeicher (4) existiert, welche dem Prüfobjektanteil entsprechen.