DE19547812A1 - Lesegerät für Schriftzeichenketten - Google Patents
Lesegerät für SchriftzeichenkettenInfo
- Publication number
- DE19547812A1 DE19547812A1 DE19547812A DE19547812A DE19547812A1 DE 19547812 A1 DE19547812 A1 DE 19547812A1 DE 19547812 A DE19547812 A DE 19547812A DE 19547812 A DE19547812 A DE 19547812A DE 19547812 A1 DE19547812 A1 DE 19547812A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- candidate
- string
- character string
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
Die vorliegende Erfindung bezieht sich auf ein Lesegerät für Schriftzei
chenketten zum Lesen von Schriftzeichenketten von Eingabebilddaten und,
genauer, auf ein Lesegerät zum Lesen von auf Postsendungen oder auf eine Liste
geschriebenen Adressen, ein Gerät zum Lesen von Sätzen in einem Schriftstück,
ein Schreibstifteingabegerät zum Schreiben von Sätzen in einen Computer mit
einem Eingabestift (stylus pen) oder ähnlichem.
Die hierbei erwähnten Schriftzeichen können sowohl die Buchstaben
des Alphabets als auch z. B. chinesische Schriftzeichen sein.
Bei einem herkömmlichen Lesegerät für Schriftzeichenketten werden
zunächst Bilddaten eingegeben, und dann wird ein jedem Schriftzeichen
entsprechendes Segment aus den Bilddaten herausgeschnitten. Daraufhin wird für
jedes Segment einzeln die Schriftzeichenerkennung durchgeführt. In einigen
Fällen wird das Leseresultat einer Schriftzeichenkette bereits auf dieser Stufe
ermittelt. Um jedoch das Leseresultat genauer zu machen, werden
Einschränkungen für eine Aneinanderreihung von Schriftzeichen oder Worten für
die Schriftzeichen der Segmente verwendet. In diesem Fall wird eine Kette von
Schriftzeichenkandidaten als ein individuelles Erkennungsresultat mit einem
Wörterbuch verglichen, um eine korrekte Schriftzeichenkette als
Aneinanderreihung von Schriftzeichen oder Worten zu erhalten.
Das Lesen von Adressen gemäß der oben beschriebenen Verarbei
tungsweise wird mit Bezugnahme auf Fig. 1A beschrieben.
Um eine Adresse zu lesen, werden die Bilddaten auf der Adressie
rungsfläche einer Postsendung oder auf einer Liste eingegeben. In diesem Fall
bedeuten "Worte" die Teile von Adressen, wie etwa die Stadt, den Bezirk, das
Land, die Straße, die Namen von Staaten etc. In Japan sind es z. B. die
Adressenteile To, Do, Fu und Ken.
Eine solche Unterteilung ist sowohl bei einer Adresse in Deutschland
wie auch in einem anderen Land, z. B. in Japan, sinnvoll. Die nachfolgenden
Erläuterungen beziehen sich dabei auf das Erkennen von in chinesischen
Schriftzeichen geschriebenen japanischen Adressen, analog könnten jedoch auch
mit Buchstaben des Alphabets geschriebene deutsche Adressen gelesen werden.
In Fig. 1A wird ein Segment 20, das jeweils einem Schriftzeichen
entspricht, zunächst aus den zu lesenden Bilddaten 10 herausgeschnitten, und
dann wird für jedes ausgeschnittene Segment 20 eine Schriftzeichenerkennung
durchgeführt, um so verschiedene Schriftzeichenkandidatenketten 30 zu erhalten.
Diese Schriftzeichenkandidatenketten 30 entsprechen Feldern von
Schriftzeichenkandidaten, die als den korrekten Schriftzeichen der Bilddaten 10
ähnelnde Schriftzeichen ausgewählt wurden. Bei diesem Schritt werden mehrere
mögliche Schriftzeichenkandidaten für ein einzelnes zu lesendes Segment
ausgewählt. Z.B. werden in Fig. 1A drei Schriftzeichenkandidaten, nämlich die
Zeichen <nishi<, <shina< und <dai< als Schriftzeichenkandidaten ausgewählt, die
dem Segment 20 ganz links im Block 10 von Fig. 1A entsprechen bzw. diesem
ähneln. Im Text der vorliegenden Beschreibung wird ein Wort, das durch ein
chinesisches Schriftzeichen repräsentiert wird, in seiner Darstellung durch die
Buchstaben des Alphabets (japanisch: "romaji") wiedergegeben. Insbesondere wird
verwiesen auf die Fig. 1B, in der die in der vorliegenden Beschreibung
verwendeten Schriftzeichen zusammen mit ihrer Wiedergabe durch die
Buchstaben des Alphabets ("romaji") zusammengestellt sind. Die in spitzen
Klammern wiedergegebenen Buchstabenfolgen entsprechen also jeweils der
Aussprache bzw. Lesart eines chinesischen Schriftzeichens. Es ist jedoch noch
anzumerken, daß für die meisten chinesischen Schriftzeichen verschiedene
Aussprachemöglichkeiten, sogenannte verschiedene Lesungen, existieren. Im
allgemeinen kann jedes japanische oder chinesische Schriftzeichen auf zwei oder
mehr Arten gelesen, d. h. ausgesprochen werden, je nachdem, in welcher Form es
mit anderen Schriftzeichen kombiniert wird. Die Zusammenstellung von Fig. 1B ist
daher nicht notwendigerweise die einzige mögliche Lesart der dort dargestellten
Schriftzeichen, sie gibt jedoch zumindest eine mögliche Lesart der Schriftzeichen
wieder. Die Bedeutung des Schriftzeichens bleibt jedoch unabhängig von der Art
wie es gelesen wird, immer gleich.
Durch das Vergleichen der Schriftzeichenketten 30 mit einem
Wörterbuch für Adressenelemente , welches tatsächlich existierende
Adressenelemente enthält, wird eine Kombination von Adressenelementen,
nämlich (<shina< <kawa< <ku<) (<naka<<nobu<) als beste Kombination
ausgewählt, und diese Kombination wird schließlich als ein Adreßleseresultat 90
ausgewählt.
Diese Art von herkömmlichem Adressenlesegerät wird den "OCR
Address Reading/Letter Sorting Machine for the Ministry of Posts and
Telecommunications of Japan" (Druckschrift 1, Ishikawa et al., NEC Technical
Journal, Bd. 44, Nr. 3,1991), in "Japanese Address Reader-Sorter, Model TR-17"
(Druckschrift 2, Torimoto et al., Toshiba Review, Bd. 45, Nr. 2, 1990), in der
japanischen Offenlegungsschrift Hei-5-324899 "Recognition Device for Addresses
written on Mails" (Druckschrift 3) und in der japanischen Offenlegungsschrift Hei-3-
189780 "Address Recognition Device" (Druckschrift 4) beschrieben.
Darüber hinaus werden herkömmliche Geräte zum Lesen von Sätzen in
einem Schriftstück und herkömmliche Geräte zur Eingabe von Sätzen mit einem
Schreibstift in "Implementation and Evaluation of Post Processing for Japanese
Document Readers" (Druckschrift 5, Takao et al., Transactions of Information
Processing Society of Japan, Bd. 30, Nr. 11,1989), in "A method of detecting and
correcting errors in the Japanese OCR" (Druckschrift 6, lto et al., Transactions of
Information Processing Society of Japan, Bd. 33, Nr. 5,1992), in "Natural Ianguage
processing in text recognition" (Druckschrift 7, Nishino, Journal of Information
Processing Society of Japan, Bd. 34, Nr. 10,1993), und in "On-line handwritten
character recognition system" Sho-61-086883 (Druckschrift 8) beschrieben.
Nicht alle Schriftzeichen, die eine korrekte Schriftzeichenkette bilden,
sind notwendigerweise in den Schriftzeichenkandidaten als einzelnes Schrift
zeichenerkennungsresultat enthalten. Im Fall von Fig. 1A entspricht die korrekte zu
lesende Schriftzeichenkette 10 einer Kombination der Schriftzeichenkandidaten,
die in den Schriftzeichenkandidatenketten 30 enthalten sind. Wenn jedoch z. B.
<kawa< in der zweiten Spalte der Schriftzeichenkandidatenketten 30 nicht
enthalten ist und als Schriftzeichenkandidaten die in Block 30 von Fig. 2A
dargestellten Schriftzeichen ausgewählt werden, so kann die korrekte
Schriftzeichenkette <shina<<kawa<<ku<<naka<<nobu< nicht durch eine Kombi
nation der Schriftzeichenkandidaten der Schriftzeichenkandidatenketten 30
erhalten werden.
Um schließlich das Leseresultat in einem solchen Fall zu ermitteln, wird
gemäß einem ersten Verfahren bei der Schriftzeichenerkennung ein Vergleich mit
einem Lesesprung (unvollständige Übereinstimmung) gestattet. Im Falle der
Schriftzeichenkandidatenketten 30 aus Fig. 2A besteht die Möglichkeit, daß
<shina<<kawa<<ku< <naka<<nobu< oder <shina<<kawa<<ku<
<nishi<<naka<<nobu< als Kandidaten für das Adreßleseresultat 91 erhalten
werden. Wird <shina<<kawa<<ku< <nishi<<naka<<nobu< ausgewählt, so findet
diese Auswahl unter dem Gesichtspunkt der Beurteilung statt, daß ein Segment
aufgrund der Mehrdeutigkeit des Ausschneidens von Schriftzeichen ein Segment
zwei Schriftzeichen abdeckt.
Bei einem zweiten Verfahren wird die Anzahl von Schriftzeichen
kandidaten zunächst vergrößert, um die Wahrscheinlichkeit des Auslassens eines
korrekten Schriftzeichens zu verringern, und diese Schriftzeichenkandidaten
werden mit einem Wörterbuch verglichen. In der japanischen Offenlegungsschrift
Sho-62-25 1986 "Erroneously-read character correcting processing device"
(Druckschrift 9) ist beschrieben, daß jedem Schriftzeichenkandidaten nach der
Schriftzeichenerkennung ein weiteres Schriftzeichen, das diesem ähnelt,
hinzugefügt wird, und dann werden diese Schriftzeichen auch mit einem
Wörterbuch verglichen. Wird dieses Verfahren auf den Fall von Fig. 2A
angewendet, so wird <kawa< den Schriftzeichenkandidaten als ein in seiner Form
(ebenfalls bestehend aus drei nahezu senkrechten Strichen) dem Schriftzeichen
<ko< in der zweiten Spalte des Blocks 30 aus Fig. 2A ähnelndes Schriftzeichen
hinzugefügt.
Gemäß einem dritten Verfahren wird eine Schriftzeichenüber
einstimmungsbedingung für den Vergleich erweitert, wenn der Vergleich mit dem
Wörterbuch fehlschlägt. Z.B. wird in der japanischen Patentanmeldung Hei-3-
73086 "Character recognition post-processing system" (Druckschrift 10)
beschrieben, daß die Schriftzeichenübereinstimmung bejaht wird, wenn die Anzahl
der Striche in einem chinesischen Schriftzeichenkandidaten der des zu lesenden
Schriftzeichens am nächsten kommt. Im Falle von Fig. 2A wird, da die Anzahl der
Striche von <ko< aus der Gruppe von {<ko<, <hachi<, <yama<} nahe bei der von
<kawa< liegt, entscheidet sich das System für die Übereinstimmung des zu
beurteilenden Segments mit dem Schriftzeichen <kawa<.
Gemäß einem vierten Verfahren wird ein Schriftzeichenkandidat durch
ein anderes Schriftzeichen ersetzt, wenn der Vergleich des Schriftzeichenkan
didaten mit dem Wörterbuch fehlschlägt, und dann wird der neue Schriftzeichen
kandidat mit dem Wörterbuch erneut verglichen. Bei der japanischen Offen
legungsschrift Sho-58-490 "Character recognition device" (Druckschrift 11) wird
eine erste Schriftzeichenkandidatenkette mit dem Wörterbuch verglichen. Schlägt
der Vergleich fehl, wird ein Kandidat durch einen neuen oder mehrere neue
ersetzt, und die resultierende Schriftzeichenkette mit einem neuen Kandidaten wird
erneut mit dem Wörterbuch verglichen. Darüber hinaus wird in der japanischen
Offenlegungsschrift Hei-5-46814 "Character reading device" (Druckschrift 12) ein
Schriftzeichenkandidat durch ein anderes Schriftzeichen ersetzt, das eine Form
aufweist, die der Form des zu ersetzenden Schriftzeichenkandidaten ähnelt, und
dann wird die Schriftzeichenkette erneut mit dem Wörterbuch verglichen.
Gemäß einem fünften Verfahren wird eine Vergleichsbedingung oder
ähnliches geändert und die Verarbeitung wird vom Schritt der Schriftzeichen
erkennung an erneut ausgeführt. In der japanischen Offenlegungsschrift Hei-2-
300972 "Electronic dictionary" (Druckschrift 13) wird ein Rastermaß, mit dem
Bilddaten digitalisiert werden, verändert, und die Schriftzeichenerkennung wird
erneut ausgeführt.
Berücksichtigt man, daß die Schriftzeichenerkennung auch auf
verschiedene Schriftzeichenketten angewendet wird, die handgeschriebene
Schriftzeichenketten enthalten, so besteht eine geringe Wahrscheinlichkeit, daß
alle Schriftzeichen, die eine korrekte Schriftzeichenkette bilden, als Schrift
zeichenkandidaten mit dem herkömmlichen Verfahren des Ausschneidens und der
Schriftzeichenerkennung als Resultat erhalten werden. Dementsprechend ist es
extrem selten, daß die korrekte Schriftzeichenkette von einem Lesegerät für
Schriftzeichen ausgelesen wird, wenn dieses auf der Annahme basiert, daß alle
Schriftzeichen, die die korrekte Schriftzeichenkette bilden, in den Schrift
zeichenkandidaten, die als individuelle Erkennungsresultate erhalten werden
enthalten sind.
Es ist deshalb unabdinglich, daß ein Verfahren geschaffen wird,
welches ein exaktes Lesen selbst dann ermöglicht, wenn nicht alle korrekten
Schriftzeichen als individuelles Erkennungsresultat zur Verfügung stehen. Die
oben erwähnten fünf Verfahren wurden vorgeschlagen, um diese Forderung zu
erfüllen, jedoch haben die Verfahren (erstes bis fünftes Verfahren) die folgenden
Nachteile.
Das erste Verfahren ist ein grundlegendes Verfahren, aber es bringt den
Nachteil mit sich, daß eine große Anzahl von Schriftzeichenkandidaten als
Leseresultat ausgewählt werden muß (d. h. es existiert eine große Anzahl von
Möglichkeiten bzw. möglichen Kandidaten), und somit ist die Informationsmenge
zu gering, um ein exaktes Leseresultat durch das Überprüfen einer großen Anzahl
von Kandidaten (Einengen der Möglichkeiten) zu bestimmen.
Bei dem zweiten Verfahren wird die Anzahl der Möglichkeiten bzw.
Kandidaten zuvor vergrößert, so daß viele Fälle auftreten können, bei denen eine
große Anzahl von Möglichkeiten (Kandidaten) als endgültiges Leseresultat aus
gewählt werden. Darüber hinaus wird, da die Anzahl von Schriftzeichenkandidaten
vergrößert wird, auch die zu verarbeitende Datenmenge und die Verarbeitungszeit
im allgemeinen entsprechend der Anzahl der Kombinationen vergrößert.
Bei dem dritten Verfahren wird eine große Anzahl von Kandidaten
überprüft, es wird jedoch eine große Anzahl von Leseresultaten erzeugt, die in der
Anzahl der Striche der chinesischen Schriftzeichen nahe beieinanderliegen, so
daß der tatsächliche Effekt dieser zusätzlichen Einschränkung nicht ausreicht. Bei
dem vierten und fünften Verfahren ist die Verarbeitungseffizienz gering, da der
Vergleich mit dem Wörterbuch jedesmal erneut durchgeführt wird, wenn ein
Schriftzeichenkandidat verändert wird.
Darüber hinaus kann in einigen Fällen, selbst wenn das korrekte
Schriftzeichen in einer Schriftzeichenkandidatenkette enthalten ist, ein weiteres
Leseresultat, das auf einem anderen Schriftzeichenkandidaten basiert, existieren.
Gemeint ist, daß für mehr als eine Schriftzeichenkandidatenkette der Vergleich mit
dem Wörterbuch positiv ausfällt. In einem solchen Fall stehen die beiden positiven
Vergleichsresultate gegeneinander, und es muß entschieden werden, welches
Resultat nun tatsächlich den Bilddaten entspricht. Ein solcher Fall wird in Fig. 2B
gezeigt. Hier existieren im vierten Segment von links aus die Kandidaten <nishi<
und <minami<, somit sind als Resultat die Schriftzeichenketten (<shina<<kawa<
<ku< <nishi<<shina<<kawa<) und (<shina<<kawa<<ku< <minami<<shina<<kawa<)
möglich, welche beide bei einem Vergleich mit dem Wörterbuch in diesem auch
aufgefunden werden. Ein analoger Fall in der deutschen Sprache wäre z. B. die
Erkennung "oben" und "Ofen", welche beide bei einem Vergleich mit einem
Wörterbuch aufgefunden würden.
Die herkömmlichen oben beschriebenen Verfahren eins bis fünf wie
oben beschrieben basieren auf der Annahme, daß das Schriftzeichenlesen nicht
zufriedenstellend ausgeführt wird, oder daß ein Lesesprung auftritt, und somit sind
diese Verfahren nicht zur exakten Auswahl eines Schriftzeichenkandidaten
anwendbar, wenn mehrere Leseresultate (Schriftzeichenkandidaten) erhalten
werden, bei denen kein Lesesprung auftritt. In solch einem Fall, wenn mehrere
Kandidaten miteinander im Wettbewerb stehen, verwenden diese herkömmlichen
Verfahren die Zuverlässigkeit der Erkennung eines Schriftzeichenkandidaten
bestenfalls als einen Hilfsfaktor.
Hat z. B. im Falle von Fig. 2B <nishi< als Schriftzeichenkandidat eine
höhere Zuverlässigkeit was das Lesen anbetrifft (d. h. eine höhere Kandida
tenordnung) als <minami<, so wird <shina<<kawa<<ku< <nishi<<shina<<kawa<
vorzugsweise als endgültiges Leseresultat ermittelt. Wenn jedoch ein Schrift
zeichenkandidat unter der Bedingung ermittelt werden muß, daß ausreichende
Informationen nicht erhalten werden, wenn mehrere Schriftzeichenkandidaten
hintereinander im Wettbewerb stehen, so tritt ein Lesefehler auf.
Eine Aufgabe der vorliegenden Erfindung besteht darin, ein Lesegerät
für Schriftzeichenketten zu schaffen, welches in der Lage ist, eine genaue bzw.
zutreffende Schriftzeichenleseoperation mit hoher Effizienz selbst dann
durchzuführen, wenn nicht notwendigerweise korrekte Schriftzeichen in einem
Auschneide-/Schriftzeichenerkennungsresultat enthalten sind, und welches auch in
der Lage ist, eine genaue bzw. zutreffende Beurteilung durchzuführen, wenn ein
korrektes Schriftzeichen mit einem anderen Schriftzeichenkandidaten im
Wettbewerb steht, wodurch eine genaue bzw. zutreffende
Schriftzeichenleseoperation durchgeführt wird.
Um die obige Aufgabe zu erfüllen, umfaßt ein Lesegerät für Schrift
zeichenketten zum Lesen von Schriftzeichenketten aus Eingabebilddaten eine
Ausschneide-Erkennungseinrichtung, um ein Segment, das einem Schriftzeichen
aus den Bilddaten entspricht, auszuschneiden, um individuelle Schriftzeichen
erkennung für jedes Segment durchzuführen, einen Erkennungsresultatzwi
schenspeicher, um ein Erkennungsresultat von der Ausschneide-Erkennungsvor
richtung zu speichern, eine Wortsucheinrichtung, um einen Wortkettenkandidaten,
der einer Kombination von Schriftzeichenkandidaten in dem Erkennungsresultat
zwischenspeicher entspricht, zu suchen, einen Wortkettenkandidatenzwischen
speicher, um ein Suchresultat der Wortsucheinrichtung zu speichern, eine
Prüfanteilbestimmungsvorrichtung, um einen Prüfobjektanteil und eine vermutete
Schriftzeichenkette des Prüfobjektanteils auf der Basis des Resultats in dem
Wortkettenkandidatenzwischenspeicher zu ermitteln, und eine Prüfeinrichtung, um
die Wahrscheinlichkeit des Vorliegens der vermuteten Schriftzeichenkette in dem
Prüfanteil zu beurteilen.
Gemäß der vorliegenden Erfindung wird die Wahrscheinlichkeit des
Vorliegens einer vermuteten Schriftzeichenkette dann überprüft, wenn ein
korrektes Schriftzeichen nicht in einer Schriftzeichenkandidatenkette enthalten ist,
und somit ein Lesesprung ausgeführt wird, oder wenn mehrere Leseresultate
(Schriftzeichenkandidaten) auftreten, weil ein Schriftzeichenkandidat vorliegt, der
mit einem korrekten Schriftzeichenkandidat im Wettbewerb steht.
Im Falle von Fig. 2A wird mit Bezug auf den ersten der Kandidaten 91
für ein Adreßleseresultat, bestehend aus <shina<<kawa<<ku<<naka<<nobu< das
Zeichen <kawa<, welches übersprungen wird, weil es nicht in den
Schriftzeichenkandidaten enthalten ist, als eine vermutete Schriftzeichenkette
überprüft. Darüber hinaus wird mit Bezug auf den zweiten der Kandidaten 91 für
ein Adreßleseresultat bestehend aus <shina<<kawa<<ku<<nishi<<naka<<nobu<
die Schriftzeichenkette <kawa<<ku< als eine vermutete Schriftzeichenkette
überprüft.
Im Falle von Fig. 2B werden mit Bezug auf die zwei Kandidaten 91 für
ein Adreßleseresultat bestehend aus <shina<<kawa<<ku<<nishi<<shina<<kawa<
und <shina<<kawa<<ku<<minami<<shina<<kawa< die beiden Schriftzeichen
<nishi< und <minami<, welche miteinander im Wettbewerb stehen, als vermutete
Schriftzeichenketten überprüft. Die zu lesenden Bilddaten sind dabei sowohl im
Falle von Fig. 2A als auch im Falle von Fig. 2B die des Blocks 10 aus Fig. 1A.
Durch die Überprüfung wird die Information über einen zu überprü
fenden Anteil zum Zwecke der Beurteilung vergrößert, und die Leseoperation kann
mit größerer Genauigkeit durchgeführt werden, indem die vergrößerte Informa
tionsmenge verwendet wird.
Darüber hinaus müssen nicht alle zu erkennenden Objekte erneut über
prüft werden, sondern es genügt, lediglich Prüfobjektanteile zu überprüfen, und die
Wahrscheinlichkeit eines Vorliegens einer vermuteten Schriftzeichenkette zu
beurteilen, so daß im Vergleich zum herkömmlichen Verfahren die Verarbeitung
effizienter durchgeführt werden kann.
Die Erfindung wird anhand verschiedener Zeichnungen im Detail
erläutert, welche im einzelnen folgendes darstellen.
Fig. 1A zeigt ein Diagramm, welches den Verarbeitungsfluß einer
herkömmlichen Adreßleseoperation darstellt;
Fig. 1B zeigt eine Zusammenstellung von japanischen bzw. chinesi
schen Schriftzeichen und ihrer Darstellung mit Hilfe von Buchstaben des Alphabets
("romaji");
Fig. 2A und 2B sind Diagramme, welche Schriftzeichenkandidatenketten
und Kandidaten für Adreßleseresultate darstellen;
Fig. 3 ist ein Blockdiagramm, welches den Aufbau eines Lesegeräts für
Schriftzeichenketten in einer Ausführungsform gemäß der vorliegenden Erfindung
darstellt;
Fig. 4 ist ein Diagramm, welches die Operation eines ersten Verfahrens
zur Realisierung der Prüfeinrichtung darstellt;
Fig. 5 zeigt ein Diagramm, welches die Operation eines zweiten
Verfahrens zur Realisierung der Prüfeinrichtung darstellt;
Fig. 6 zeigt ein Blockdiagramm, welches ein erstes Verfahren zur
Realisierung der Wortsucheinrichtung 5 darstellt;
Fig. 7 zeigt eine Markierungsverbindung durch ein erstes Realisie
rungsverfahren der Markierungsverbindungssucheinrichtung;
Fig. 8 zeigt eine Markierungsverbindung durch eine zweites Realisie
rungsverfahren der Markierungsverbindungssucheinrichtung;
Fig. 9 zeigt eine Markierungsverbindung durch eine drittes Realisie
rungsverfahren der Markierungsverbindungssucheinrichtung;
Fig. 10 zeigt eine Liste von Adressenelementen;
Fig. 11 zeigt ein Beispiel des Inhalts eines Markierungswörter
buchspeichers;
Fig. 12 zeigt ein Beispiel des Inhalts eines Markierungsinformations
zwischenspeichers;
Fig. 13 zeigt ein Beispiel eines Musters eines Prüfobjektanteils;
Fig. 14 zeigt ein Beispiel eines Wörterbuchs, in dem ein Kontaktmodus
zum Suchen nach Trennungspunkten registriert ist; und
Fig. 15 zeigt ein Beispiel der Erkennung der Trennungspunkte.
Im folgenden werden die bevorzugten Ausführungsbeispiele der vor
liegenden Erfindung mit Bezugnahme auf die beiliegenden Zeichnungen erläutert.
Fig. 3 zeigt ein Blockdiagramm, welches das Lesegerät für Schriftzei
chenketten gemäß einem Ausführungsbeispiel der vorliegenden Erfindung dar
stellt.
In Fig. 3 umfaßt das Lesegerät für Schriftzeichenketten gemäß der
vorliegenden Erfindung eine Bildeingabeeinrichtung 1 zur Eingabe von Bilddaten,
einen Bildzwischenspeicher 2 zur Speicherung von Bilddaten, welche durch die
Bildeingabeeinrichtung 1 eingegeben wurden, eine Ausschneide-Erkennungsein
richtung 3 zum Ausschneiden eines Segments, welches jeweils einem Schrift
zeichen der Bilddaten entspricht und zur Durchführung individueller Schriftzeichen
erkennung für jedes ausgeschnittene Segment, einen Erkennungsresultatzwi
schenspeicher 4 zum Speichern eines Resultats der Ausschneide-Erkennungs
einrichtung 3, eine Wortsucheinrichtung 5 zum Suchen eines Wortkettenkandi
daten, welcher einer Kombination von Schriftzeichenkandidaten in dem
Erkennungsresultatzwischenspeicher 4 entspricht, einen Wortkettenkandidaten
zwischenspeicher 6 zum Speichern eines Suchresultats der Wortsucheinrichtung
5, eine Prüfanteilbestimmungsvorrichtung 7 zum Bestimmen eines Prüfobjekt
anteils und einer vermuteten Schriftzeichenkette des Prüfobjektanteils auf der
Basis des Resultats in dem Wortkettenkandidatenzwischenspeicher 6; und eine
Prüfeinrichtung 8 zur Beurteilung der Wahrscheinlichkeit des Vorliegens der
vermuteten Schriftzeichenkette des Prüfobjektanteils, welcher durch die
Prüfanteilbestimmungseinrichtung 8 bestimmt wurde.
Der Bildzwischenspeicher 2, der Erkennungsresultatzwischenspeicher 4
und der Wortkettenkandidatzwischenspeicher 6 können durch eine Speicher
einrichtung wie z. B. einen IC-Speicher, eine magnetische Speicherplatte oder
ähnliches realisiert werden. Die Bildeingabeeinrichtung 1 kann durch einen
Bildscanner realisiert werden. Die Auschneide-Erkennungseinrichtung 3, die
Wortsucheinrichtung 5, die Prüfanteilbestimmungseinrichtung 7 und die
Prüfeinrichtung 8 können durch eine Zentraleinheit (CPU) eines Computers oder
auch durch kundenspezifische Schaltungen realisiert werden.
Bezugnehmend auf Fig. 3 entspricht das vorher beschriebene
herkömmliche Lesegerät für Schriftzeichenketten einer Zusammenstellung aller
Elemente bis auf die Prüfanteilbestimmungseinrichtung 7 und die Prüfeinrichtung
8, d. h., das herkömmliche Lesegerät umfaßt eine Zusammenstellung bestehend
aus der Bildeingabeeinrichtung 1, dem Bildzwischenspeicher 2, der Ausschneide-
Erkennungseinrichtung 3, dem Erkennungsresultatzwischenspeicher 4, der
Wortsucheinrichtung 5 und dem Wortkettenkandidatenzwischenspeicher 6, und
der Verarbeitungsfluß des Lesegeräts ist identisch mit dem der herkömmlichen
Technik, wie sie oben mit Bezugnahme auf Fig. 1A beschrieben wurde. Ein
Verfahren zur Realisierung der oben beschriebenen Verarbeitungsweise wird in
den Druckschriften 1 bis 13 wie oben beschrieben erläutert.
Die Prüfanteilbestimmungseinrichtung 7 und die Prüfeinrichtung 8,
welche die Hauptmerkmale der vorliegenden Erfindung bilden, werden auf der
Basis des folgenden Ausführungsbeispiels beschrieben.
Die nachfolgenden zwei Verfahren werden in der Prüfanteil
bestimmungseinrichtung 7 zur Bestimmung eines Prüfobjektanteils verwendet.
- A) Bezüglich eines Wortkettenkandidaten (ein Kandidat bestehend aus einem Leseresultat oder auch Leseresultatkandidat) wird ein Anteil als Prüfobjektanteil ausgewählt, für den kein Schriftzeichenkandidat vorliegt, der einem den Wortkandidaten bildenden Schriftzeichen entspricht (d. h. ein Lesesprung-Anteil). In diesem Fall wird eine Schriftzeichenkette an dem Lesesprung-Anteil als vermutete Schriftzeichenkette festgelegt.
- B) Eine Vielzahl von Wortkettenkandidaten (Leseresultatkandidaten) werden miteinander verglichen, und ein Anteil, in dem sich diese Wortket tenkandidaten unterscheiden, wird als Prüfobjektanteil festgelegt. In diesem Fall wird eine Schriftzeichenkette an einem Anteil, bei dem teilweise Unterschiede festgestellt werden, als vermutete Schriftzeichenkette festgelegt.
Eine solche Beurteilung wird gemäß der folgenden Prozedur durch
geführt. Dabei wird hier angenommen, daß der Wortkettendandidatenzwischen
speicher 6, auf den während der Beurteilung Bezug genommen wird, gefüllt ist mit
einer Schriftzeichenkette von Leseresultatkandidaten, mit
Beurteilungsinformationen für jedes die Schriftzeichenkette bildende Schriftzeichen
über das jeweilige Vorliegen oder Nichtvorliegen von einem
Schriftzeichenkandidaten, welcher dem Schriftzeichen entspricht, sowie mit
Informationen über eine entsprechende Segmentposition, wenn ein solcher
Schriftzeichenkandidat vorliegt. Diese Informationen treten notwendigerweise
während der Verarbeitung in der Wortsucheinrichtung 5 auf, und diese
Informationen können gemäß dem Stand der Technik leicht von der
Wortsucheinrichtung 5 ausgegeben werden.
Die Beurteilungsprozedur gemäß Verfahren (A) geschieht folgender
maßen:
Das Vorliegen oder Nichtvorliegen eines Schriftzeichenkandidaten wird
für jeden Leseresultatkandidaten überprüft. Wird das "Nichtvorliegen" des
Schriftzeichenkandidaten festgestellt, so wird die folgende Verarbeitung gemäß
[Schritt A2] für aufeinanderfolgende derartige Leseresultatkandidaten gemeinsam
ausgeführt.
Eine Segmentposition, die einem Anteil entspricht, bei dem das
"Nichtvorliegen" des Schriftzeichenkandidaten festgestellt wird (nachfolgend als
"Nichtvorliegen-Anteil" bezeichnet), wird ermittelt, und diese Position wird als
Prüfobjektanteil festgelegt. Darüber hinaus wird eine aus dem "Nichtvorliegen-
Anteil" bestehende Schriftzeichenkette als vermutete Schriftzeichenkette
festgelegt.
Die Beurteilungsprozedur gemäß Verfahren (B) geschieht folgender
maßen:
Eine Vielzahl von Schriftzeichenketten, die Leseresultatkandidaten
darstellen, werden miteinander verglichen, um einen Anteil zu ermitteln, in dem
sich die Schriftzeichenketten voneinander unterscheiden (nachfolgend bezeichnet
als "Unterscheidungs-Anteil"). Die Verarbeitung gemäß [Schritt B2] wird dann für
jeden Unterscheidungs-Anteil durchgeführt.
Eine Segmentposition, welche einem Unterscheidungs-Anteil entspricht,
wird ermittelt, und sie wird als Prüfobjektanteil festgelegt. Darüber hinaus wird eine
sich unterscheidende Schriftzeichenkette als vermutete Schriftzeichenkette
festgelegt.
Bei einer solch einfachen Beurteilung wie oben gemäß (B) beschrieben
wird die Beurteilung mit einer äußerst hohen Rate "positiv" (d. h. die Häufigkeit des
Feststellens von Unterschieden ist äußerst hoch), wenn mehrere Lese
resultatkandidaten ausgewählt werden. Deshalb kann auch eine Einschränkung für
die Anzahl von Schriftzeichen eines Unterscheidungs-Anteils gewählt werden (z. B.
kann der Unterscheidungs-Anteil auf einen Anteil beschränkt werden, bei dem der
Unterschied innerhalb von zwei Schriftzeichen auftritt.
Wenden wir uns nun wieder Fig. 2A zu. Im Fall von Fig. 2A treten zwei
Leseresultatkandidaten 91 auf. Somit sieht der Inhalt des Wortketten
kandidatenzwischenspeichers 6 folgendermaßen aus:
Leseresultatkandidat 1:
<shina< [Leseresultatkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt nicht vor", -]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<naka< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<nobu< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)]
Leseresultatkandidat 2:
<shina< [Schriftzeichenkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt nicht vor", -]
<ku< [Schriftzeichenkandidat "liegt nicht vor", -]
<nishi< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<naka< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<nobu< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)].
Leseresultatkandidat 1:
<shina< [Leseresultatkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt nicht vor", -]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<naka< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<nobu< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)]
Leseresultatkandidat 2:
<shina< [Schriftzeichenkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt nicht vor", -]
<ku< [Schriftzeichenkandidat "liegt nicht vor", -]
<nishi< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<naka< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<nobu< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)].
Wird die Beurteilung gemäß Verfahren (A) für diese Kandidaten durch
geführt, so werden die folgenden Prüfobjektanteile und vermutete Schriftzeichen
ketten bestimmt:
für den Leseresultatkandidaten 1,
Prüfobjektanteil: Segment (2, 1)
vermutete Schriftzeichenkette: <kawa<
für den Leseresultatkandidaten 2,
Prüfobjektanteil: Segment (2, 1)
vermutete Schriftzeichenkette: <kawa<<ku<
für den Leseresultatkandidaten 1,
Prüfobjektanteil: Segment (2, 1)
vermutete Schriftzeichenkette: <kawa<
für den Leseresultatkandidaten 2,
Prüfobjektanteil: Segment (2, 1)
vermutete Schriftzeichenkette: <kawa<<ku<
Bei der obigen Darstellung (n, m) der Segmentposition repräsentiert n
die Kopfposition eines Segments und m repräsentiert die Breite eines Segments.
Hierbei ist erneut anzumerken, daß die Leseresultatkandidaten aus dem Vergleich
der Schriftzeichenketten in Block 30 von Fig. 1A mit einem Wörterbuch resultieren.
Bei dem Vergleich mit einem Wörterbuch findet man als tatsächlich existierende
Kandidaten die beiden Leseresultatkandidaten 91, nämlich die erste Zeile
<shina<<kawa<<ku< <naka<<nobu<, und die zweite Zeile <shina<<kawa<<ku<
<nishi<<naka<<nobu<. Diese beiden Leseresultatkandidaten existieren als
tatsächliche Adreßelemente. Beim Vergleich der ersten Zeile der
Leseresultatkandidaten 91 mit Block 30 stellt man fest, daß das zweite
Schriftzeichen <kawa< nicht in der zweiten Spalte des Blocks 30 aus Fig. 2A
enthalten ist. Für die anderen Schriftzeichen der Leseresultatkette existiert ein
entsprechendes Schriftzeichen in Block 30. Aus diesem Grund wird die
Segmentposition (2, 1) für den Prüfobjektanteil festgelegt. Bei der Zeile darunter
liegt der Fall etwas anders. Hier sind das erste Schriftzeichen <shina<, das vierte
Schriftzeichen <nishi<, das fünfte Schriftzeichen <naka< und das sechste
Schriftzeichen <nobu< in dem Block 30 der Schriftzeichenkandidaten aus Fig. 2A
enthalten. Nicht enthalten sind dagegen das zweite und das dritte Schriftzeichen
des unteren Leseresultatkandidaten 91, nämlich die Schriftzeichen <kawa< und
<ku<. Es liegt also keine Entsprechung zwischen der zweiten Spalte von Block 30
und dem Leseresultatkandidaten vor. Aus diesem Grund wird bezüglich des
Leseresultatkandidaten 2 das zweite Schriftzeichen als Prüfobjektanteil festgelegt,
d. h. das Segment (2, 1) wird als Prüfobjektanteil festgelegt. Die diesem
Prüfobjektanteil entsprechende vermutete Schriftzeichenkette ist <kawa<<ku<.
Des weiteren sieht im Falle von Fig. 2B der Inhalt des Wortketten
kandidatenzwischenspeichers 6 folgendermaßen aus:
Leseresultatkandidat 1:
<shina< [Schriftzeichenkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (2, 1)]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<nishi< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<shina< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (6, 1)]
Leseresultatkandidat 2:
<shina< [Schriftzeichenkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (2, 1)]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<minami< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<shina< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (6, 1)].
Leseresultatkandidat 1:
<shina< [Schriftzeichenkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (2, 1)]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<nishi< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<shina< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (6, 1)]
Leseresultatkandidat 2:
<shina< [Schriftzeichenkandidat "liegt vor", Segment (1, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (2, 1)]
<ku< [Schriftzeichenkandidat "liegt vor", Segment (3, 1)]
<minami< [Schriftzeichenkandidat "liegt vor", Segment (4, 1)]
<shina< [Schriftzeichenkandidat "liegt vor", Segment (5, 1)]
<kawa< [Schriftzeichenkandidat "liegt vor", Segment (6, 1)].
Wird die Beurteilungsprozedur gemäß (B) für diese Kandidaten durch
geführt, so werden die folgenden Prüfobjektanteile und vermutete Schriftzeichen
ketten ermittelt:
für die Leseresultatkandidaten 1 und 2,
Prüfobjektanteil: Segment (4, 1)
vermutete Schriftzeichenkette: <nishi< und <minami<.
für die Leseresultatkandidaten 1 und 2,
Prüfobjektanteil: Segment (4, 1)
vermutete Schriftzeichenkette: <nishi< und <minami<.
Als nächstes wird ein Verfahren zur Realisierung der Prüfeinrichtung 8
beschrieben. Verschiedene Methoden zur Realisierung der Prüfeinrichtung können
entsprechend dem Bestimmungsverfahren des Prüfobjektanteils (A) oder (B) wie
oben beschrieben in Betracht gezogen werden.
Eine erste Methode zur Realisierung der Prüfeinrichtung 8 basiert auf
der Annahme, daß der Prüfobjektanteil auf die Beurteilung gemäß (A) wie oben
beschrieben festgelegt wird. Bei diesem Verfahren wird die Größe eines
Prüfobjektanteils mit der Anzahl von Schriftzeichen einer vermuteten Schrift
zeichenkette verglichen, und wenn das Vergleichsresultat nicht einer vorbestimm
ten Bedingung genügt, so wird die Möglichkeit des Vorliegens einer vermuteten
Schriftzeichenkette verneint. Hierbei besteht die "vorbestimmte Bedingung" z. B.
darin, daß die Größe oder Fläche des Prüfobjektanteils durch eine Standard
schriftzeichengröße geteilt wird, und das Resultat mit der Anzahl von
Schriftzeichen einer vermuteten Schriftzeichenkette des Prüfobjektanteils ver
glichen wird und das Vergleichsresultat (das Verhältnis) in einem Bereich von 0,5
bis 2,0 liegt. Die Standardschriftzeichengröße kann dabei vorher festgelegt
werden, oder sie kann durch Berechnung des Durchschnitts der Schrift
zeichengrößen der Schriftzeichen vor und hinter dem Prüfobjektanteil berechnet
werden, oder sie kann auch als Durchschnittswert der Größe der lesbaren
Schriftzeichen berechnet werden. Die Bedingung des obigen numerischen
Bereichs für das Vergleichsresultat ist lediglich ein Beispiel und soll somit nicht als
strenge Beschränkung verstanden werden. Es kann z. B. auch eine solche
Bedingung verwendet werden, bei der unter Berücksichtigung der Anzahl der
Schriftzeichen einer vermuteten Schriftzeichenkette beurteilt wird, ob der
Prüfobjektanteil eine angemessene Größe aufweist.
Fig. 4 zeigt einen Fall, bei dem der Leseresultatkandidat 91 mit Hilfe der
ersten Realisierungsmethode der Prüfeinrichtung 8 verworfen wird. Die zu
lesenden Bilddaten befinden sich über dem Block 30 der Fig. 4A, und sie werden
korrekt mit <shina<<kawa<<ku< <to<<go<<tan< <ta< gelesen. Der Anteil
<to<<go<<tan< kann jedoch nicht exakt in einzelne Schriftzeichen aufgetrennt
werden, da die Schriftzeichen diesen Anteils eng beieinander stehen, und somit
werden die Schriftzeichen dieses Anteils als ein einzelnes Segment erkannt. Die
Schriftzeichenkandidatenketten, welche im Block 30 von Fig. 4 dargestellt sind,
bestehen deshalb nicht aus sieben Schriftzeichen, wie die zu erkennenden
Bilddaten, sondern lediglich aus fünf Schriftzeichen.
Für den Adreß-Leseresultatkandidaten 91 aus Fig. 4, nämlich
<shina<<kawa<<ku<<yutaka<<machi< existiert kein korrekter Schriftzeichenkan
didat in dem Segment, welches <yutaka<, d. h. dem vierten Schriftzeichen des
Leseresultatkandidaten 91, entspricht. Somit wird dieses als Prüfobjektanteil 70
festgelegt. Nun hat jedoch der Prüfobjektanteil 70 eine Fläche, welche etwa drei
Schriftzeichen entspricht, während jedoch die vermutete Schriftzeichenkette
<yutaka< aus lediglich einem Schriftzeichen besteht. Dementsprechend ist das
Verhältnis 3/1 = 3, und somit erfüllt es nicht die oben beschriebene Bedingung.
Aus diesem Grund wird der Adreß-Leseresultatkandidat 91, welcher aus
<shina<<kawa<<ku<<yutaka<<machi< besteht, verworfen. Es ist hierbei wieder
anzumerken, daß der Leseresultatkandidat aus einem Vergleich mit einem
Wörterbuch resultiert, d. h. er besteht aus einem tatsächlich existierenden
Adreßanteil. Er wird jedoch aufgrund des Anwendens der oben beschriebenen
Einschränkung verworfen.
Eine zweite Realisierungsmethode der Prüfungseinrichtung 8 basiert auf
dem Fall, in dem der Prüfobjektanteil durch eine Beurteilung entsprechend dem
Verfahren (A) wie auch bei der ersten Realisierungsmethode festgelegt wird. Die
Anzahl von Strichen von Schriftzeichenkandidaten in dem Erkennungsresultat
zwischenspeicher 4, welche als Prüfobjektanteil ausgewählt werden, wird mit der
Anzahl von Strichen einer vermuteten Schriftzeichenkette verglichen, und die
Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette wird verworfen
wenn das Vergleichsresultat nicht einer vorbestimmten Bedingung genügt. Hierbei
bedeutet die "vorbestimmte Bedingung", daß die Differenz zwischen der
durchschnittlichen Anzahl von Strichen der Schriftzeichenkandidaten für das
Segment, welches dem Prüfobjektanteil entspricht, und der Anzahl von Strichen
der vermuteten Schriftzeichen 5 ist.
Des weiteren kann ein Verfahren vorgesehen werden, um ein Segment
oder eine vermutete Schriftzeichenkette von einem Prüfobjekt auszuschließen,
wenn die Anzahl von Schriftzeichen des Segments oder der vermuteten Schrift
zeichenkette nicht gleich Eins ist. Weiter kann ein Verfahren vorgesehen werden,
bei dem ein Durchschnittswert oder ein Summenwert von Strichzahlen des
Prüfobjektanteils und der vermuteten Schriftzeichenkette miteinander verglichen
werden. Auch muß nicht notwendigerweise die erlaubte Differenz 5 sein. Auch
kann man sich etwa vorstellen, daß der Vergleich in zwei Fälle aufgeteilt wird, etwa
derart, daß im ersten Falle eines der zu vergleichenden Schriftzeichen eine
Strichzahl von größer gleich 10 aufweist, im zweiten Fall die Strichzahl beider
Zeichen kleiner 10 ist, und der erlaubte Differenzwert entsprechend geändert wird.
Ferner kann man sich vorstellen, daß die Bedingung nicht auf der
durchschnittlichen Anzahl von Strichen der Schriftzeichenkandidaten des
Prüfobjektanteils basiert, sondern z. B. auf deren maximaler Anzahl von Strichen
oder der minimalen Anzahl von Strichen, oder die Bedingung könnte auch auf der
Strichzahl eines ersten Schriftzeichenkandidaten des Prüfobjektanteils basieren.
Fig. 5 zeigt einen Fall, bei dem der Leseresultatkandidat 91 mit Hilfe der
zweiten Realisierungsmethode der Prüfeinrichtung 8 verworfen wird. Die zu
erkennenden Bilddaten sind wieder über dem Block 30 angeordnet, sie werden
korrekt gelesen als <shina<<kawa<<ku<<yutaka<<machi<. Der Leseresultat
kandidat 91 von Fig. 5 wird gelesen als <shina<<kawa<<ku<<hiro<<machi<. Man
erkennt bei einem Blick auf den Block 30, welcher die Schriftzeichenkandidaten
enthält, daß für das vierte Schriftzeichen der zu erkennenden Bilddaten, nämlich
<yutaka<, kein korrekter Schriftzeichenkandidat ausgewählt wurde. Die vierte
Spalte des Blocks 30 enthält kein Schriftzeichen, welches dem vierten Schrift
zeichen <yutaka< der zu erkennenden Bilddaten entspricht. Der durch Wörter
buchvergleich ausgewählte Leseresultatkandidat lautet <shina<<kawa<<ku<
<hiro<<machi<. Für das vierte Schriftzeichen <hiro< dieses Leseresultatkandi
daten 91 findet sich im Block 30 kein entsprechender Schriftzeichenkandidat.
Dementsprechend wird als Prüfobjektanteil 70 das <hiro< entsprechende Segment
ausgewählt. Die diesem Segment entsprechenden Schriftzeichenkandidaten des
Blocks 30 <ha< (Zeile 1, Spalte 4), <shina< (Zeile 2, Spalte 4) und <shio< (Zeile 3,
Spalte 4) wurden als Schriftzeichenkandidaten für das dem Prüfobjektanteil 70
entsprechende Segment ausgewählt. Die Anzahl der Striche ist für den
Schriftzeichenkandidaten <ha< 12, für den Schriftzeichenkandidaten <shima< 10
und für den Schriftzeichenkandidaten <shio< 15 Striche. Die durchschnittliche
Anzahl ist dementsprechend 12 Striche. Andererseits ist die Strichzahl des
vermuteten Schriftzeichens <hiro< lediglich fünf Striche. Dementsprechend beträgt
die Differenz zwischen der durchschnittlichen Anzahl von Strichen der
Schriftzeichenkandidaten aus der vierten Spalte von Block 30 und dem vermuteten
Schriftzeichen 7 Striche. Diese Differenz ist größer als die vorbestimmte Anzahl
von Fünf, und somit wird der Kandidat 91 des Adreß-Leseresultats <shina<<kawa<
<ku<<hiro<<machi< verworfen.
Die eben beschriebene Methode basiert auf dem Ausführungsbeispiel,
welches lediglich die Anzahl von Strichen verwendet. Darüber hinaus kann auch
ein Komplexitätsindex ("complexity index") wie in "SIG Reports of the Institute of
Electronics, Information and Communication Engineers, PRL 73-14" beschrieben
als ein Index verwendet werden, welcher die Komplexität einer Kombination von
Strichen eines Schriftzeichens darstellt. Im Fall von Fig. 5 wird die Komplexität des
Schriftzeichenkandidaten des Segments, welches dem Prüfobjektanteil 70
entspricht, ebenfalls gleichzeitig mit der Überprüfung der Differenz der
Gesamtstrichzahl berechnet, um so zu beurteilen, ob der berechnete Kom
plexitätswert nahe bei dem Komplexitätswerts des vermuteten Schriftzeichens liegt.
Die abschließende Beurteilung wird auf der Basis einer Kombination der eben
erwähnten Komplexitätsbeurteilung und dem Vergleichsresultat der Gesamtstrich
zahl durchgeführt.
Die Komplexität wird sowohl in vertikaler als auch in horizontaler
Richtung der Schriftzeichen berechnet. Deshalb kann, selbst wenn die Differenz in
der Anzahl von Strichen zwischen dem vermuteten Schriftzeichen und den
Schriftzeichenkandidaten als nicht signifikant beurteilt wird, eine detailliertere
Beurteilung auf der Basis der Komplexität der Striche in vertikaler Richtung und
der Komplexität der Striche in horizontaler Richtung durchgeführt werden. So sei
z. B. das vermutete Schriftzeichen <kawa< und der Schriftzeichenkandidat des
Segments <san< (siehe Fig. 1 B, <kawa< steht in Zeile 4, Spalte 1 des ersten Blatts
von Fig. 1B, <san< steht in Zeile 11, Spalte 2 des ersten Blatts von Fig. 1B). Die
Anzahl von Strichen sowohl des vermuteten Schriftzeichens <kawa< und des
Schriftzeichenkandidats des Segments <san< ist 3, und somit besteht keine
Differenz in der Anzahl von Strichen. Der Komplexitätsindex von <kawa< ist jedoch
in horizontaler Richtung ungefähr Vier und in vertikaler Richtung ungefähr Eins.
<kawa< besteht näherungsweise aus drei vertikalen Strichen. Der Komplexitäts
index von <san< ist etwa gleich Eins in horizontaler Richtung und in etwa gleich
Vier in vertikaler Richtung, <san< besteht näherungsweise aus drei vertikalen
Strichen. Somit weisen bezüglich des Komplexitätsindex in horizontaler und
vertikaler Richtung die beiden Schriftzeichen vollständig gegensätzliche
Tendenzen auf. Entsprechend kann mit Hilfe dieses Resultats das vermutete
Schriftzeichen als ein nicht angemessenes Leseresultat beurteilt werden, und ein
Adreß-Leseresultatkandidat, welcher das vermutete Schriftzeichen <kawa< enthält
wird aus all den Leseresultatkandidaten verworfen. Bei diesem eben beschriebe
nen Ausführungsbeispiel wird die Berechnung der Komplexität des Schrift
zeichenkandidaten des Segments für den ersten Schriftzeichenkandidaten
durchgeführt, man kann sich jedoch auch vorstellen, daß ein Durchschnittswert von
Komplexitätsindizes verwendet wird, welcher auch nachfolgende Schriftzeichen
kandidaten mit einbezieht.
Wie die erste und zweite Realisierungsmethode basiert auch eine dritte
Realisierungsmethode der Prüfeinrichtung 8 darauf, daß ein Prüfobjektanteil durch
eine Beurteilung gemäß Verfahren (A) bestimmt wird. Ist die Anzahl von Segmen
ten im Erkennungsresultatzwischenspeicher 4, welche einem Prüfobjektanteil
entspricht, gleich der Anzahl von Schriftzeichen einer vermuteten Schriftzeichen
kette, so wird die individuelle Schriftzeichenerkennung der Segmente, die der
vermuteten Schriftzeichenkette entsprechen, erneut durchgeführt, unter Verwen
dung einer individuellen Schriftzeichenerkennungseinrichtung, welche sich von der
Ausschneide-Erkennungseinrichtung 3 unterscheidet. Wenn ein Schriftzeichen
kandidat, der durch den erneuten Versuch erhalten wird, mit der vermuteten
Schriftzeichenkette übereinstimmt, so wird das Vorliegen der vermuteten
Schriftzeichenkette als wahr angenommen. Wenn die Anzahl von Segmenten in
dem Prüfobjektanteil mit der Anzahl von Schriftzeichen der vermuteten Schrift
zeichenkette übereinstimmt, so wird angenommen, daß die Segmentunterteilung
korrekt ist, und lediglich die Schriftzeichenerkennung für jedes Segment des
Prüfobjektanteils wird erneut durchgeführt. In diesem Fall wird lediglich ein
Standardschriftzeichenmustersatz für Vergleichszwecke ausgetauscht und ein Teil
der Verarbeitung der Ausschneide-Erkennungsvorrichtung 3 kann verwendet
werden. Um einen Unterschied zwischen dem Fall, in dem die Ausschneide-Erken
nungseinrichtung 3 verwendet wird, und dem Fall, in dem die individuelle
Schriftzeichenerkennung verwendet wird, zu erzielen, kann ein anderes
Erkennungswörterbuch, in dem z. B. ein Standardschriftzeichenmustersatz, welcher
eine Neigung der Schriftzeichen (Kursivschrift) enthält, verwendet werden. Es
könnte auch ein Standardschriftzeichenmustersatz verwendet werden, bei dem
z. B. ein anderer Font verwendet wird.
Bei dem Kandidaten 91 des Adreß-Leseresultats von <shina<<kawa<
<ku<<naka<<nobu< aus Fig. 2A existiert für das <kawa< entsprechende Segment
kein geeigneter Schriftzeichenkandidat, und somit wird dieses Segment als
Prüfobjektanteil festgelegt. Taucht bei Verwendung der dritten Realisierungs
methode der Prüfeinrichtung 8 <kawa< als ein Schriftzeichenkandidat neu auf, so
können alle Schriftzeichen von <shina<<kawa<<ku<<naka<<nobu< als korrekt
gelesen betrachtet werden.
Wie die erste, zweite und dritte Realisierungsmethode basiert auch eine
vierte Realisierungsmethode der Prüfeinrichtung 8 darauf, daß der Prüfobjektanteil
durch eine Beurteilung gemäß (A) festgelegt wird. Wenn die Anzahl von
Segmenten in dem Erkennungsresultatzwischenspeicher 4, welche als Prüfobjekt
anteil ermittelt werden, nicht mit der Anzahl von Schriftzeichen der vermuteten
Schriftzeichenkette übereinstimmt, so wird die Ausschneideoperation der
Segmente aus den Bilddaten für eine Fläche, welche dem Prüfobjektanteil
entspricht, erneut durchgeführt, wobei die Form der vermuteten Schriftzeichenkette
oder die Anzahl von Schriftzeichen in dieser berücksichtigt werden, und die
individuelle Erkennung wird für jedes Segment durchgeführt. Wenn der
Schriftzeichenkandidat des Schriftzeichenerkennungsresultats mit der vermuteten
Schriftzeichenkette übereinstimmt, so wird das Vorliegen der vermuteten
Schriftzeichenkette angenommen. In diesem Fall wird die gleiche Verarbeitung wie
sie von der Ausschneide-Erkennungseinrichtung 3 durchgeführt wird, für den
Prüfobjektanteil erneut durchgeführt. Da zu diesem Zeitpunkt die Anzahl der
Schriftzeichen der vermuteten Schriftzeichenkette bekannt ist, wird die
Ausschneideoperation so durchgeführt, daß die Anzahl von Segmenten mit der
Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette übereinstimmt, da ja
die Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette bekannt ist. Um
die Anzahl von Segmenten mit einer gegebenen Anzahl in Übereinstimmung zu
bringen, können die Teilungspunkte der Segmente der Kandidatenpositionen so
gewählt werden, daß die Teilungspunkte ausgehend von den Orten größter
Wahrscheinlichkeit des Vorliegens von Teilungspunkten hin bis zum Vorliegen der
vorbestimmten Anzahl von Segmenten ausgewählt werden.
Dabei kann auch berücksichtigt werden, daß nicht nur einfach die
Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette mit der Anzahl der
Teilungssegmente in Übereinstimmung gebracht wird, sondern daß auch die
Teilungspunkte so gesetzt werden, daß die Form der vermuteten Schrift
zeichenkette berücksichtigt wird. Als Beispiel wird unter Bezugnahme auf Fig. 13
ein einzelnes vertikal geschriebenes Segment, welches <to<<kyo< als eine
vermutete Schriftzeichenkette enthält, aufgeteilt. Das in Fig. 13 dargestellte
Segment enthält die beiden Schriftzeichen <to< und <kyo<, welche man wieder in
ihrer Reinform in Fig. 1B findet. <to< ist dabei das oberste Zeichen der zweiten
Spalte von Fig. 1 B, <kyo< ist das oberste Zeichen der dritten Spalte von Fig. 1B.
Vergleicht man diese beiden Zeichen aus Fig. 1B mit dem in Fig. 13 dargestellten
Segment, so erkennt man, daß die Grenze zwischen <to< und <kyo< verwischt ist.
Es scheint, als gehörten die beiden obersten Striche des Zeichens <kyo< noch
zum Zeichen <to<. Dieser obere Bestandteil des Zeichens <kyo<, welcher hier
scheinbar zum Zeichen <to< gehört, ist ein Bestandteil, welcher häufig in
chinesischen Schriftzeichen vorkommt. Er wird mit einem eigenen Namen, nämlich
mit »nabebuta« bezeichnet. Nachfolgend wird bezugnehmend auf Fig. 13 die
vermutete Schriftzeichenkette, die <to<<kyo< als ein einzelnes Segment enthält,
aufgeteilt.
Dabei ist es angemessen, den Teilungspunkt so zu setzen, daß er in
vertikaler Richtung im Zentrum liegt. Unangemessen ist es, die Schriftzeichen an
einer Lückenposition zu unterteilen, welche wahrscheinlich unterhalb des
"nabebuta", d. h. des oberen Teils von <kyo< liegt, da sonst der obere Teil von
<kyo< als zu <to< zugehörig beurteilt würde. Wenn als allgemeine Methode für die
Unterteilung ein Schatten (eine Projektion) eines Musters, d. h. Kumulationswert
oder Histogrammwert von schwarzen Bildelementen, in einer bestimmten Richtung
für jedes Bildelement in einem Bild des Prüfobjektanteils aufgenommen wird, so
daß ein Histogramm wie in Fig. 13 dargestellt entsteht, und wenn im allgemeinen
die Schriftzeichenkette an einer Stelle unterteilt wird, an der keine
Schattenkomponente oder Projektionskomponente existiert, so wird die Stelle unter
dem "nabebuta" als Teilungspunkt gesetzt, und somit wird die
Ausschneideoperation nicht korrekt durchgeführt. Wenn jedoch angenommen wird
daß <to<<kyo< sich miteinander in Kontakt befinden, so gibt es viele Fälle, bei
denen der Strich, der sich im Zentrum von <to< befindet und sich in vertikaler
Richtung erstreckt, mit dem "nabebuta" des Schriftzeichens <kyo< in Kontakt
kommt. Deshalb kann, falls das Muster des Kontakts gespeichert wird, der
Teilungspunkt auf der Basis dieses gespeicherten Kontaktmusters exakt bestimmt
werden. Diese Beurteilung unter Verwendung des Kontaktmusters ist nicht auf
<to<<kyo< beschränkt. Es gibt viele Fälle, bei denen der Strich eines ersten
Schriftzeichens mit dem eines zweiten Schriftzeichens in Kontakt gerät, und somit
können individuelle Kontaktmuster von Fall zu Fall gespeichert werden, wenn
Schriftzeichen miteinander in Kontakt kommen.
Eine Methode zur Speicherung von Kontaktmustern wird in Fig. 14
gezeigt. Ein Teil, für den der Schriftzeichenkontakt auftritt, wie etwa das Zentrum
das untere Ende, das rechte Ende etc., wird im voraus als Merkmal des
Teilungspunkts registriert. Dies geschieht in Abhängigkeit davon, ob die
Schriftzeichen von links nach rechts (horizontal) oder von oben nach unten
(vertikal) aneinandergereiht werden. Beides ist bei chinesischen Schriftzeichen
möglich. Je nach Schreibweise, ob horizontal oder vertikal, sind die Kontaktstellen
der Kandidaten unterschiedlich. Für die Kandidaten in Zeile vier und Zeile fünf gilt
z. B., daß die Kontaktposition bei vertikaler Schreibweise am rechten Ende des
linken Schriftzeichens liegt (Zeile vier), bei horizontaler Schreibweise (Zeile fünf)
jedoch in der Mitte des linken Schriftzeichens. Mit Hilfe dieser Registrierung kann
zwischen horizontaler und vertikaler Schreibweise unterschieden werden, und
Teilungspunkte, welche mit einer vermuteten Schriftzeichenkette in Überein
stimmung gebracht werden, können erhalten werden.
Um in korrekter Weise einen Teilungspunkt überhalb des "nabebuta"
des Schriftzeichens <kyo< von dem einem Prüfobjektanteil entsprechenden
Muster, welches als <to< <kyo< vermutet wird, zu erhalten, wird ein Anteil, in dem
der Teilungspunkt enthalten ist, auf der Basis eines Wörterbuchs von Teilungs
punkten von Strichen wie in Fig. 14 gezeigt überprüft. Im vorliegenden Fall wird
der Teilungspunkt als im zentralen Teil des Schriftzeichens befindlich betrachtet.
Daraufhin wird, wenn der Teilungspunkt im Zentralbereich zu ermitteln ist, ein
Prüfobjektgebiet wie in Fig. 15 gezeigt in eine Streifenform in Richtung der
Schriftzeichenkette unterteilt, und Schattenkomponenten werden für ein schmales
rechteckiges Gebiet (einer der Streifen) im Zentralbereich erneut ermittelt, und ein
Anteil, bei dem die Schattenkomponente schnell anwächst, wird als der dem
breiten vertikalen Strich des "nabebuta" des Schriftzeichens <kyo< entsprechende
Anteil beurteilt. Deshalb wird der Teilungspunkt an eine Position gesetzt, welche
leicht oberhalb der "nabebuta" - Position liegt, d. h. so, daß auch der kleine
Vertikalstrich des "nabebuta" - Anteils auch noch zum Schriftzeichen <kyo< gehört.
Das oben beschriebene Ausführungsbeispiel verwendet ein Wörter
buch, in dem Orte, an denen ein Schriftzeichenkontakt auftritt, für jede Schrift
zeichenkandidatenkette registriert sind, es kann jedoch auch nur ein erstes
Schriftzeichen der Schriftzeichenkandidaten einer Schriftzeichenkandidatenkette
auf der Liste registriert sein.
Eine fünfte Realisierungsmethode der Prüfeinrichtung 8 basiert darauf,
daß der Prüfobjektanteil durch eine Beurteilung gemäß dem Verfahren (B), das
weiter oben beschrieben wurde, bestimmt wird. Unter Verwendung einer indivi
duellen Schriftzeichenerkennungseinrichtung, welche sich von der Ausschneide-
Erkennungseinrichtung 3 unterscheidet, wird die individuelle Schriftzeichener
kennung von Segmenten, welche einer vermuteten Schriftzeichenkette entspre
chen, erneut durchgeführt, und das Vorliegen der vermuteten Schriftzeichenkette
wird angenommen, wenn die Zuverlässigkeit eines durch erneuten Versuch
erhaltenen Schriftzeichenkandidaten einer vorbestimmten Bedingung genügt. Das
Erfüllen einer vorbestimmten Bedingung meint einen Fall, bei dem ein Grenzwert
von Zuverlässigkeit, welcher auf einen bestimmten Wert festgelegt wird,
überschritten wird, einen Fall, in dem eine große Differenz an Zuverlässigkeit für
einem nachgeordneten Schriftzeichenkandidaten vorliegt, oder ähnliches.
Um einen Unterschied zwischen der Verwendung der Ausschneide-
Erkennungseinrichtung 3 und dem Fall des Verwendens der individuellen Schrift
zeichenerkennungseinrichtung zu erzielen, kann diese zum Beispiel ein unter
schiedliches Erkennungswörterbuch verwenden, in dem ein Standardschrift
zeichenmustersatz enthalten ist, welcher um ein zusätzliches Merkmal, wie etwa
eine seitliche Neigung (Kursivschrift) erweitert ist, oder einen Standardschrift
zeichenmustersatz, in dem ein Merkmal wie etwa ein Font variiert ist, wie auch bei
der dritten Realisierungsmethode der Prüfeinrichtung 8. Wenn die Bestimmung
des Prüfobjektanteils basierend auf der Beurteilung gemäß (B) durchgeführt wird
treten darüberhinaus viele Fälle auf, bei denen die Schriftzeichen, welche einander
relativ stark ähneln, wie etwa <minami< und <nishi<, <to< und <hon<, etc. als
teilweise unterschiedliche Schriftzeichen ausgewählt werden. Es wird hier wieder
auf Fig. 1B verwiesen, aus der man erkennt, daß sich die Schriftzeichen
<minami< und <nishi< relativ stark ähneln, so wie, daß sich die Schriftzeichen <to<
und <hon< relativ stark ähneln. Deshalb kann zum Beispiel eine individuelle
Erkennungseinrichtung verwendet werden, um lediglich die Unterscheidung dieser
Schriftzeichen mit hoher Präzision durchzuführen. Zum Beispiel werden lediglich
die Arten von Schriftzeichen, welche ähnliche Schriftzeichenpaare bilden,
ausgewählt, um ein Erkennungswörterbuch zu bilden, in dem Variationen von
Deformationen dieser Schriftzeichen in möglichst großer Zahl gespeichert sind,
und ein Vergleich mit diesem Erkennungswörterbuch wird mit einer relativ strengen
Erkennungsbedingung durchgeführt. Darüberhinaus kann zum Beispiel eine
Schriftzeichenerkennung durchgeführt werden, während die Größe oder die
Neigung des Musters eines Prüfobjektanteils variiert wird.
Das Lesegerät für Schriftzeichenketten aus Fig. 3 kann zum Beispiel
auch so gesteuert werden, daß in einer ersten Stufe nicht alle
Schriftzeichenkandidaten in einer Anfangsstufe von der Wortsucheinrichtung 5
verwendet werden. Das heißt, in einer ersten Stufe werden lediglich höherrangige
Kandidaten von all den Schriftzeichenkandidaten verwendet, um den
Wortsuchprozeß mit der Wortsucheinrichtung 5 durchzuführen, und wenn die
Prüfeinrichtung 8 ihre Arbeit ausführt, werden auch niederrangige Kandidaten der
Schriftzeichenkandidaten verwendet.
In einem solchen Fall wird in der Prüfanteilbestimmungseinrichtung 7
das folgende Verfahren (C) angewendet, welches sich von den Verfahren (A) und
(B) zur Bestimmung des Prüfobjektanteils unterscheidet.
C) Bezüglich eines Wortkettenkandidaten (Leseresultatkandidat) wird
ein Anteil als Prüfobjektanteil festgelegt, bei dem ein Schriftzeichenkandidat,
welcher einem Schriftzeichen entspricht, das den Wortkettenkandidaten bildet,
nicht höherrangig ist. In diesem Fall wird die Schriftzeichenkette des Anteils als
vermutete Schriftzeichenkette festgelegt.
Im Falle von Fig. 2A wird für den Kandidaten 91 des Adress-Lese
resultats <shina<<kawa<<ku<<naka<<nobu< der Anteil <kawa< als Prüfobjekt
anteil gemäß Methode (A) gesetzt. Nehmen wir hier an, daß zu den höherrangigen
Kandidaten die Kandidaten zählen, die in der ersten oder zweiten Zeile auf
tauchen, so wird der Anteil <naka<, welcher in der dritten Zeile der vierten Spalte
auftaucht, ebenfalls als Prüfobjektanteil festgelegt.
Als eine sechste Realisierungsmethode der Prüfeinrichtung 8 wird in
diesem Fall das Vorliegen einer vermuteten Schriftzeichenkette dann angenom
men, wenn einer der niederrangigen Schriftzeichenkandidaten im Erkennungs
resultatzwischenspeicher 4, welcher dem Prüfobjektanteil entspricht, mit einer
vermuteten Schriftzeichenkette übereinstimmt. Diese Prüfmethode hat für <naka<
aus Fig. 2A Erfolg.
Desweiteren wird die Wortsucheinrichtung 5 wie in den Druckschriften 1
bis 13 beschrieben realisiert durch das Erzeugen einer Kombination von Schrift
zeichenkandidaten im Erkennungsresultatzwischenspeicher 4, um zu suchen, ob
die Kombinationen im Wörterbuch vorliegen, oder durch ein Verfahren, bei dem
gesucht wird, ob ein aus dem Wörterbuch gelesenes Wort als eine Kombination
von Schriftzeichenkandidaten in den Schriftzeichenkandidatenketten im Erken
nungsresultatzwischenspeicher 4 gefunden werden kann. Eine in Fig. 6 gezeigte
Methode kann als eine Realisierungsmethode, die sich von den oben erwähnten
Methoden unterscheidet, verwendet werden.
Die in Fig. 6 gezeigt Wortsucheinrichtung 5 umfaßt die folgenden
Elemente.
Ein Markierungswörterbuchspeicher 50 dient dazu, für jedes Schrift
zeichen Informationen über zumindest drei Bestandteile zu speichern, und zwar
"das Wort U, welches das Schriftzeichen enthält, die Schriftzeichenkettenlänge L
von U, und die Position P des Schriftzeichens in U". Für einen Schriftzeichen
kandidaten im Erkennungsresultatzwischenspeicher 4 sucht eine Markierungser
zeugungseinrichtung 51 die dreiteilige Information, welche dem Schriftzeichenkan
didaten aus dem Markierungswörterbuchspeicher 50 entspricht. Ein Markierungs
informationszwischenspeicher 52 speichert das Resultat der Markierungserzeu
gungseinrichtung 51. Ein Wortverbindungs-Einschränkungsspeicher 53 beschreibt
eine Verbindungseinschränkung zwischen Worten. Eine Markierungsketten-
Sucheinrichtung 54 verbindet zwei dreiteilige Informationen [U1, L1, P1] und [U2,
L2, P2] in dem Markierungsinformationszwischenspeicher 52 durch Verwendung
der Positionsbeziehung der Segmente, welche der dreiteiligen Information und der
Beziehung zwischen U1, L1, P1, U2, L2, P2 entsprechen, um dadurch den
Wortkettenkandidaten an den Wortkettenkandidatenzwischenspeicher 6
auszugeben, der einer Kombination von Schriftzeichenkandidaten im
Erkennungsresultatzwischenspeicher 4 entspricht. Der Markierungswörterbuch
speicher 50, der Markierungsinformationszwischenspeicher 52 und der
Wortverbindungs-Einschränkungsspeicher 53 werden durch eine
Speichereinrichtung wie zum Beispiel einen IC-Speicher, eine Magnetplatte, oder
ähnliches realisiert. Die Markierungserzeugungseinrichtung 51 und die
Markierungskettensucheinrichtung 54 werden durch die Zentraleinheit (CPU) eines
Computers oder durch einen speziell dafür vorgesehenen Schaltkreis realisiert.
Wenn Adressen, die auf Briefen oder Formularen geschrieben werden,
gelesen werden, wird eine höherrangig-niederrangig-Beziehung von Adressen,
welche durch eine hierarchische Struktur wie in Fig. 10 gezeigt repräsentiert wird,
in dem Wortverbindungs-Einschränkungsspeicher 50 gespeichert. Dies heißt, daß
für eine Adressenstruktur <shina<<kawa<<ku< aus Fig. 10, <shina<<kawa<<ku<
niederrangiger ist als <to<<kyo<<miyako<, und daß andere Namen von Stadt
bezirken wie etwa <e<<hara<, <hata<<no<<dai<, etc. noch niederrangiger sind als
<shina<<kawa<<ku<. Hierbei ist anzumerken, daß <to<<kyo<<miyako< den
Namen der Stadt angibt, <shina<<kawa<<ku< den Namen des Bezirks, und
<e<<hara< oder <hata<<no<<dai< die Namen von Unterbezirken sind. Im Falle
von Adressen wird die grundlegende höherrangig-niederrangig-Beziehung in der
Reihenfolge des Namens der Stadt, des Bezirks, und der Unterbezirke realisiert. In
Japan sind dies z. B. "To, Do, Fu und Präfekturen". Es kann auch Fälle geben, in
denen die Unterbezirke wiederum in Unter-Unterbezirke unterteilt sind. Im Falle
von Adressen dient die höherrangig-niederrangig-Beziehung von Adreßelementen
direkt als Einschränkung für die Anordnung von Adreßelementen. Das heißt, die
Adressen sind von einem höherrangigen Adreßelement zu einem niederrangigen
Adreßelement hingeordnet. Ein analoges Ordnungssystem für eine deutsche
Adresse bestünde in "Stadt-Straße-Hausnummer".
Im Falle von Fig. 10 wird also die Anordnung (<to<<kyo<<miyako<) -
(<shina<<kawa<<ku<) - (<naka<<nobu<) gestattet, eine Anordnung wie etwa
(<to<<kyo<<miyako<) - (<naka<<nobu<) oder (<naka<<nobu<) - (<hata<<no<
<dai<) wird nicht gestattet, da diese keine sinnvolle Aneinanderreihung von Stadt-
Bezirk-Unterbezirk ergeben. Eine Realisierungmethode der Verbindungsein
schränkung wie oben beschrieben besteht etwa darin, daß das Gestatten oder
Nichtgestatten der Verbindung von allen Kombinationen von zwei Adreßelementen
beschrieben wird, oder in einem Verfahren des Auflistens von Adreßelementen,
welche direkt vor oder nach ein Adreßelement angefügt werden können. Wenn
eine Schriftzeichenkette eines allgemeinen Dokuments gelesen wird, wird das
Gestatten oder Nichtgestatten der Verbindung von Worten nicht auf der Basis
einer hierarchischen Struktur wie für Adressen beschrieben, sondern auf der Basis
einer grammatikalischen Wortanordnung und deren Regeln durchgeführt.
Der Markierungswörterbuchspeicher 50 speichert dreiteilige Informa
tionen, und zwar "Schriftzeichenkette U von Worten, die Schriftzeichenkettenlänge
L von U, und die Position P eines Schriftzeichens in U", für jedes Schriftzeichen,
welches Worte bildet, die in einem Leseobjekt auftreten. Fig. 11 zeigt ein Beispiel
des Inhalts des Markierungswörterbuchspeichers 50 für eine solche
Adreßelementengruppe, wie sie in Fig. 10 gezeigt ist. In Fig. 11 repräsentiert
ein Schlüsselschriftzeichen 40 links von dem Doppelpunkt [:] jedes Schrift
zeichen, das in einem Adreßelement auftaucht, und auf der rechten Seite ist die
entsprechende dreiteilige Information angeordnet. Die dreiteilige Information
besteht zum Beispiel daraus, daß das Schriftzeichen <e< das erste Schriftzeichen
von zwei Schriftzeichen eines Adreßelements (<e<<hara<) ist, wenn die dreiteilige
Information aus [<e<<hara<, 2, 1] besteht, und dem Schriftzeichen <e< entspricht.
Da es einige Fälle gibt, in denen ein Schriftzeichen in verschiedenen Adreß
elementen auftritt, zum Beispiel, wenn <nobu< in (<nishi<<naka<<nobu<, 3, 3], in
[<naka<<nobu<, 2, 2], und in [<to<<naka<<nobu<, 3, 3] auftritt, ist das Schrift
zeichen <nobu< das dritte Schriftzeichen von dreien des Adreßelements
[<nishi<<naka<<nobu<], oder das zweite Schriftzeichen von zwei Schriftzeichen
des Adreßelements [<naka<<nobu<], oder das dritte Schriftzeichen von drei
Schriftzeichen des Adreßelements [<to<<naka<<nobu<]. Das Adreßelement (Wort)
U in der dreiteiligen Information wird in Fig. 11 durch eine Schriftzeichenkette
dargestellt, es kann jedoch auch anstelle von durch eine Schriftzeichenkette durch
einen Codewert, welcher dem Adreßelement (Wort) entspricht, dargestellt werden.
Die Markierungserzeugungseinrichtung 51 sucht den Markierungs
wörterbuchspeicher 50 für jedes in dem Erkennungsresultatzwischenspeicher 4
gespeicherte Segment ab, indem jeder der Schriftzeichenkandidaten, welcher dem
Segment entspricht, als ein Schlüssel verwendet wird. Wenn ein geeignetes
Schriftzeichen in dem Schlüsselschriftzeichen 40 des Markierungswörterbuch
speichers 50 existiert, so wird die dreiteilige Information, welche dem Schrift
zeichen entspricht, ausgelesen und dann in den Markierungsinformations
zwischenspeicher 52 geschrieben. Fig. 12 zeigt ein Beispiel eines in den
Markierungsinformationszwischenspeicher 52 geschriebenen Resultats, wenn der
in Fig. 11 gezeigte Markierungswörterbuchspeicher 50 nach der in Fig. 1A
gezeigten Schriftzeichenkandidatenkette abgesucht wird.
Die folgenden Verfahren können verwendet werden, um zwei dreiteilige
Informationen in dem Markierungsinformationszwischenspeicher 52 miteinander zu
verbinden und um einen Kandidaten für ein Leseresultat in der Markierungsketten
sucheinrichtung 54 zu ermitteln.
Gemäß einer ersten Realisierungsmethode der Markierungsketten
sucheinrichtung 54 werden die nachfolgenden Bedingungen für zwei dreiteilige
Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformations
zwischenspeicher 6 gesetzt:
Bedingung 2a: Das [U1, L1, P1] entsprechende Segment ist vor dem [U2, L2, P2] entsprechenden Segment angeordnet;
Bedingung 2b: U1 = U2 und P1 < P2; und
Bedingung 2c: U1 kann vor U2 existieren.
Bedingung 2a: Das [U1, L1, P1] entsprechende Segment ist vor dem [U2, L2, P2] entsprechenden Segment angeordnet;
Bedingung 2b: U1 = U2 und P1 < P2; und
Bedingung 2c: U1 kann vor U2 existieren.
In diesem Falle wird, wenn die Bedingung 2a und die Bedingung 2b
oder 2c erfüllt sind, [U2, L2, P2] nachfolgend mit [U1, L1, P1] verbunden, um alle
möglichen Kombinationen zu bilden, und dann wird die Kostenfunktion für jede
Kombination berechnet, um die beste Kombination (oder höherrangige Kom
bination) auszuwählen.
Fig. 7 zeigt einen Fall, in dem die Markierungsverbindung auf der
Basis des Markierungsinformationszwischenspeichers 52 wie in Fig. 12 gezeigt
gemäß der ersten Realisierungsmethode wie oben beschrieben durchgeführt wird.
In Fig. 7 werden zwei Markierungen (dreiteilige Informationen, die in dem
Markierungsinformationszwischenspeicher 52 gespeichert sind) und für die
Bedingung 2a und die Bedingung 2b oder Bedingung 2c erfüllt sind, miteinander
durch eine durchgezogene Linie verbunden. Zum Beispiel wird die Markierung
[<shina<<kawa<<ku<, 3, 2] von einem Segment (2, 1) mit der Markierung
[<shina<<kawa<<ku<, 3, 3] eines Segments (3, 1) verbunden, und die Bedin
gungen 2a und 2b sind zwischen diesen beiden Markierungen erfüllt. Die Erfüllung
der Bedingung 2a basiert auf der Tatsache, daß die Endposition 2 des Segments
(2, 1) vor der Kopfposition des Segments (3, 1) angeordnet ist. Die Erfüllung der
Bedingung 2b basiert auf der Tatsache, daß U1 = U2 = [<shina<<kawa<<ku<], und
daß P1 = 2 < P2 = 3. Die Markierung [<shina<<kawa<<ku<, 3, 2] des Segments (2,
1) und die Markierung [<hira<<tsuka<, 2, 1] des Segments (4, 1) werden
miteinander verbunden, da die Bedingung 2a und die Bedingung 2c erfüllt sind. Da
U1 = [<shina<<kawa<<ku<] ein höherrangiges Adreßelement als U2 = [<hira<
<tsuka<] ist, wird festgestellt, daß die Bedingung 2c erfüllt ist.
Bei der ersten Realisierungsmethode der Markierungskettensuch
einrichtung wie oben beschrieben werden alle Markierungsverbindungen, welche
durch durchgezogene Linien in Fig. 7 dargestellt sind, gebildet, und dann wird die
Kostenberechnung für die Kombinationen davon ausgeführt, um die Kombination
mit der besten Kostenfunktion (höherrangige Kombination) auszuwählen.
Gemäß einer zweiten Realisierungsmethode der Markierungsketten
sucheinrichtung 54 werden die folgenden Bedingungen für zwei dreiteilige
Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungsinformations
zwischenspeicher 52 gesetzt:
Bedingung 3a: Das [U1, L1, P1] entsprechende Segment liegt neben und direkt vor dem Segment [U2, L2, P2];
Bedingung 3b: Die Bedingung 3a ist nicht erfüllt, das Segment [U1, L1, P1] liegt jedoch vor dem Segment [U2, L2, P2];
Bedingung 3c: U1 = U2 und P1 + 1 = P2;
Bedingung 3d: U1 = U2 und P1 + 1 < P2;
Bedingung 3e: U1 kann direkt vor U2 existieren, und P1 = L1 und P2 = 1; und
Bedingung 3f: Die Bedingung 3e ist nicht erfüllt, U1 kann jedoch vor U2 existieren.
Bedingung 3a: Das [U1, L1, P1] entsprechende Segment liegt neben und direkt vor dem Segment [U2, L2, P2];
Bedingung 3b: Die Bedingung 3a ist nicht erfüllt, das Segment [U1, L1, P1] liegt jedoch vor dem Segment [U2, L2, P2];
Bedingung 3c: U1 = U2 und P1 + 1 = P2;
Bedingung 3d: U1 = U2 und P1 + 1 < P2;
Bedingung 3e: U1 kann direkt vor U2 existieren, und P1 = L1 und P2 = 1; und
Bedingung 3f: Die Bedingung 3e ist nicht erfüllt, U1 kann jedoch vor U2 existieren.
In diesem Fall wird, wenn die Bedingung 3a und die Bedingung 3c oder
3e erfüllt sind, [U2, L2, P2] nachfolgend mit [U1, L1, P1] verbunden, um
Kombinationen zu bilden und um die Kostenfunktion von jeder Kombination zu
berechnen. Wenn keine Kombination erhalten wird, für die die Kostenfunktion nicht
höher als der Grenzwert liegt, werden neue Kombinationen durch weiteres Ver
binden von [U1, L1, P1] und [U2, L2, P2] gebildet, bei denen die Bedingung 3b und
die Bedingung 3d oder die Bedingung 3f erfüllt sind, und dann wird die Kostenbe
rechnung erneut durchgeführt, um die Kombination mit der besten Kostenfunktion
(höherrangige Kombination) zu berechnen.
Fig. 8 zeigt einen Fall, in dem die Markierungsverbindung gemäß der
zweiten Realisierungsmethode auf der Basis des Markierungsinformations
zwischenspeichers 52 wie in Fig. 6 gezeigt durchgeführt wird. In Fig. 8 werden
zwei Markierungen, bei denen die Bedingung 3a und die Bedingung 3c oder die
Bedingung 3e erfüllt sind, miteinander durch eine durchgezogene Linie verbunden.
Zum Beispiel sind die Bedingung 3a und die Bedingung 3c zwischen der Mar
kierung [<nishi<<naka<<nobu<, 3, 1] eines Segments (3, 1) und der Markierung
[<nishi<<naka<<nobu<, 3, 2] eines Segments (4, 1) erfüllt. Die Erfüllung der Bedin
gung 3a basiert auf der Tatsache, daß die Endposition 3 des Segments (3, 1) direkt
vor der Kopfposition 4 des Segment (4, 1) liegt. Die Erfüllung der Bedingung 3c
basiert auf der Tatsache, daß U1 = U2 = [<nishi<<naka<<nobu<], und daß
P1 + 1 = 1 + 1 = 2 = P2. Darüber hinaus sind die Bedingung 3a und die Bedingung
3e zwischen der Markierung [<shina<<kawa<<ku<, 3, 3] des Segments (3, 1) und
der Markierung [<naka<<nobu<, 2, 1] des Segments (4,1) erfüllt. Da U1 =
[<shina<<kawa<<ku<] ein um einen Schritt höherrangigeres Adreßelement als
U2 = [<naka<<nobu<] ist, kann U1 direkt vor U2 existieren, und P1 = L1 = 3, so
daß festgestellt wird, daß die Bedingung 3e erfüllt ist. Andererseits werden Mar
kierungen, welche die Bedingung 3b und die Bedingung 3d oder die Bedingung 3f
erfüllen, mit einer gestrichelten Linie verbunden. Die Markierungsverbindungen,
welche durch gestrichelte Linien in Fig. 8 dargestellt sind, entsprechen den
restlichen Markierungsverbindungen, welche erhalten werden, indem man die in
Fig. 8 gezeigten Markierungsverbindungen von den mit durchgezogenen Linien
dargestellten Markierungsverbindungen in Fig. 7 abzieht.
Gemäß einer zweiten Realisierungsmethode der Markierungsketten
sucheinrichtung 54 werden lediglich Markierungsverbindungen, die durch durchge
zogene Linien in Fig. 8 dargestellt sind, gebildet, und die Kostenberechnung wird
für diese Kombinationen durchgeführt. Wenn eine Kombination von Markierungs
verbindungen erhalten wird, welche einen besseren Kostenwert als der Grenzwert
aufweist, so werden die Markierungsverbindungen wie sie in Fig. 8 mit
gestrichelten Linien dargestellt sind nicht gebildet. Andererseits werden, wenn
keine Kombinationen mit einem besseren Kostenwert als der Grenzwert erhalten
werden, auch die Markierungsverbindungen, die mit gestrichelten Linien
dargestellt sind, gebildet, und dann wird eine Kombination (oder höherrangige
Kombination), welche den besten Kostenwert aufweist, ausgewählt.
Gemäß einer dritten Realisierungsmethode der Markierungskettensuch
einrichtung 54 werden von einer Vorderseite zu einer Rückseite in der entspre
chenden Segmentposition der dreiteiligen Information in dem Markierungsinforma
tionszwischenspeicher 52 die folgenden Bedingungen für die dreiteilige Informa
tion [U′, L′, P′], deren Segmentposition vor der von [U, L, P] liegt, gesetzt:
Bedingung 4a: U′ = U und P′ < P; und
Bedingung 4b: U′ kann vor U existieren.
Bedingung 4a: U′ = U und P′ < P; und
Bedingung 4b: U′ kann vor U existieren.
[U′, L′, P′], welche die Bedingung 4a oder die Bedingung 4b erfüllen,
werden nacheinander ausgewählt, so daß der Kostenwert der Kombination am
besten wird, wenn sie mit [U, L, P] verbunden wird, wodurch die beste Kosten
kombination (höherrangige Kombination) ausgewählt wird.
Die dritte Realisierungsmethode der Markierungskettensucheinrichtung
54 wird unter Verwendung eines Falls von Fig. 9 beschrieben. Bei der dritten
Realisierungsmethode wird die Verarbeitung von einer Markierung aus sukzessiv
ausgeführt, deren entsprechende Segmentposition in einer Frontposition besteht.
In Fig. 9 läuft die Verarbeitung so ab, daß der Kostenwert einer Markierung
[<nishi<<go<<tan<<ta< 4, 1] [<nishi<<oh<<i<, 3, 1] . . . [<ko<<yama<<dai<], wel
cher dem Segment (1, 1) entspricht, zuerst bestimmt wird, und nachfolgend der
Kostenwert einer Markierung [<nishi<<go<<tan<<ta<, 4, 4] [<to<<go<<tan<<ta<, 4,
4] . . . [<shina<<kawa<<ku<, 3, 3] bestimmt wird. Wenn der Kostenwert von [<naka<
<nobu<, 2, 1] bestimmt wird, welcher einem Segment (4, 1) entspricht, werden zu
diesem Zeitpunkt jene Markierungen, welche die Bedingung 4a oder 4b erfüllen
von den Markierungen, welche den Segmenten (1, 1) (2, 1) (3, 1) vor dem Segment
(4, 1) entsprechen, gesucht, um Markierungen auszuwählen, welche den besten
Kostenwert liefern, wenn diese Markierungen miteinander verbunden werden, und
dann wird der Kostenwert von [<naka<<nobu<, 2, 1] auf der Basis der Markie
rungsverbindung zu diesem Zeitpunkt bestimmt. Genauer gesagt erfüllt sowohl
[<shina<<kawa<<ku<, 3, 1] des Segments (1, 1) als auch [<shina<<kawa<<ku<, 3,
2] des Segments (2, 1) und [<shina<<kawa<<ku<, 3, 3] des Segments (3, 1) die
Bedingung für [<naka<<nobu<, 2, 1] des Segments (4, 1), die Verbindung mit
[<shina<<kawa<<ku<, 3, 3] des Segments (3, 1) wird jedoch als beste Kombination
ausgewählt, welche den besten Kostenwert liefert, wenn jede der obigen drei
Markierungen mit der Markierung von [<naka<<nobu<, 2, 1] des Segments (4,1)
verbunden wird.
Die Markierungsverbindungen, die durch gestrichelte Linien und durch
gezogene Linien in Fig. 9 dargestellt werden, genügen der Bedingung 4a oder
der Bedingung 4b. Die Markierungen, welche den besten Kostenwert liefern, wenn
jede Markierung mit einer Frontmarkierung verbunden wird, werden durch durch
gezogene Linien dargestellt. Die Methode der sukzessiven Bestimmung des
Kostenwerts jeder Markierung von der Frontseite zur der Rückseite bedeutet, daß
der Kostenwert auf der Basis der besten Kombination jeder Markierung und einer
Markierung vor der Markierung kumuliert wird. Dies bedeutet deshalb, daß die
beste Kostenkombination durch Verwendung der sogenannten dynamischen
Planungsmethode (Viterbi-Algorithmus) bestimmt wird.
In der Beschreibung wird die Markierungskettensucheinrichtung 54 in
der ersten Realisierungsmethode der Wortsucheinrichtung 5 entsprechend der
Methode der Verbindung der Markierungen und der Bestimmung des Wortketten
kandidaten auf der Basis des Kostenwerts für deren Kombination beschrieben. In
diesem Fall können verschiedene Definitionen für den Kostenwert in Betracht ge
zogen werden. Zum Beispiel können folgende Definitionen betrachtet werden:
- A) Anzahl der verbundenen Markierungen (Anzahl der Verbindungen von dreiteiligen Informationen)
- B) Anzahl der Schriftzeichen, welche beim Lesen übersprungen werden (Lesesprünge)
- C) Intervall von Segmenten, welche Markierungen entsprechen (physi kalisches Intervall von Markierungen)
- D) Differenz zwischen logischem Intervall und physikalischem Intervall von Markierungen
- E) Zuverlässigkeit (oder Abstand) bei individueller Erkennung von jedem Schriftzeichen.
Im einfachsten Fall, wenn nur (A) für den Kostenwert verwendet wird,
kann ein vorbestimmter fester Kostenwert für jede verbundene Markierung addiert
werden. Wenn viele Markierungen miteinander von ihrem Kopf aus verbunden
sind, so wird der Kumulationswert des Kostenwerts gut, und eine Kombination,
welche aus Verbindungen mit der maximalen Anzahl von Markierungen besteht
(eine Verbindung, bei der die Anzahl von Markierungen von dreiteiligen Informa
tionen maximal ist), hat den besten Kostenwert.
Angenommen für den Kostenwert werden -100 Punkte für jede Mar
kierung vorgesehen, so wird im Fall der Markierungskettensuche aus Fig. 7 bis
9 die folgende Markierungskombination als beste Kombination beurteilt, weil ihr
Kostenwert -500 Punkte ist.
[<shina<<kawa<<ku<, 3, 1] - [<shina<<kawa<<ku<, 3, 2] - [<shina<
<kawa<<ku<, 3, 3] - [<naka<<nobu<, 2,1] - [<naka<, 2, 2] . . . (1)
Im Falle von Fig. 7 wird die folgende Kombination, welche denselben
Kostenwert -500 von Punkten aufweist, ebenfalls als beste Kombination beurteilt.
[<shina<<kawa<<ku<, 3, 1] - [<shina<<kawa<<ku<, 3, 2] - [<shina<
<kawa<<ku<, 3, 3] - [<nishi<<naka<<nobu<, 3, 2] - [<nishi<<naka<<nobu<, 3, 3] . . . (2)
Um die Beurteilung genauer durchzuführen, können die Faktoren (B),
(C), (D) und (E) zur Beurteilung des Kostenwerts verwendet werden.
Für zwei Markierungen [U1, L1, P1] und [U2, L2, P2] ist das logische
Intervall der Markierungen (Faktor B) folgendermaßen definiert:
Für U1 = U2 : P2-P1-1
Für U1 ≠ U2 : L1 - P1 + P2 - 1.
Für U1 = U2 : P2-P1-1
Für U1 ≠ U2 : L1 - P1 + P2 - 1.
Das heißt, es entspricht der Anzahl von Schriftzeichen, für welche ein
Lesesprung bei bestimmten Anteilen während einer Leseoperation für das Lese
resultat durchgeführt wird.
Wenn zum Beispiel die Markierungskombination (2) im Fall von Fig. 7
betrachtet wird, so wird ein Schriftzeichen beim Lesen zwischen [<shina<<kawa<
<ku<, 3, 3] und [<nishi<<naka<<nobu<, 3, 2] übersprungen, und zwar wird <nishi<
von (<nishi<<shina<<kawa<) beim Lesen übersprungen. Entsprechend ist das logi
sche Intervall der zwei Markierungen gleich 1. Das logische Intervall der anderen
Markierungen (2) ist gleich 0.
Der Kostenwert der Markierungsverbindung kann so gesetzt werden,
daß entsprechend dem logischen Intervall der Kostenwert verschlechtert wird (ein
Straffaktor angewendet wird). Wenn zum Beispiel als zusätzlicher Kostenfaktor
(logisches Intervall)×50 Punkte eingeführt wird, so ist der Kostenwert von (2)
gleich -450 Punkte, und somit um mehr als -500 Punkte verschlechtert.
Das physikalische Intervall der Markierungen gemäß (C) ist das Intervall
der Segmente, welche den Markierungen entsprechen. Zum Beispiel können im
Falle von Fig. 7 die Markierung [<nishi<<naka<<nobu<, 3,1] des Segments (1, 1)
und die Markierung [<nishi<<naka<<nobu<, 3, 2] des Segments (4, 1) miteinander
verbunden werden. Das logische Intervall zwischen diesen zwei Markierungen ist
gleich 0. Andererseits weist das physikalische Intervall zwischen ihnen eine
Distanz von zwei Segmenten auf, da zwei Segmente (2, 1) und (3, 1) zwischen
ihnen existieren. Als Methode zum Zählen des physikalischen Intervalls kann ein
Verfahren der Zählung auf der Basis der Anzahl von Segmenten zwischen zwei
Markierungen, ein Verfahren des Zählens auf der Basis der Differenz (Distanz)
zwischen den Koordinaten von zwei Segmenten, wenn die Koordinaten definiert
sind, oder ein Verfahren des Teilens der Entfernung durch einen Mittelwert und
eine Durchschnittssegmentgröße verwendet werden.
Wie im Falle des logischen Intervalls ist im Falle des physikalischen
Intervalls der Kostenwert der Markierungsverbindung so gesetzt (zum Beispiel
physikalisches Intervall×50 Punkte), daß der Kostenwert entsprechend dem
physikalischen Intervall sich verschlechtert (ein Straffaktor angewendet wird).
Die Differenz zwischen dem logischen Intervall und dem physikalischen
Intervall der Markierungen gemäß (D) hat die folgende Bedeutung. Zum Beispiel
wird die Verbindung zwischen der Markierung [<shina<<kawa<<ku<, 3, 3] und der
Markierung [<nishi<<naka<<nobu<, 3, 2] für die Kombination von (2) im Falle von
Fig. 7 betrachtet. Das logische Intervall ist gleich 1, während das physikalische
Intervall gleich 0 ist. Das heißt, das bedeutet, daß ein Schriftzeichen als an einer
Position befindlich betrachtet wird, für die kein physikalisches Intervall existiert
und somit dieses Lesen unnatürlich ist. Andererseits ist für die Verbindung
zwischen der Markierung [<nishi<<naka<<nobu<, 3, 1] des Segments (1, 1) und der
Markierung [<nishi<<naka< 07263 00070 552 001000280000000200012000285910715200040 0002019547812 00004 07144t;nobu<, 3, 2] des Segments (4, 1) das logische Intervall
gleich 0, während das physikalische Intervall gleich 2 ist (wenn es auf der Basis
der Anzahl von Segmenten gezählt wird). Das bedeutet, daß zwischen den
Markierungen eine Art Rauschen existiert, und es ist somit auch eine nicht
wünschenswerte Interpretation. Bei der eben ausgeführten Beschreibung ist somit
klar, daß wenn eines aus logischem Intervall und physikalischem Intervall gleich 0
ist, es unnatürlich ist, daß das andere nicht gleich 0 ist. Allgemeiner kann der
Kostenwert als sich verschlechternd festgestellt werden (Anwenden eines Straf
faktors), wenn die Differenz zwischen dem logischen Intervall und dem physika
lischen Intervall groß ist.
Der Faktor (E) wurde bisher für die Kostenkalkulation bei einer Symbol
leseoperation verwendet, und Zuverlässigkeit oder Unzuverlässigkeit (Abstand) in
der individuellen Erkennung wird der Kostenwertbeurteilung hinzugefügt.
Selbst wenn die Wortsucheinrichtung 5 durch die Markierungserzeu
gungsmethode wie oben beschrieben realisiert wird, kann die Prüfoperation wie
oben beschrieben angewendet werden.
Bei der Markierungserzeugungsmethode wie oben beschrieben können
viele Markierungen für ein Schriftzeichen erzeugt werden. In einem solchen Fall
besteht eine Möglichkeit, daß die Verarbeitungszeit und die verwendete Speicher
menge des Markierungsinformationszwischenspeichers 52 vergrößert wird. Dem
entsprechend kann für spezifische Schriftzeichen, für die viele Markierungen
erzeugt werden, eine Methode des Ausführens der Prüfoperation ohne die Erzeu
gung von Markierungen verwendet werden. Um diese Methode zu realisieren,
können die Wortsucheinrichtung 5, die Prüfanteilbestimmungseinrichtung 7 und
die Prüfeinrichtung 8 wie folgt konstruiert werden.
Die Wortsucheinrichtung 5 umfaßt die folgenden Elemente.
Der Einschränkungsmarkierungswörterbuchspeicher 55 dient dazu, für
jedes Schriftzeichen, ausgenommen spezifischer Schriftzeichen, zumindest dreitei
lige Informationen über "das Wort U, welches das Schriftzeichen enthält, die
Schriftzeichenkettenlänge L von U, die Position P des Schriftzeichens in U" zu
speichern. Die Markierungserzeugungseinrichtung 51 sucht für einen Schrift
zeichenkandidaten in dem Erkennungsresultatzwischenspeicher 4 die dreiteilige
Information aus dem Einschränkungsmarkierungswörterbuchspeicher 55, welche
dem Schriftzeichenkandidaten entspricht. Der Markierungsinformationszwischen
speicher 53 speichert das Resultat der Markierungserzeugungseinrichtung 51. Die
Wortverbindungseinschränkungseinrichtung 53 beschreibt eine Verbindungsein
schränkung zwischen Worten. Die Markierungskettensucheinrichtung 54 verbindet
zwei dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem Markierungs
informationszwischenspeicher 52 durch Verwendung der Positionsbeziehung
zwischen Segmenten, welche diesen dreiteiligen Informationen entsprechen, und
der Beziehung zwischen U1, L1, P1, U2, L2, P2, um so den Wortkettenkandidaten,
welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungs
resultatzwischenspeicher 4 entspricht, an den Wortkettenkandidatenzwischen
speicher 6 auszugeben.
Die Prüfanteilbestimmungseinrichtung 7 bestimmt die Position eines
spezifischen Schriftzeichens in der Schriftzeichenkette des Wortkettenkandidaten
in dem Wortkettenkandidatenzwischenspeicher 6 als einen Prüfobjektanteil und
bestimmt das spezifische Schriftzeichen als eine vermutete Schriftzeichenkette.
Die Prüfeinrichtung 8 bejaht das Vorliegen der vermuteten Schriftzeichenkette,
wenn das spezifische Schriftzeichen, welches als vermutete Schriftzeichenkette
betrachtet wird, in den Schriftzeichenkandidaten im Erkennungsresultatzwischen
speicher 4 existiert, welcher dem Prüfobjektanteil entspricht.
Wenn zum Beispiel <kawa< als spezifisches Schriftzeichen gesetzt wird
so sind in dem Einschränkungsmarkierungswörterbuchspeicher 55 keine Markierun
gen für <kawa<, so wie etwa [<shina<<kawa<<ku<, 3, 2] [<to<<shina<<kawa<, 3, 3]
[<nishi<<shina<<kawa<, 3, 3] [<minami<<shina<<kawa<, 3, 3] [<kita<<shina<
<kawa<, 3, 3], registriert. Als ein Resultat ist für die in Fig. 1A gezeigten
Schriftzeichenkettenkandidaten <kawa< in den Schriftzeichenkandidaten
enthalten, keine Markierung ist jedoch an diesem Anteil vorgesehen. Die
Prüfanteilbestimmungseinrichtung 7 bestimmt die Position des spezifischen
Schriftzeichens <kawa< als Prüfobjektanteil für den Kandidaten des
Adreßleseresultats von (<shina<<kawa< <ku<<naka<<nobu<). Die Prüfeinrichtung
8 beurteilt den Erfolg der Prüfung, da <kawa< in den Schriftzeichenkandidaten
(<kawa<, <ya<, <yama<) an dem Prüfobjektanteil enthalten ist.
Wie oben beschrieben werden in dem Lesegerät für Schriftzeichen
ketten gemäß der vorliegenden Erfindung der Prüfobjektanteil und die vermutete
Schriftzeichenkette dieses Prüfobjektanteils für den Kandidaten des Leseresultats
bestimmt, und die Prüfung wird ausgeführt. Als ein Resultat kann eine exakte
Leseoperation selbst dann durchgeführt werden, wenn nicht alle korrekten
Schriftzeichen notwendigerweise in dem Schriftzeichenausschneide- und Schrift
zeichenerkennungsresultat enthalten sind. Darüber hinaus werden die Schrift
zeichen präzise beurteilt, und eine korrekte Leseoperation kann selbst dann
durchgeführt werden, wenn ein korrektes Schriftzeichen mit einem anderen nicht
korrekten Schriftzeichenkandidaten in Wettbewerb steht. Darüber hinaus werden
bei der Prüfoperation nicht alle Leseobjekte erneut überprüft, sondern die Prüf
objektanteile werden überprüft, und es reicht aus, die Möglichkeit des Vorliegens
einer vermuteten Schriftzeichenkette zu beurteilen. Deshalb kann die Verarbeitung
effizienter als beim Stand der Technik durchgeführt werden, und die Verarbei
tungseffizienz ist hoch.
Darüber hinaus kann, wenn ein Wortkettenkandidat aus Schriftzeichen
kettenkandidaten gesucht wird, die Verarbeitungseffizienz der Leseoperation von
Schriftzeichenketten weiter verbessert werden, wenn eine Markierung für jedes der
Schriftzeichen erzeugt wird, um die Schriftzeichen miteinander zu verbinden, ohne
eine Kombination von Schriftzeichenkandidaten mit einem Wörterbuch zu ver
gleichen.
Die vorliegende Erfindung wurde nun im wesentlichen anhand ihrer
Anwendung auf die Erkennung von aus chinesischen Schriftzeichen bestehenden
Zeichenketten beschrieben. Es ist jedoch anzumerken, daß die Erfindung keines
wegs darauf beschränkt ist, sondern ganz analog auch zur Erkennung von
Zeichenketten, welche aus den Buchstaben des Alphabets bestehen, verwendet
werden kann.
Claims (9)
1. Lesegerät für Schriftzeichenketten zum Lesen von Schriftzeichenketten
aus Eingabebilddaten, welches aufweist:
eine Ausschneide-Erkennungseinrichtung (3) zum Ausschneiden eines Segments, welches einem Schriftzeichen aus den Bilddaten entspricht, um indivi duelle Schriftzeichenerkennung für jedes Segment durchzuführen,
einen Erkennungsresultatzwischenspeicher (4) zum Speichern eines Erkennungsresultats der Ausschneide-Erkennungseinrichtung (3);
eine Wortsucheinrichtung (5) zum Suchen eines Wortkettenkandidaten, welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungs resultatzwischenspeicher (4) entspricht;
einen Wortkettenkandidatenzwischenspeicher (6) zum Speichern eines Suchresultats der Wortsucheinrichtung (5);
eine Prüfanteilbestimmungseinrichtung (7) zum Bestimmen eines Prüf objektanteils und einer vermuteten Schriftzeichenkette des Prüfobjektanteils auf der Grundlage des Resultats in dem Wortkettenkandidatenzwischenspeicher (6); und
eine Prüfeinrichtung (8) zur Beurteilung der Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette an dem Prüfanteil.
eine Ausschneide-Erkennungseinrichtung (3) zum Ausschneiden eines Segments, welches einem Schriftzeichen aus den Bilddaten entspricht, um indivi duelle Schriftzeichenerkennung für jedes Segment durchzuführen,
einen Erkennungsresultatzwischenspeicher (4) zum Speichern eines Erkennungsresultats der Ausschneide-Erkennungseinrichtung (3);
eine Wortsucheinrichtung (5) zum Suchen eines Wortkettenkandidaten, welcher einer Kombination von Schriftzeichenkandidaten in dem Erkennungs resultatzwischenspeicher (4) entspricht;
einen Wortkettenkandidatenzwischenspeicher (6) zum Speichern eines Suchresultats der Wortsucheinrichtung (5);
eine Prüfanteilbestimmungseinrichtung (7) zum Bestimmen eines Prüf objektanteils und einer vermuteten Schriftzeichenkette des Prüfobjektanteils auf der Grundlage des Resultats in dem Wortkettenkandidatenzwischenspeicher (6); und
eine Prüfeinrichtung (8) zur Beurteilung der Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette an dem Prüfanteil.
2. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil
einen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortketten
kandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in dem
Erkennungsresultatzwischenspeicher erhalten wird, und daß sie die
Schriftzeichenkette des Anteils als eine vermutete Schriftzeichenkette bestimmt,
wobei die Prüfeinrichtung (8) eine Fläche des Prüfobjektanteils mit der Anzahl von
Schriftzeichen der vermuteten Schriftzeichenkette vergleicht, und die Möglichkeit
des Vorliegens der vermuteten Schriftzeichenkette verwirft, wenn das
Vergleichsresultat nicht einer vorbestimmten Bedingung genügt.
3. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil
einen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortketten
kandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in dem
Erkennungsresultatzwischenspeicher (4) erhalten wird, und daß sie die
Schriftzeichenkette dieses Teils als vermutete Schriftzeichenkette bestimmt, wobei
die Prüfeinrichtung (8) die Anzahl von Strichen der vermuteten Schriftzeichenkette
mit der Anzahl von Strichen eines Schriftzeichenkandidaten in dem
Erkennungsresultatzwischenspeicher (4), welcher dem Prüfobjektanteil entspricht,
vergleicht, und die Möglichkeit des Vorliegens der vermuteten Schriftzeichenkette
verwirft, wenn das Vergleichsresultat nicht einer vorbestimmten Bedingung genügt.
4. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Wortsucheinrichtung (5) einen Wortkettenkandidaten aus einer
Kombination von höherrangigen Schriftzeichenkandidaten in dem
Erkennungsresultatzwischenspeicher sucht, die
Prüfanteilbestimmungseinrichtung
(7) als Prüfobjektanteil einen Anteil bestimmt, bei dem ein Teil einer
Schriftzeichenkette eines Wortkettenkandidaten in dem
Wortkettenkandidatenzwischenspeicher (6) nicht in höherrangigen Kandidaten in
dem Erkennungsresultatzwischenspeicher (4) erhalten wird, und sie die
Schriftzeichenkette dieses Anteils als vermutete Schriftzeichenkette bestimmt,
wobei die Prüfeinrichtung (8) das Vorliegen der vermuteten Schriftzeichenkette
bejaht, wenn ein niederrangiger Schriftzeichenkandidat, welcher mit der
vermuteten Schriftzeichenkette übereinstimmt, unter niederrangigen Kandidaten in
dem Erkennungsresultatzwischenspeicher (4) existiert, welche dem
Prüfobjektanteil entsprechen.
5. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Prüfanteilbestimmungseinrichtung (7) als Prüfobjektanteil einen
Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines
Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in
dem Erkennungsresultatzwischenspeicher (4) erhalten wird, und sie die
Schriftzeichenkette dieses Anteils als vermutete Schriftzeichenkette bestimmt
wobei, wenn die Anzahl von Segmenten in dem
Erkennungsresultatzwischenspeicher (4), welche den Prüfobjektanteil entspricht,
mit der Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette überein
stimmt, die individuelle Schriftzeichenerkennung für das der vermuteten Schrift
zeichenkette entsprechende Segment erneut ausgeführt wird, indem eine
individuelle Schriftzeichenerkennungseinrichtung verwendet wird, welche sich von
der Ausschneide-Erkennungseinrichtung (3) unterscheidet, und das Vorliegen der
vermuteten Schriftzeichenkette bejaht wird, wenn der als Resultat des erneuten
Versuchs erhaltene Schriftzeichenkandidat mit der vermuteten Schriftzeichenkette
übereinstimmt.
6. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil
einen Anteil bestimmt, bei dem ein Teil einer Schriftzeichenkette eines Wortketten
kandidaten in dem Wortkettenkandidatenzwischenspeicher (6) nicht in dem
Erkennungsresultatzwischenspeicher (4) erhalten wird, und sie die
Schriftzeichenkette dieses Anteils als vermutetete Schriftzeichenkette bestimmt,
wobei, wenn die Anzahl von Segmenten in dem
Erkennungsresultatzwischenspeicher (4), welche dem Prüfobjektanteil entspricht,
nicht mit der Anzahl von Schriftzeichen der vermuteten Schriftzeichenkette
übereinstimmt, das Ausschneiden eines Segments aus den Bilddaten eines
Bereichs, welcher dem Prüfobjektanteil entspricht, unter Berücksichtigung der
Form oder der Anzahl der Schriftzeichen der vermuteten Schriftzeichenkette erneut
ausgeführt wird, die individuelle Schriftzeichenerkennung für das Segment
ausgeführt wird und das Vorliegen der vermuteten Schriftzeichenkette bejaht wird,
wenn der Schriftzeichenkandidat des Schriftzeichenerkennungsresultats mit der
vermuteten Schriftzeichenkette übereinstimmt.
7. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Prüfanteilbestimmungseinrichtung (7) Schriftzeichenketten mehrerer
Wortkettenkandidaten in dem Wortkettenkandidatenzwischenspeicher (6)
vergleicht, um als Prüfobjektanteil einen Anteil zu bestimmen, bei dem ein
teilweiser Unterschied zwischen den Schriftzeichenketten festgestellt wird, und um
als vermutete Schriftzeichenkette mehrere Kombinationen von
Schriftzeichenketten, welche unterschiedliche Anteile aufweisen, zu bestimmen,
wobei die Prüfeinrichtung (8) die individuelle Schriftzeichenerkennung für das
Segment, welches der vermuteten Schriftzeichenkette entspricht, erneut ausführt,
indem eine Schriftzeichenerkennungseinrichtung verwendet wird, welche sich von
der Ausschneide-Erkennungseinrichtung (3) unterscheidet, und die Prüfeinrichtung
(8) das Vorliegen der vermuteten Schriftzeichenkette bejaht, wenn die
Zuverlässigkeit des Schriftzeichenkandidaten des Resultats des erneuten
Versuchs der Erkennung einer vorbestimmten Bedingung genügt.
8. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Wortsucheinrichtung (5) einen Markierungswörterbuchspeicher (50)
umfaßt, um für jedes Schriftzeichen zumindest dreiteilige Informationen bestehend
aus "Wort U, welches das Schriftzeichen enthält, Schriftzeichenlänge L von U,
Position P des Schriftzeichens in U" zu speichern, eine
Markierungserzeugungseinrichtung (51), um für einen Schriftzeichenkandidaten in
dem Erkennungsresultatzwischenspeicher (4) die dreiteilige Information aus dem
Markierungswörterbuchspeicher (50) zu suchen, die dem Schriftzeichenkandidaten
entspricht, einen Markierungsinformationszwischenspeicher (52), um ein Resultat
der Markierungserzeugungseinrichtung (51) zu speichern, einen Wortverbindungs-
Einschränkungsspeicher (53), um eine Verbindungseinschränkung zwischen
Worten zu beschreiben, und eine Markierungskettensucheinrichtung (54), um zwei
dreiteilige Informationen [U1, L1, P1] und [U2, L2, P2] in dem
Markierungsinformationszwischenspeicher (52) miteinander zu verbinden, indem
die Positionsbeziehung der Segmente, welche der dreiteiligen Information entspre
chen, und die Beziehung zwischen U1, L1, P1, U2, L2, P2 verwendet werden, um
so den Wortkettenkandidaten auszugeben, welcher einer Kombination der Schrift
zeichenkandidaten in dem Erkennungsresultatzwischenspeicher (4) entspricht.
9. Lesegerät für Schriftzeichenketten nach Anspruch 1, dadurch gekenn
zeichnet, daß
die Wortsucheinrichtung einen Einschränkungsmarkierungswörterbuch
speicher umfaßt, um für jedes Schriftzeichen ausgenommen eines spezifischen
Schriftzeichens zumindest dreiteilige Informationen, bestehend aus "Wort U,
welches das Schriftzeichen enthält, Schriftzeichenkettenlänge L von U, Position P
des Schriftzeichens in U" zu speichern, eine Markierungserzeugungseinrichtung
(51), um für Schriftzeichenkandidaten in dem Erkennungsresultatzwischenspeicher
(4) die dreiteiligen Informationen aus dem
Einschränkungsmarkierungswörterbuchspeicher zu suchen, welche dem
Schriftzeichenkandidaten entsprechen, einen Markierungs
informationszwischenspeicher (52), um das Resultat der Markierungserzeugungs
einrichtung zu speichern, einen Wortverbindungseinschränkungsspeicher (52), um
eine Verbindungseinschränkung zwischen Worten zu beschreiben, und eine
Markierungskettensucheinrichtung (54), um zwei dreiteilige Informationen [U1, L1,
P1] und [U2, L2, P2] in dem Markierungsinformationszwischenspeicher (52)
miteinander zu verbinden, indem die Positionsbeziehung der Segmente, welche
den dreiteiligen Informationen entsprechen, und die Beziehung zwischen U1, L1,
P1, U2, L2, P2 verwendet werden, um dadurch den Wortkettenkandidaten
auszugeben, welcher einer Kombination von Schriftzeichenkandidaten in dem
Erkennungsresultatzwischenspeicher (4) entspricht, wobei die
Prüfanteilbestimmungseinrichtung (7) als einen Prüfobjektanteil die Position des
spezifischen Schriftzeichens der Schriftzeichenkette des Wortkettenkandidaten in
dem Wortkettenkandidatenzwischenspeicher (6) bestimmt, und sie das spezifische
Schriftzeichen als eine vermutete Schriftzeichenkette bestimmt, und wobei die
Prüfeinrichtung (8) das Vorliegen der vermuteten Schriftzeichenkette bejaht, wenn
das spezifische Schriftzeichen, welches als vermutete Schriftzeichenkette
betrachtet wird, unter den Schriftzeichenkandidaten in dem
Erkennungsresultatzwischenspeicher (4) existiert, welche dem Prüfobjektanteil
entsprechen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6317163A JP2734386B2 (ja) | 1994-12-20 | 1994-12-20 | 文字列読み取り装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19547812A1 true DE19547812A1 (de) | 1996-07-04 |
DE19547812C2 DE19547812C2 (de) | 1999-08-05 |
Family
ID=18085165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19547812A Expired - Fee Related DE19547812C2 (de) | 1994-12-20 | 1995-12-20 | Lesegerät für Schriftzeichenketten |
Country Status (3)
Country | Link |
---|---|
US (1) | US6014460A (de) |
JP (1) | JP2734386B2 (de) |
DE (1) | DE19547812C2 (de) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2833580B2 (ja) * | 1996-04-19 | 1998-12-09 | 日本電気株式会社 | 全文インデックス作成装置および全文データベース検索装置 |
JP3282976B2 (ja) * | 1996-11-15 | 2002-05-20 | 株式会社キングジム | 文字情報処理装置及び方法 |
US6470362B1 (en) * | 1997-05-16 | 2002-10-22 | Compaq Computer Corporation | Extracting ordered list of words from documents comprising text and code fragments, without interpreting the code fragments |
DE19725790A1 (de) * | 1997-06-18 | 1998-12-24 | Fischer Gmbh Gert | Verfahren zum selektiven Erfassen und Auslesen einer Zeichenkette |
JP3452774B2 (ja) * | 1997-10-16 | 2003-09-29 | 富士通株式会社 | 文字認識方法 |
JP3246432B2 (ja) * | 1998-02-10 | 2002-01-15 | 株式会社日立製作所 | 宛名読取り装置および郵便物等区分機 |
US6167411A (en) * | 1998-06-22 | 2000-12-26 | Lucent Technologies Inc. | User interface for entering and editing data in data entry fields |
JP2000353215A (ja) * | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
US6801660B1 (en) | 2000-08-22 | 2004-10-05 | Microsoft Corporation | Method and system for maintaining alternates in association with recognized words |
US6836759B1 (en) * | 2000-08-22 | 2004-12-28 | Microsoft Corporation | Method and system of handling the selection of alternates for recognized words |
US6754386B1 (en) | 2000-08-22 | 2004-06-22 | Microsft Corporation | Method and system of matching ink processor and recognizer word breaks |
US6785417B1 (en) * | 2000-08-22 | 2004-08-31 | Microsoft Corp | Method and system for searching for words in ink word documents |
US6771817B1 (en) | 2000-08-22 | 2004-08-03 | Microsoft Corporation | Method and system for extending ink word data structures while maintaining version compatibility |
JP3554271B2 (ja) * | 2000-12-13 | 2004-08-18 | パナソニック コミュニケーションズ株式会社 | 情報通信装置 |
DE10112186C2 (de) * | 2001-03-14 | 2003-02-13 | Siemens Production & Logistics | Verfahren zum Ermitteln von Fehlerarten fehlerbehafteter Leseergebnisse |
US6986106B2 (en) | 2002-05-13 | 2006-01-10 | Microsoft Corporation | Correction widget |
US7137076B2 (en) * | 2002-07-30 | 2006-11-14 | Microsoft Corporation | Correcting recognition results associated with user input |
US7092567B2 (en) * | 2002-11-04 | 2006-08-15 | Matsushita Electric Industrial Co., Ltd. | Post-processing system and method for correcting machine recognized text |
US7848573B2 (en) * | 2003-12-03 | 2010-12-07 | Microsoft Corporation | Scaled text replacement of ink |
US7506271B2 (en) * | 2003-12-15 | 2009-03-17 | Microsoft Corporation | Multi-modal handwriting recognition correction |
JP4600651B2 (ja) * | 2004-10-06 | 2010-12-15 | 日本電気株式会社 | 文字列認識方法および装置 |
US8228522B2 (en) * | 2007-01-29 | 2012-07-24 | Kabushiki Kaisha Toshiba | Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data |
JP5434586B2 (ja) * | 2009-12-29 | 2014-03-05 | オムロン株式会社 | 単語認識方法および単語認識用のプログラムならびに情報処理装置 |
JP5591578B2 (ja) * | 2010-04-19 | 2014-09-17 | 日本電産サンキョー株式会社 | 文字列認識装置および文字列認識方法 |
TWI478074B (zh) * | 2010-12-01 | 2015-03-21 | Inst Information Industry | 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 |
US8838826B2 (en) * | 2012-04-04 | 2014-09-16 | Google Inc. | Scalable robust live streaming system |
CN104704510B (zh) * | 2012-10-10 | 2018-08-31 | 摩托罗拉解决方案公司 | 识别在文档中使用的语言并且基于识别的语言执行ocr识别的方法和装置 |
US9563812B2 (en) * | 2015-04-08 | 2017-02-07 | Toshiba Tec Kabushiki Kaisha | Image processing apparatus, image processing method and computer-readable storage medium |
US9600731B2 (en) * | 2015-04-08 | 2017-03-21 | Toshiba Tec Kabushiki Kaisha | Image processing apparatus, image processing method and computer-readable storage medium |
JP7114892B2 (ja) * | 2017-12-13 | 2022-08-09 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
JP7247472B2 (ja) * | 2018-04-19 | 2023-03-29 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6186883A (ja) * | 1984-10-05 | 1986-05-02 | Hitachi Ltd | オンライン手書き文字認識方式 |
EP0312905A1 (de) * | 1987-10-16 | 1989-04-26 | Computer Gesellschaft Konstanz Mbh | Verfahren zur automatischen Zeichenerkennung |
JPH0373086A (ja) * | 1989-04-14 | 1991-03-28 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識後処理方式 |
US5050218A (en) * | 1986-08-26 | 1991-09-17 | Nec Corporation | Apparatus for recognizing address appearing on mail article |
JPH0546814A (ja) * | 1991-08-20 | 1993-02-26 | Nec Corp | 文字読み取り装置 |
JPH0584490A (ja) * | 1991-09-27 | 1993-04-06 | Nitto Denko Corp | 有機酸含有発酵廃液の膜処理方法 |
EP0553745A2 (de) * | 1992-01-30 | 1993-08-04 | Matsushita Electric Industrial Co., Ltd. | Vorrichtung zur Zeichenerkennung |
JPH05324899A (ja) * | 1992-05-25 | 1993-12-10 | Nec Corp | 郵便物記載住所認識装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0634253B2 (ja) * | 1986-04-25 | 1994-05-02 | 日本電信電話株式会社 | 誤読文字訂正処理装置 |
JPS63198154A (ja) * | 1987-02-05 | 1988-08-16 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | つづり誤り訂正装置 |
JP2713911B2 (ja) * | 1987-07-08 | 1998-02-16 | 株式会社東芝 | 郵便物処理装置 |
JPH01214964A (ja) * | 1988-02-23 | 1989-08-29 | Sharp Corp | コレクト機能付欧文作成装置 |
JPH02300972A (ja) * | 1989-05-16 | 1990-12-13 | Oki Electric Ind Co Ltd | 電子辞書 |
JP2845510B2 (ja) * | 1989-09-08 | 1999-01-13 | 株式会社東芝 | ナンバプレート検出装置 |
JPH03189780A (ja) * | 1989-12-20 | 1991-08-19 | Toshiba Corp | 住所認識装置 |
JPH04270449A (ja) * | 1991-02-04 | 1992-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 住所入力装置 |
US5146512A (en) * | 1991-02-14 | 1992-09-08 | Recognition Equipment Incorporated | Method and apparatus for utilizing multiple data fields for character recognition |
JPH0684006A (ja) * | 1992-04-09 | 1994-03-25 | Internatl Business Mach Corp <Ibm> | オンライン手書き文字認識方法 |
JPH06124366A (ja) * | 1992-10-14 | 1994-05-06 | Toshiba Corp | 住所読取装置 |
JP3220886B2 (ja) * | 1993-06-23 | 2001-10-22 | 株式会社日立製作所 | 文書検索方法および装置 |
JPH07182465A (ja) * | 1993-12-22 | 1995-07-21 | Hitachi Ltd | 文字認識方法 |
JPH07334625A (ja) * | 1994-06-06 | 1995-12-22 | Nec Corp | 文字列入力装置 |
US5854855A (en) * | 1994-09-09 | 1998-12-29 | Motorola, Inc. | Method and system using meta-classes and polynomial discriminant functions for handwriting recognition |
-
1994
- 1994-12-20 JP JP6317163A patent/JP2734386B2/ja not_active Expired - Fee Related
-
1995
- 1995-12-19 US US08/575,027 patent/US6014460A/en not_active Expired - Lifetime
- 1995-12-20 DE DE19547812A patent/DE19547812C2/de not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6186883A (ja) * | 1984-10-05 | 1986-05-02 | Hitachi Ltd | オンライン手書き文字認識方式 |
US5050218A (en) * | 1986-08-26 | 1991-09-17 | Nec Corporation | Apparatus for recognizing address appearing on mail article |
EP0312905A1 (de) * | 1987-10-16 | 1989-04-26 | Computer Gesellschaft Konstanz Mbh | Verfahren zur automatischen Zeichenerkennung |
JPH0373086A (ja) * | 1989-04-14 | 1991-03-28 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識後処理方式 |
JPH0546814A (ja) * | 1991-08-20 | 1993-02-26 | Nec Corp | 文字読み取り装置 |
JPH0584490A (ja) * | 1991-09-27 | 1993-04-06 | Nitto Denko Corp | 有機酸含有発酵廃液の膜処理方法 |
EP0553745A2 (de) * | 1992-01-30 | 1993-08-04 | Matsushita Electric Industrial Co., Ltd. | Vorrichtung zur Zeichenerkennung |
JPH05324899A (ja) * | 1992-05-25 | 1993-12-10 | Nec Corp | 郵便物記載住所認識装置 |
Non-Patent Citations (4)
Title |
---|
ISHIKAWA et al.: "OCR Address Reading/Letter Softing Machine for the Ministry of Posts and Telecommunications of Japan", NEC Technical Journal, Bd. 44, Nr. 3, pp. 25-30, 1991 * |
ITO et al.: "A method of detecting and correcting errors in the Japanese OCR", Transactions of Information Processing Society of Japan, Bd. 33, Nr. 5, pp. 664-670, 1992 * |
TAKAO et al.: "Implementation and Evaluation of Post Processing for Japanese Document Readers", Transactions of Information Processing Society of Japan, Bd. 30, Nr. 11, pp. 1394-1401, 1989 * |
TORIMOTO et al.: "Japanese Address Reader-Sorber, Model TR-17", Toshiba Review, Bd. 45, Nr. 2, pp. 149-152, 1990 * |
Also Published As
Publication number | Publication date |
---|---|
JP2734386B2 (ja) | 1998-03-30 |
JPH08171614A (ja) | 1996-07-02 |
US6014460A (en) | 2000-01-11 |
DE19547812C2 (de) | 1999-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19547812C2 (de) | Lesegerät für Schriftzeichenketten | |
DE69030310T2 (de) | Beschränkungsabhängig gesteuerte on-line Erkennung von handgeschriebenen Zeichen und Symbolen | |
DE10342594B4 (de) | Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
DE69230631T2 (de) | Verfahren zum Vergleichen von Wortgestalten | |
DE68916978T2 (de) | Zeichenkettenerkennungssystem. | |
DE69610243T2 (de) | Verfahren zum Trainieren einer Erkennungsanlage mit Zeichenmustern | |
DE69525401T2 (de) | Verfahren und Gerät zur Identifikation von Wörtern, die in einem portablen elektronischen Dokument beschrieben sind | |
DE69535098T2 (de) | Verfahren und -vorrichtung zur Suche von Bildern in einer Datenbank | |
DE60204005T2 (de) | Verfahren und einrichtung zur erkennung eines handschriftlichen musters | |
DE69230633T2 (de) | Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich | |
DE69329330T2 (de) | Texterkennung | |
DE69616246T2 (de) | Automatisches Verfahren zum Identifizieren von Wegfallwörtern in der Abbildung eines Dokumentes ohne Verwendung vom OCR | |
DE2541204A1 (de) | Verfahren zur fehlererkennung und einrichtung zur durchfuehrung der verfahren | |
DE2740105A1 (de) | Optische zeichenerkennungseinrichtung | |
DE2657631A1 (de) | Verfahren zur codierten darstellung einer information, insbesondere von chinesischen zeichen | |
DE60031502T2 (de) | Verfahren und Vorrichtung zur Typbestimmung eines Formblatts | |
EP1671262A1 (de) | Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten | |
EP1402462B1 (de) | Verfahren und vorrichtung zum automatischen lesen von adressen in mehr als einer sprache | |
DE2435889A1 (de) | Verfahren und einrichtung zum unterscheiden von zeichengruppen | |
DE3815869A1 (de) | Verfahren zum extrahieren von merkmalsmengen eines zeichens | |
DE2654815A1 (de) | Verfahren zur unterscheidung von gross- und kleinbuchstaben | |
DE1212758B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Schriftzeichen | |
DE19933984C2 (de) | Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen | |
DE19708280C2 (de) | Lesevorrichtung für vollständige Anschriften |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8125 | Change of the main classification |
Ipc: G06K 9/72 |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20140701 |