DE3632832A1 - Zeichenerkennungssystem - Google Patents
ZeichenerkennungssystemInfo
- Publication number
- DE3632832A1 DE3632832A1 DE19863632832 DE3632832A DE3632832A1 DE 3632832 A1 DE3632832 A1 DE 3632832A1 DE 19863632832 DE19863632832 DE 19863632832 DE 3632832 A DE3632832 A DE 3632832A DE 3632832 A1 DE3632832 A1 DE 3632832A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- block
- blocks
- level
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
Die vorliegende Erfindung bezieht sich allgemein auf ein
Zeichenerkennungssystem zum Erkennen von Zeichen, z. B.
Schriftzeichen, in einer Dokumentvorlage. Insbesondere bezieht
sich die Erfindung auf ein Zeichenerkennungssystem,
das speziell zum Erkennen von Zeichen bestimmt ist, die
voneinander getrennte Zeichenkomponenten aufweisen, wie
beispielsweise chinesische Schriftzeichen, japanische
"Hiragana"- u. "Katakana"-Schriftzeichen usw.. Außerdem
bezieht sich die Erfindung auf ein Zeichenerkennungssystem,
das für das Aufnehmen von Zeichendaten von einer Dokumentvorlage
geeignet ist, die ein Gemisch aus japanischen oder
chinesischen und alphabetischen Schriftzeichen, wie beispielsweise
aus dem Englischen, dem Deutschen usw., enthält.
In den vergangenen Jahren sind verschiedenartige Zeichenerkennungssysteme
zum Aufnehmen von Zeichendaten von einer
Dokumentvorlage entwickelt und vorgeschlagen worden. In
solchen Zeichenerkennungssystemen besteht eine Schwierigkeit
in dem Aufnehmen von Zeichendaten von der Dokumentvorlage,
die in Japanisch, Chinesisch usw. geschrieben ist. Die
Schwierigkeit ergibt sich aus dem Vorhandensein von einigen
Zeichen im Japanischen, Chinesischen oder anderen vergleichbaren
Sprachen, die Unterbrechungsstellen oder voneinander
getrennte Zeichenkomponenten aufweisen. Beispielsweise
hat das japanische Kanji-Schriftzeichen, das die Bedeutung
"Fluß" hat, drei sich im wesentlichen senkrecht
erstreckende und voneinander getrennte Zeichenkomponenten,
und das japanische Hiragana-Schriftzeichen, das etwa wie
"ei" ausgesprochen wird, hat zwei im wesentlichen sich vertikal
erstreckende und voneinander getrennte Zeichenkomponenten.
In der vorliegenden Beschreibung werden solche Zeichen,
die voneinander getrennte Zeichenkomponenten aufweisen,
durchwegs als "trennende" Zeichen bezeichnet.
Das Zeichenerkennungssystem extrahiert oder segmentiert im
allgemeinen jedes Zeichen in der Dokumentvorlage und vergleicht
die Zeichenstruktur mit voreingestellten Daten, um
so das Zeichen zu erkennen. Das erkannte Zeichen wird üblicherweise
in einen computergerechten Code, beispielsweise
den ASCII-Code oder einen ähnlichen Code, umgesetzt. Ein
genaues Extrahieren der "trennenden" Zeichen war bisher sehr
schwierig, und zwar wegen des Vorhandenseins des Zwischenraums
oder der Diskontinuität zwischen den Zeichenkomponenten.
Andererseits ist im Englischen, im Deutschen oder einer
anderen mit alphabetischen Zeichen (in den angenommenen
Fällen lateinischen Schriftzeichen) geschriebenen Sprache
der Zwischenraum zwischen den Zeichen in einem Wort wesentlich
enger als derjenige zwischen den Wörtern. Wegen des
engen Zwischenraums zwischen den alphabetischen Zeichen in
dem Wort kann, wenn ein entsprechendes, alphabetische Zeichen
verwendendes Dokument durch ein Zeichenerkennungssystem
gelesen wird, das dazu bestimmt ist, Daten von japanischen
oder chinesischen Dokumenten aufzunehmen, der Zwischenraum
zwischen den Zeichen in einem Wort fälschlicherweise übergangen
werden. Dies führt zu einem Aufnehmen eines Bildes
des gesamten Wortes als eine Einheit. Aus diesem Grunde ist
es unmöglich, jedes alphabetische Zeichen in einem derartigen
Dokument mit einem derartigen System zu erkennen.
Dieses Problem beim Erkennen von Zeichen tritt besonders
dann auf, wenn das Zeichenerkennungssystem zum Lesen einer
Dokumentvorlage, die ein Gemisch aus japanischen oder chinesischen
und alphabetischen Zeichen enthält, und zum Aufnehmen
von Zeichendaten von derselben benutzt wird.
Desweiteren werden in den bereits früher vorgeschlagenen
Systemen das Extrahieren des Zeichens, das zu erkennen ist,
und das eigentliche Erkennen des Zeichens in voneinander
unabhängigen Schritten ausgeführt. Im allgemeinen wird der
Schritt zum Extrahieren eines Zeichens vor dem Schritt zum
Erkennen des Zeichens ausgeführt. Wenn die Struktur des
extrahierten Zeichens nicht mit irgendeinem vorgegebenen
Zeichenmuster zusammenpaßt, wird ein betreffendes Zeichen
als nichterkennbares Zeichen behandelt. Dieser Umstand setzt
die Zeichenerkennungsrate derartiger Zeichenerkennungssysteme
deutlich herab.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde,
ein Zeichenerkennungssystem zu schaffen, das die genannten
Schwierigkeiten, die in herkömmlichen Systemen bestehen,
beseitigen kann und eine wesentlich höhere Erkennungsrate
bietet. Ferner besteht die Aufgabe für die vorliegende Erfindung
darin, ein Zeichenerkennungssystem zu schaffen, das
Zeichen-Daten selbst dann von einem Dokument akkurat aufnehmen
kann, wenn dieses ein Gemisch von japanischen oder
chinesischen und alphabetischen Zeichen darstellt. Desweiteren
besteht die Aufgabe für die vorliegende Erfindung
darin, ein Zeichenerkennungssystem zu schaffen, das eine
Kombination von voneinander getrennten Bild-Daten, eine
erneute Trennung der Bild-Daten usw. gestattet, um das Erkennen
der Zeichen in der Dokumentvorlage sicherzustellen.
Um die zuvor genannten Aufgaben zu lösen, extrahiert ein
Zeichenerkennungssystem gemäß der vorliegenden Erfindung
Zeichenblöcke in einer Weise, daß in diesen jeweils eine
minimale Zeicheneinheit enthalten ist. Das Zeichenerkennungssystem
besitzt die Fähigkeit der erneuten Zusammenfügung
(Rekombination) und/oder des erneuten Extrahierens
(Reextraktion) von Zeichenblöcken während eines Zeichenerkennungsprozesses.
Das erneute Zusammenfügen und die erneute
Extraktion von Zeichenblöcken wird auf der Grundlage der
Extraktionshysterese jedes Zeichenblocks gesteuert, so daß
das erneute Zusammenfügen und die erneute Extraktion wirksam
durchgeführt werden können.
In dem bevorzugten Prozeß zum Extrahieren der Zeichenblöcke
werden im wesentlichen aneinander grenzende, voneinander
unabhängige Zeichen in einem einzigen Zeichenblock geprüft
und auf zwei oder mehr Zeichenblöcke aufgeteilt, um die
Zeicheneinheit, die in jedem Zeichenblock enthalten ist, zu
minimieren.
Das Zeichenerkennungssystem gemäß der vorliegenden Erfindung
besitzt desweiteren die Fähigkeit, japanische Schriftzeichen
und Kanji-Schriftzeichen von alphabetischen Schriftzeichen
auf der Grundlage der besonderen Proportionen der japanischen
Schriftzeichen und der Kanji-Schriftzeichen zu unterscheiden,
welche Proportionen sich wesentlich von denen der
alphabetischen Schriftzeichen unterscheiden.
Zur Lösung der genannten Aufgabe wird ein Zeichenerkennungssystem
vorgeschlagen, das ein erstes Mittel zum Gewinnen
eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel zum Extrahieren von Zeichenblöcken,
wobei jeder dieser Zeichenblöcke Bild-Daten individueller
Zeichen in dem Dokument enthält, ein drittes Mittel zum
Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden
eines kombinierten Zeichenblocks, ein viertes Mittel zum
Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten
Zeichenblocks, ein fünftes Mittel zum Durchführen
einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus
und zum Ausgeben eines das erkannte Zeichen kennzeichnenden
Signals sowie ein sechstes Mittel zum Steuern des Betriebs
des dritten, des vierten und des fünften Mittels in einer
derartigen Weise, daß das sechste Mittel wahlweise eines der
dritten und vierten Mittel betreibt, wenn das fünfte Mittel
nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu
erkennen, um auf diese Weise das Erkennen von Zeichen in dem
fünften Mittel mit dem Zeichenblock sicherzustellen, der
durch ein ausgewähltes aus den dritten und vierten Mitteln
gebildet ist, enthält.
Gemäß einer bevorzugten Ausführungsform extrahiert das
zweite Mittel den Zeichenblock derart, daß er eine minimale
Zeicheneinheit enthält. Das zweite Mittel definiert den
Zeichenbereich derart, daß er Ränder hat, die gegen obere,
untere und seitliche Konturen der minimalen Zeicheneinheit
stoßen. Das zweite Mittel erfaßt eine Überlappung zwischen
benachbarten individuellen Zeichen zum getrennten Bilden der
Zeichenblöcke für jeweilige individuelle Zeichen. Außerdem
beseitigt das zweite Mittel Rausch- oder Störanteile in den
Zeichenbild-Daten für jeden der Zeichenblöcke.
In der bevorzugten Ausführungsform der Erfindung ist desweiteren
ein siebtes Mittel zum Erfassen eines vorbestimmten
Zeichens vorgesehen. Das System steuert vorteilhafterweise
die Zeichenerkennungsoperation des fünften Mittels für das
vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus,
der einfacher als der Algorithmus ist, der für andere Zeichen
neben dem vorbestimmten Zeichen benutzt wird.
Für ein weiteres Ausführungsbeispiel ist vorgesehen, daß das
sechste Mittel mit dem zweiten Mittel zum Gewinnen von Historie-
Daten jedes der Zeichenblöcke, die kennzeichnend für
den Verlauf des Prozesses der Extraktion des Zeichenblocks
sind, zum Steuern der Rekombination des Zeichenblocks in dem
dritten Mittel auf der Grundlage der Historie-Daten zusammenwirkt.
Das zweite Mittel enthält dazu eine Vielzahl von
Stufen zum Extrahieren der Zeichenblöcke aus den Dokumentbild-
Daten, und das sechste Mittel enthält Daten, die kennzeichnend
für den Verlauf des Extraktionsprozesses in jedem
aus einer Vielzahl von Zeichenextraktions-Schritten sind.
Außerdem enthält das zweite Mittel eine Stufe zum Segmentieren
jedes von Zeichenfolgenblöcken, eine Stufe zum Segmentieren
jedes der Zeichenblöcke sowie eine Stufe zum Erfassen
von mehr als einer von getrennten, jedoch dicht in
einem einzigen Zeichenblock beieinander liegenden Zeicheneinheiten
zum jeweiligen Zerlegen des Zeichenblocks in mehrere
Zeichenblöcke, die getrennte individuelle Zeicheneinheiten
enthalten. Die Stufe zum Zeichenfolgen-Segmentieren
prüft y-Projektionsprofile der Dokumentbild-Daten zum Auswählen
von Horizontalabtastlinien, die jeweils in einem der
Zeichenfolgenblöcke enthalten sein sollen. Die Stufe zum
Zeichenfolgen-Segmentieren prüft x-Projektionsprofile mit
Bezug auf einen vorbestimmten Schwellenpegel zum Auswählen
von Vertikalabtastlinien, die in dem Zeichenblock enthalten
sein sollen.
Desweiteren ist bevorzugterweise vorgesehen, daß die Stufe
zum Zeichenblock-Segmentieren eine Vielzahl von voneinander
verschiedenen Schwellenpegeln zum Segmentieren des Zeichenblocks
bei unterschiedlichen Genauigkeitsstufen im Segmentieren
der Zeichenblöcke mit einer minimalen Zeicheneinheit
verwendet. Die Stufe zum Trennen der Zeichenblöcke
überprüft die Kontinuität der Zeicheneinheit, die in dem
Zeichenblock enthalten ist, um eine Diskontinuität in der
Zeicheneinheit zum Zerlegen des Zeichenblocks erfassen zu
können. Die Stufe zum Trennen der Zeichenblöcke überprüft die
Kontinuität zwischen benachbarten Bild-Daten, die Bits zum
Erfassen einer Diskontinuität der Zeicheneinheit in dem Zeichenblock
enthalten.
Das zweite Mittel enthält desweiteren vorteilhafterweise
eine Stufe zum Prüfen von y-Projektionsprofilen für die Zeichenbild-
Daten in dem Zeichenblock zum Bestimmen der Höhe
des Zeichenblocks derart, daß obere und untere Ränder des
Zeichenblocks an die oberen und unteren Konturen der Zeicheneinheit
in dem Zeichenblock stoßen.
In Weiterbildung der Erfindung ist ein Zeichenerkennungssystem
vorgesehen, daß ein erstes Mittel zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, ein
zweites Mittel zum Segmentieren von Zeichenblöcken, wobei
jeder dieser Zeichenblöcke Bild-Daten individueller Zeicheneinheiten
enthält und wobei das zweite Mittel eine
Vielzahl von Segmentierungsstufen mit einer ersten Stufe zum
Segmentieren von Zeichenfolgenblöcken und einer zweiten
Stufe zum Segmentieren jedes der Zeichenblöcke, die Zeichenbild-
Daten einer Zeicheneinheit enthalten, aufweist, ein
drittes Mittel zum Rekombinieren zweier oder mehrerer Zeichenblöcke
zum Bilden eines kombinierten Zeichenblocks, ein
viertes Mittel zum Reextrahieren eines Zeichenblocks zum
Bilden eines reextrahierten Zeichenblocks, ein fünftes
Mittel zum Durchführen einer Zeichenerkennung gemäß einem
vorbestimmten Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals sowie ein sechstes
Mittel, das dem zweiten Mittel zum Gewinnen von Segmentierungs-
Daten in bezug auf jeden der Zeichenblöcke, die durch
das zweite Mittel segmentiert wurden, zugeordnet ist, zum
Steuern des Betriebs des dritten, des vierten und des fünften
Mittels auf der Grundlage der Segmentierungs-Daten in
einer derartigen Weise, daß das sechste Mittel wahlweise
eines der dritten und vierten Mittel in Betrieb setzt, wenn
das fünfte Mittel nicht in der Lage ist, ein Zeichen in dem
Zeichenblock zu erkennen, um auf diese Weise das Erkennen
von Zeichen in dem fünften Mittel mit dem Zeichenblock sicherzustellen,
der durch ein ausgewähltes der dritten und
vierten Mittel gebildet ist, enthält.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem vorgesehen, das ein erstes Mittel
Aufnehmen eines Bildes von einem Dokument und Erzeugen eines
Videosignals, das Bild-Daten des Dokuments enthält, ein
zweites Mittel zum Gewinnen einer Vielzahl von Zeichenblöcken,
wobei jeder dieser Zeichenblöcke Bild-Daten eines
individuellen Zeichens in dem Dokument enthält und wobei das
zweite Mittel eine Vielzahl von Segmentierungsstufen mit
einer ersten Stufe zum Segmentieren von Zeichenfolgenblöcken,
einer zweiten Stufe zum Segementieren jedes Zeichenblocks,
der Zeichenbild-Daten einer Zeicheneinheit enthält,
und einer dritten Stufe zum Überprüfen der Kontinuität
von Bild-Daten, die Bits in jedem Zeichenblock zum Erfassen
einer Diskontinuität enthalten, um die Zeichenblöcke in
mehrere Zeichenblöcke zu zerlegen, um so Zeichenblöcke zu
erhalten, die jeweils eine minimale Zeicheneinheit enthalten,
aufweist, ein drittes Mittel zum Rekombinieren zweier
oder mehrerer Zeichenblöcke zum Bilden eines kombinierten
Zeichenblocks, ein viertes Mittel zum Reextrahieren eines
Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel zum Durchführen einer Zeichenerkennung
gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines
das erkannte Zeichen kennzeichnenden Signals sowie ein
sechstes Mittel zum Steuern des Betriebs des dritten, des
vierten und des fünften Mittels in einer derartigen Weise,
daß das sechste Mittel wahlweise eines der dritten und
vierten Mittel in Betrieb setzt, wenn das fünfte Mittel
nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu
erkennen, um auf diese Weise das Erkennen von Zeichen in dem
fünften Mittel mit dem Zeichenblock sicherzustellen, der
durch ein ausgewähltes der dritten und vierten Mittel gebildet
ist, enthält.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem vorgesehen, das ein erstes Mittel
zum Aufnehmen des Bildes eines Dokuments und Erzeugen eines
Videosignals, das Bild-Daten des Dokuments enthält, ein
zweites Mittel zum Gewinnen einer Vielzahl von Zeichenblöcken,
wobei jeder dieser Zeichenblöcke Bild-Daten individueller
Zeichen in dem Dokument enthält und wobei das
zweite Mittel eine Vielzahl von Segmentierungsstufen mit
einer ersten Stufe zum Segmentieren von Zeichenfolgenblöcken,
einer zweiten Stufe zum Segmentieren jedes Zeichenblocks,
der Zeichenbild-Daten einer Zeicheneinheit enthält,
und einer dritten Stufe zum Überprüfen der Kontinuität
von Bild-Daten, die Bits innerhalb jedes Zeichenblocks zum
Erfassen einer Diskontinuität enthalten, um Zeichenblöcke in
mehrere Zeichenblöcke zu zerlegen, die jeweils eine minimale
Zeicheneinheit enthalten, aufweist, ein drittes Mittel zum
Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden
eines kombinierten Zeichenblocks, ein viertes Mittel zum
Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten
Zeichenblocks, ein fünftes Mittel zum Durchführen
einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus
und zum Ausgeben eines das erkannte Zeichen kennzeichnenden
Signals sowie ein sechstes Mittel, das dem zweiten Mittel
zum Gewinnen von Segmentierungshistorie-Daten in bezug auf
zumindest die zweite und die dritte Segmentierungsstufe, die
durch das zweite Mittel ausgeführt werden, zugeordnet ist,
welche Segmentierungshistorie-Daten kennzeichnend für den
Verlauf der Segmentierung der Zeichenblöcke in jeder der
zweiten und dritten Stufen sind, zum Steuern des Betriebs
des dritten, des vierten und des fünften Mittels auf der
Grundlage der Segmentierungs-Daten in einer derartigen Weise,
daß das sechste Mittel wahlweise eines der dritten und
vierten Mittel in Betrieb setzt, wenn das fünfte Mittel
nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu
erkennen, um auf diese Weise das Erkennen von Zeichen in dem
fünften Mittel mit dem Zeichenblock sicherzustellen, der
durch ein ausgewähltes der dritten und vierten Mittel gebildet
ist, enthält.
In einem bevorzugten Verfahren zum Betrieb des erfindungsgemäßen
Zeichenerkennungssystems ist vorgesehen, daß das
sechste Mittel abwechselnd hohe logische Pegel (HIGH) und
niedrige logische Pegel (LOW) für Zeichenblöcke setzt, die
durch jede der zweiten und dritten Segmentierungsstufen
segmentiert werden, um Daten für die Segmentierungshistorie
zu bilden.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Verfahren zum Erkennen von Zeichen, die in einem Dokument
enthalten sind, vorgesehen, das Schritte zum Aufnehmen des
Bildes eines Dokuments und Erzeugen eines Videosignals, das
Bild-Daten des Dokuments enthält, zum Extrahieren von Zeichenblöcken,
von denen jeder Bild-Daten von individuellen
Zeichen in dem Dokument enthält, zum Rekombinieren zweier
oder mehrerer Zeichenblöcke zum Bilden eines kombinierten
Zeichenblocks, zum Reextrahieren eines Zeichenblocks zum
Bilden eines reextrahierten Zeichenblocks, zum Durchführen
einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus
und Ausgeben eines das erkannte Zeichen kennzeichnenden
Signals sowie zum Steuern des Betriebs in dem Schritt zum
Rekombinieren, in dem Schritt zum Reextrahieren und in dem
Schritt zum Zeichenerkennen in einer Weise, daß der Schritt
zum Rekombinieren, der Schritt zum Reextrahieren und der
Schritt zum Zeichenerkennen wahlweise durchgeführt wird, um
ein Erkennen von Zeichen durch Wiederholen des Schritts zum
Rekombinieren, des Schritts zum Reextrahieren und des
Schritts zum Zeichenerkennen sicherzustellen, enthält.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem mit Mitteln zum Gewinnen eines Videosignals,
das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-Daten
eines individuellen Zeichens in dem Dokument enthält, und
Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals vorgesehen, das durch Zeichenblock-
Extraktionsmittel mit einem ersten Mittel zum
Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitstufe
zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke
bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten
Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine
höhere Genauigkeit als die erste Genauigkeitsstufe hat,
gekennzeichnet ist.
In einer bevorzugten erfindungsgemäßen Anordnung ist vorgesehen,
daß das erste Mittel den Pegel eines x-Projektionsprofils
jeder von Zeichenfolgen mit einem ersten Schwellenpegel
zum Extrahieren jedes der Zeichenblöcke bei einer
ersten Genauigkeitsstufe vergleicht und daß das zweite Mittel
den Pegel des x-Projektionsprofils mit einem zweiten
Schwellenpegel, der höher als der erste Schwellenpegel
liegt, zum Extrahieren der Zeichenblöcke bei einer zweiten
Genauigkeitsstufe vergleicht.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals vorgesehen, das durch Zeichenblock-
Extraktionsmittel mit einem ersten Mittel zum
Extrahieren jedes der Zeichenblöcke und einem zweiten Mittel
zum Überprüfen der Kontinuität von Bild-Daten, die Bits mit
dem Pegel HIGH ("1") enthalten, in jedem der Zeichenblöcke
zum Erfassen einer Diskontinuität der Bits mit dem Pegel
HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um
den Zeichenblock, der in dem ersten Mittel extrahiert wurde,
in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-
Daten enthält, die Bits mit dem Pegel HIGH ("1")
aufweisen, die eine Kontinuität mit benachbarten Bits mit
dem Pegel HIGH ("1") haben, gekennzeichnet ist.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals vorgesehen, das durch Zeichenblock-
Extraktionsmittel mit einem ersten Mittel zum
Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Mittel zum Extrahieren jedes der
Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine
höhere Genauigkeit als die erste Genauigkeitsstufe hat, und
einem dritten Mittel zum Aufzeichnen oder Speichern von
Extraktionshysterese-Daten in bezug auf jeden der Zeichenblöcke
während der Extraktionsoperation in dem ersten und
dem zweiten Mittel, welche Extraktionshysterese-Daten bei
der Zeichenerkennung durch das Zeichenerkennungsmittel benutzt
werden, gekennzeichnet ist.
Gemäß der bevorzugten Anordnung ist vorgesehen, daß das
erste Mittel den Pegel eines x-Projektionsprofils jeder von
Zeichenfolgen mit einem ersten Schwellenpegel zum Extrahieren
jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe
vergleicht und daß das zweite Mittel den Pegel
des x-Projektionsprofils mit einem zweiten Schwellenpegel,
der höher als der erste Schwellenpegel liegt, zum Extrahieren
der Zeichenblöcke bei einer zweiten Genauigkeitsstufe
vergleicht. Die Extraktionshysterese-Daten, die durch das
dritte Mittel aufgezeichnet oder gespeichert werden, sind
kennzeichnend für den Verlauf der Extraktion in jedem der
ersten und zweiten Mittel. Das dritte Mittel weist jeweils
einen Speicherplatz für jedes Bit zum Speichern der Extraktionshysterese-
Daten in jedem der ersten und zweiten Mittel
in Form eines Binärcodes auf.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals vorgesehen, das durch ein
Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder
Bild-Daten betreffend ein Einheitszeichen enthält, mit einem
ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei
einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-
Daten und einem zweiten Schritt zum Extrahieren
jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe
zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite
Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe
hat, gekennzeichnet ist.
Eine andere Weiterbildung der Erfindung sieht ein Zeichenerkennungssystem
mit Mitteln zum Gewinnen eines Videosignals,
das Bild-Daten eines Dokuments enthält, Mitteln zum Extrahieren
von Zeichenblöcken, wovon jeder Bild-Daten eines
individuellen Zeichens in dem Dokument enthält, und Mitteln
zum Durchführen einer Zeichenerkennung auf der Grundlage von
Extraktionsdaten, die durch die Zeichenblock-Extraktionsmittel
gewonnen wurden, gemäß einem vorbestimmten Algorithmus
und zum Ausgeben eines das erkannte Zeichen kennzeichnenden
Signals vor, das durch ein Verfahren zum Extrahieren
der Zeichenblöcke, wovon jeder Bild-Daten betreffend ein
Einheitszeichen enthält, mit einem ersten Schritt zum Extrahieren
jedes der Zeichenblöcke und einem zweiten Schritt
zum Überprüfen der Kontinuität von Bild-Daten, die Bits mit
dem Pegel HIGH ("1") enthalten, in jedem Zeichenblock zum
Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH
("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den
betreffenden Zeichenblock, der in dem ersten Schritt extrahiert
wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon
jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel
HIGH ("1") bestehen, die eine Kontinuität mit benachbarten
Bits mit dem Pegel HIGH ("1") aufweisen, gekennzeichnet ist.
Gemäß einer anderen Weiterbildung der Erfindung ist ein
Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals vorgesehen, das durch ein
Verfahren zum Extrahieren der Zeichenblöcke, wovon jeder
Bild-Daten entsprechend einem Einheitszeichen enthält, mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke
bei einer ersten Genauigkeitstufe, einem zweiten Schritt zum
Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe,
die eine höhere Genauigkeit als die der
ersten Genauigkeitsstufe aufweist, und einem dritten Schritt
zum Aufzeichnen oder Speichern von Extraktions-hysterese-
Daten in bezug auf jeden Zeichenblock während der Extraktionsoperation
in dem ersten und dem zweiten Schritt gekennzeichnet
ist, wobei die Extraktionshysterese-Daten in
dem Zeichenerkennungsprozeß, der durch das Zeichenerkennungsmittel
ausgeführt wird, benutzt werden.
Die Extraktionshysterese-Daten, die in dem dritten Schritt
aufgezeichnet oder gespeichert werden, sind kennzeichnend
für den Verlauf der Extraktion in jedem der ersten und
zweiten Schritte. In dem dritten Schritt werden alle der
Extraktionshysterese-Daten in jedem der ersten und zweiten
Schritte in jeweils einem Speicherplatz für jedes der Bits
dieser Daten in Form eines Binärcodes gespeichert.
Die vorliegende Erfindung wird zu ihrem besseren Verständnis
im folgenden anhand mehrerer Figuren, die bevorzugte Ausführungsbeispiele
für die Erfindung betreffen, im einzelnen
beschrieben, wobei die Erfindung keinesfalls auf die gezeigten
und beschriebenen Ausführungsbeispiele beschränkt
ist.
Fig. 1 zeigt ein schematisches Blockschaltbild, das den
allgemeinen Aufbau eines Zeichenerkennungssystems
gemäß der vorliegenden Erfindung verdeutlicht.
Fig. 2 zeigt eine erläuternde Darstellung, aus der die Art
und Weise der Abtrennung von Zeichenfolgen zum Aufnehmen
von Zeichenfolgen-Daten von einer Dokumentvorlage
hervorgeht.
Fig. 3 (A) u. 3 (B) zeigen eine Darstellung der Art und
Weise einer Zeichenfolgenblock-Segmentierung, die
in einer Bereichssegmentierungs-Stufe in dem bevorzugten
Ausführungsbeispiel für das Zeichenerkennungssystem
gemäß Fig. 1 durchzuführen ist, wobei
Fig. 3 (A) ein y-Projektionsprofil eines Textbereichs
AR gemäß Fig. 2 und Fig. 3 (B) Zeichenfolgenblock-
Segmentierungs-Daten, die aus dem
y-Projektions-Profil gemäß Fig. 3 (A) gewonnen
worden sind, zeigt.
Fig. 4 zeigt ein Blockschaltbild einer Zeichenerkennungs-
Stufe in dem bevorzugten Ausführungsbeispiel für das
Zeichenerkennungssystem gemäß der vorliegenden Erfindung.
Fig. 5 (A), 5 (B1), 5 (B2), 5 (C1) u. 5 (C2) zeigen Darstellungen
der Art einer vorläufigen Zeichenblock-
Segmentierung, die in einer ersten Unterstufe
in der Zeichenerkennungs-Stufe gemäß Fig. 4 durchzuführen
ist, wobei Fig. 5 (A) Beispiele für Zeichen
zeigt, die in einem Zeichenfolgenblock enthalten
sind, Fig. 5 (B1) u. 5 (C1) identische x-Projektionsprofile
zeigen und Fig. 5 (B2) u. 5 (C2) jeweils
einen Segmentierungsblock kennzeichnende Signale
zeigen, die in einer Grob-Segmentierung und einer
Fein-Segmentierung gewonnen wurden, welche in der
ersten Unterstufe ausgeführt wurde.
Fig. 6 (A) u. 6 (B) zeigen ein Beispiel für ein überlappendes
Zeichen und das x-Projektionsprofil desselben.
Fig. 7 (A) u. 7 (B) zeigen eine Darstellung der Art und
Weise der Trennung von Zeichenblöcken, die ein
überlappendes Zeichen enthalten.
Fig. 8 (A) u. 8 (B) zeigen eine Darstellung, aus der die
Arbeitsweise einer dritten Unterstufe in der
Zeichenblocksegmentierungs-Stufe innerhalb der Zeichenerkennungs-
Stufe gemäß Fig. 4 hervorgeht.
Fig. 9 zeigt ein Flußdiagramm, aus dem die Art und Weise
der Kombination von voneinander getrennten Zeichenkomponenten
beim Erkennen von japanischen oder chinesischen
Schriftzeichen hervorgeht.
Fig. 10 u. Fig. 11 zeigen Darstellungen der Art und Weise,
wie japanische Schriftzeichen und alphabetische, im
vorliegenden Fall lateinische Schriftzeichen voneinander
getrennt werden.
Fig. 12 zeigt eine Darstellung, aus der der Aufbau von
voneinander getrennten Daten hervorgeht, die in
einem Speicher für solche Daten in einer Zeichenerkennungs-
Stufe gemäß Fig. 2 gespeichert sind.
Fig. 13 zeigt eine Darstellung, aus der das Verhältnis von
vertikalen zu horizontalen Längen eines Abtrennungsbereichs
zum Trennen individueller Zeichen
voneinander hervorgeht.
Fig. 14 zeigt eine Darstellung, aus der der Aufbau von Abtrennungspositions-
Daten hervorgeht.
Fig. 15 u. Fig. 16 zeigen jeweils eine Darstellung, aus der
Abtrennungs- oder Segmentierungshistorie-Daten bzw.
ein schematisches Bild derselben hervorgeht.
Fig. 17 zeigt ein Flußdiagramm, aus dem die Prozedur der
Zeichenerkennung hervorgeht, die durch die Zeichenerkennungs-
Stufe auszuführen ist.
Wie Fig. 1 zeigt, ist das bevorzugte Ausführungsbeispiel für
das erfindungsgemäße Zeichenerkennungssystem mit einem Dokumentleser
2 versehen, der ein Dokument optisch abtastet
oder liest und Dokumentbild-Daten S 1 erzeugt. Das Zeichenerkennungssystem
ist mit dem Dokumentleser zum Aufnehmen der
Dokumentbild-Daten verbunden, um die Dokumentbild-Daten zu
verarbeiten, um auf diese Weise die Bild-Daten der betreffenden
Zeichen in einen computergerechten Code, beispielsweise
den ASCII-Code, umzusetzen. Das Zeichenerkennungssystem
enthält einen Bereichssegmentierungs-Abschnitt 3, der
mit dem Dokumentleser 2 verbunden ist. Daher können die
Dokumentbild-Daten S 1, die von dem Dokumentleser erzeugt
werden, zu dem Bereichssegmentierungs-Abschnitt 3 übertragen
werden.
Der Bereichssegmentierungs-Abschnitt 3 enthält eine Schräglagennormalisierungs-
Stufe 4. In der Schräglagennormalisierungs-
Stufe 4 werden Rausch- oder Störanteile in den Dokumentbild-
Daten S 1 ausgefiltert, und eine ggf. vorhandene
Schräglage des Dokuments in bezug auf ein x-/y-Achsen-Koordinatensystem
des Zeichenerkennungssystems wird normalisiert
oder kompensiert. In dem gezeigten Ausführungsbeispiel erstreckt
sich die x-Achse des Koordinatenssystems des Zeichenerkennungssystems
in horizontaler Richtung, und die y-
Achse desselben erstreckt sich in vertikaler Richtung. Das
bedeutet, daß sich die x-Achse des Koordinatensystems parallel
zu horizontalen Abtastlinien und die y-Achse parallel
zu vertikalen Abtastlinien erstreckt, wenn die Schräglage
des Dokumentbildes normalisiert worden ist.
In der Schräglagennormalisierungs-Stufe werden schräglagennormalisierte
Bilddaten S 2 erzeugt, die zu einer Zeichenfolgen-
Blocksegmentierungs-Stufe 5 übertragen werden. In der
Zeichenfolgen-Blocksegmentierungs-Stufe 5 wird ein Textbereich
oder werden Textbereiche zunächst von einem Graphikbereich,
der Graphikbilder enthält, oder Graphikbereichen, wie
beispielsweise Photographien, Illustrationen, Zeichnungen
usw., unterschieden. Da ein Graphikbild in dem Dokumentbild
in Form von Rausch- oder Störanteilen bei der Zeichenerkennung
wirken kann, müssen die entsprechenden Graphikbild-
Daten vor dem Eingeben von Daten in eine Zeichenerkennungs-
Stufe beseitigt werden. Eine erforderliche Textbereichsextraktion
wird in einer an sich bekannten Art und Weise
durchgeführt, um Textbereiche AR (wie in Fig. 2 gezeigt) zu
extrahieren. Daher wird in einer Textbereichsextraktions-
Operation, die in der Zeichenfolgen-Blocksegmentierungs-
Stufe 5 durchgeführt wird, der Textbereich AR, der ein
Textbild enthält, definiert, und es werden die entsprechenden
Bild-Daten in dem Textbereich extrahiert. Auf diese
Weise werden Textbild-Daten erzeugt.
Die Textbild-Daten werden dann zum Zwecke einer Zeichenfolgen-
Blocksegmentierung in der Zeichenfolgen-Blocksegmentierungs-
Stufe 5 verarbeitet. In der vorliegenden Beschreibung
wird das Wort "Zeichenfolge" verwendet, um eine Folge
von Zeichen, die horizontal in einer einzigen Zeile des
Textes enthalten sind, zu bezeichnen. Zum Segmentieren von
Zeichenfolgenblöcken AR 1, AR 2 . . . werden Vertikalprojektionsprofile
(wie in Fig. 3 gezeigt) gewonnen. Im folgenden
Beschreibungsteil werden die Vertikalprojektionsprofile, die
in Fig. 3 (A) gezeigt sind, als "y-Projektionssignal S y "
bezeichnet. Wie ersichtlich, enthält das y-Projektionssignal
S y einen Signalwert oder Signalinhalt, der repräsentativ für
eine Anzahl von "schwarzen" Bits oder Bits mit dem logischen
Pegel HIGH ("1") ist, die ein "Schwarzbild" beinhaltet, auf
der korrespondierenden Horizontalabtastlinie. Daher wird der
Wert des y-Projektionssignals S y , das mit den Horizontalabtastlinien
korrespondiert, die in einem Zeilenzwischenraum
zwischen Zeichenfolgen positioniert ist und demzufolge kein
Bit mit dem logischen Pegel HIGH ("1") aufweist, Null, um es
von Horizontalabtastlinien, die in dem Zeichenfolgenbereich
liegen, und denjenigen, die in einem Leerstellenbereich, wie
beispielsweise in Zeilenzwischenräumen, liegen, unterscheiden
zu können. In der Zeichenfolgen-Blocksegmentierungs-
Stufe 5 wird daher der y-Projektionssignal-Wert geprüft.
Eine Reihe von Horizontallinien, die mit y-Projektionssignalen
S y korrespondieren, welche Werte größer Null haben,
wird beispielsweise als ein Zeichenfolgenblock AR 1, AR 2. . .
betrachtet. Auf der Grundlage dieser Voraussetzung werden
Zeichenfolgen-Blocksegmentierungs-Daten CL (wie in Fig. 3
(B) gezeigt) durch die Zeichenfolgen-Blocksegmentierungs-
Stufe 5 erzeugt. Die Zeichenfolgen-Blocksegmentierungs-Daten
CL haben den logischen Pegel HIGH (logische "1") in dem
Bereich, der mit dem Zeichenfolgenblock korrespondiert, und
den logischen Pegel LOW (logische "0") in dem Bereich, der
mit dem Zeilenzwischenraum zwischen Zeichenfolgenblöcken
korrespondiert. In der Zeichenfolgen-Blocksegmentierungs-
Stufe 5 werden daher die Horizontalabtastlinien, die Textbild-
Daten enthalten, welche mit den Zeichenfolgenblöcken
korrespondieren, extrahiert und als Zeichenfolgenblockbild-
Daten S 3 basierend auf den Zeichenfolgen-Blocksegmentierungs-
Daten CL ausgegeben.
Die Zeichenfolgenblockbild-Daten S 3 werden in einer Feinjustierungs-
Stufe 6 verarbeitet. In der Feinjustierungs-Stufe
6 wird eine Feinjustierung der Zeichenorientierung zum
Zwecke einer Schräglagennormalisierung und eine erneute
Rausch- oder Störanteilausfilterung durchgeführt. Die Zeichenfolgenblockbild-
Daten S 3, für die die Feinjustierung und
die Rausch- oder Störanteilausfilterung ausgeführt wird,
werden an einen Zeichenerkennungs-Abschnitt 7, der weiter
unten hauptsächlich anhand von Fig. 4 beschrieben wird, als
Bereichssegmentierungs-Daten S 4 ausgegeben.
Es ist ersichtlich, daß die Bereichssegmentierungs-Daten S 4
im wesentlichen Bild-Daten in den Horizontalabtastlinien in
den Zeichenfolgenblöcken enthalten, die in der Zeichenfolgen-
Blocksegmentierungs-Stufe 5 segmentiert wurden. Jeder
Zeichenfolgenblock AR 1, AR 2 . . . hat eine Höhe, die durch die
höchste grobdefinierte obere Kontur und die niedrigste
grobdefinierte untere Kontur der Zeichen darin bestimmt ist.
Die Höhe des Zeichenfolgenblocks AR 1, AR 2 . . ., der auf diese
Weise definiert ist, wird im folgenden als "Zeichenfolgenhöhe"
bezeichnet.
Die Struktur des Zeichenerkennungs-Abschnitts 7 ist im einzelnen
in Fig. 4 gezeigt. Der Zeichenerkennungs-Abschnitt 7
führt allgemein eine Segmentierung zum Extrahieren von
Bilddaten jedes der individuellen Zeichen und eine Zeichenerkennung
durch Vergleichen der Struktur, die durch die
Bild-Daten des segmentierten Zeichens gekennzeichnet ist,
mit vorhandenen Zeichendaten aus. In dem bevorzugten Ausführungsbeispiel
für das Zeichenerkennungssystem gemäß der
vorliegenden Erfindung kann eine Resegmentierung des Zeichens
oder ein Kombinieren zweier oder mehrerer Zeichenblöcke
zum Erkennen von getrennten Zeichen durchgeführt
werden. Um ein Resegmentieren und/oder Kombinieren zweier
oder mehrerer Zeichenblöcke zu ermöglichen, wird die Segmentierungshistorie
des betreffenden Zeichensegmentierungsprozesses
gespeichert.
Wie in Fig. 4 gezeigt, enthält der Zeichenerkennungs-Abschnitt
7 eine Zeichenblocksegmentierungs-Stufe 11, eine
Zeichenblockkombinierungs-Stufe 18, eine Zeichenerkennungs-
Stufe 23, eine Parametercodierungs-Stufe 30, eine Segmentierungshistoriecodierungs-
Stufe 35 und eine Resegmentierungs-
Stufe 40. In dem Zeichenerkennungs-Abschnitt 7 ist ein
Datenspeicher 25 zum Speichern der Segmentierungs-Daten
enthalten. Auf der Grundlage der Segmentierungs-Daten, die
in dem Datenspeicher 25 gespeichert sind, werden Operationen
der Zeichenblockkombinierungs-Stufe 18, der Zeichenerkennungs-
Stufe 23 und der Resegmentierungs-Stufe 40 gesteuert.
Die Zeichenblocksegmentierungs-Stufe 11 enthält eine erste,
eine zweite und eine dritte Unterstufen 12, 13 u. 14. Die
Zeichenblocksegmentierung wird durch diese ersten, zweiten
und dritten Unterstufen 12, 13 u. 14 zum Extrahieren von
Zeichenbild-Daten durchgeführt. Im wesentlichen werden die
Zeichenbild-Daten, die in der Zeichenblocksegmentierungs-
Stufe 11 extrahiert werden, zur Zeichenerkennung in der
Zeichenerkennungs-Stufe 23 verwendet. Wenn eine Zeichenerkennung
nicht durchgeführt werden kann, nachdem die Zeichenbild-
Daten in der Zeichensegmentierungs-Stufe 11 extrahiert
wurden, wird ein Kombinieren von Zeichenblöcken zum erneuten
Durchführen einer Zeichenerkennung in der Zeichenerkennungs-
Stufe 23 unter Verwendung des Zeichenbildes der kombinierten
Zeichenblöcke vorgenommen. Andererseits wird, wenn
die Zeichenerkennung nicht vorgenommen werden kann, eine
Resegmentierung des Zeichenblocks in der Resegmentierungs-
Stufe 40 durchgeführt.
Im folgenden wird jeder Teil des Zeichenerkennungs-Abschnitts
7 in getrennten Beschreibungsteilen im einzelnen
beschrieben.
Der Zeichenerkennungs-Abschnitt 7 ist mit dem Bereichssegmentierungs-
Abschnitt 3 durch die erste Unterstufe 12 der
Zeichenblocksegmentierungs-Stufe 11 verbunden. Daher werden
die Bereichssegmentierungs-Daten S 4 in die erste Unterstufe
12 eingegeben. In der ersten Unterstufe 12 findet als erstes
eine vorläufige Zeichenblocksegmentierung statt. Um zuerst
die Blocksegmentierung in der ersten Unterstufe 12 der Zeichenblocksegmentierungs-
Stufe 11 durchzuführen, wird ein
Vertikalprojektionsprofil, das im folgenden als "x-Projektionsprofil"
oder "x-Projektionssignal S x " bezeichnet wird,
gewonnen. Die Art des x-Projektionssignals S x und dessen
Wellenform ist beispielsweise Fig. 5 zu entnehmen. Ähnlich
dem zuvor in bezug auf die Zeichenfolgenblocksegmentierung
erläuterten y-Projektionssignal S y hat das x-Projektionssignal
S x einen Wert, der mit der Anzahl der Bits mit dem
logischen Pegel HIGH ("1") auf der entsprechenden vertikalen
Abtastlinie korrespondiert. Daher wird, wenn die vertikale
Abtastlinie Zeichenbild-Daten enthält und demzufolge ein Bit
oder Bits aufweist, das oder die den logischen Pegel HIGH
("1") aufweist oder aufweisen, der Wert des x-Projektionssignals
S x in diesem Fall größer Null. Andererseits existiert,
wenn sich die vertikale Abtastlinie durch den Zwischenraum
zwischen individuellen Zeichen erstreckt, kein Bit
mit dem logischen Pegel HIGH. Daher wird der Wert des x-
Projektionssignals S x Null.
In dem Beispiel gemäß Fig. 5 sind ein Kanji-Zeichen (chinesisches
Schriftzeichen) auf der linken Seite und japanische
Schriftzeichen, vergl. Fig. 5 (A), in dem n-ten Zeichenfolgenblock
ARN enthalten. Diese Zeichen bilden in Kombination
ein japanisches Wort der Bedeutung "geeignet" oder "angepaßt".
x-Projektionssignale S x dieser Zeichen sind in Fig. 5
(B1) u. Fig. 5 (C1) gezeigt. Gemäß der vorliegenden Erfindung
wird empfohlen, eine Vielzahl von Schwellenpegeln zum
Durchführen von vorläufigen Zeichenblocksegmentierungen bei
verschiedenen Segmentierungs-Genauigkeitsstufen durchzuführen.
Im allgemeinen ist der Pegel des x-Projektionssignals
in dem horizontalen Mittenabschnitt jedes Zeichenblocks
höher als in den horizontalen Endabschnitten. Demzufolge
verringert sich der Pegel des x-Projektionssignals S x in
Richtung auf die Seitenkonturen der Zeichen. Daher ändert
sich durch das Durchführen der vorläufigen Zeichenblocksegmentierung
mit unterschiedlichen Schwellenpegeln die Breite
des extrahierten Zeichenblocks. Dieser Umstand wird vorteilhafterweise
ausgenutzt, wenn die Zwischenräume zwischen
benachbarten individuellen Zeichen besonders schmal sind. In
anderen Worten ausgedrückt heißt dies, daß wenn Zeichen
besonders dicht beieinander angeordnet sind, zwei oder mehr
Zeichen in dem vorläufig segmentierten Zeichenblock enthalten
sein können, wenn die Segmentierung nur mit dem Schwellenpegel
des Wertes Null durchgeführt wird. Die Zeichen, die
in dichter Anordnung stehen und sehr schmale oder im wesentlichen
keine Abstände zwischen sich aufweisen, werden im
folgenden als "überlappende Zeichen" bezeichnet. Durch Verwendung
eines Schwellenpegels, der größer Null ist, hat ein
Abschnitt des Zeichens, dessen korrespondieres Bit oder
dessen korrespondierende Bits auf der vertikalen Abtastlinie
liegt oder liegen, einen x-Projektionssignalwert, der kleiner
als oder gleich dem Schwellenpegel ist.
In dem gezeigten Ausführungsbeispiel werden höhere und niedrigere
Schwellenpegel TH 1 und TH 0 für die Blocksegmentierung
verwendet. Der höhere Schwellenpegel TH 1 ist auf den
Wert "1" eingestellt. Andererseits hat der Schwellenpegel
TH 0 den Wert "0". Daher findet in dem gezeigten Ausführungsbeispiel
die vorläufige Zeichenblocksegmentierung bei
den höheren und den niedrigeren Schwellenpegeln TH 1 und TH 0
statt. In dem folgenden Beschreibungsteil wird der Zeichenblock,
der durch eine Zeichenblocksegmentierung segmentiert
wird, die den niedrigeren Schwellenpegel TH 0 verwendet, als
"Block mit breiterem Zeichen" bezeichnet. In ähnlicher Weise
wird der Zeichenblock, der durch eine Zeichensegmentierung
mit dem höheren Schwellenpegel TH 1 segmentiert wird, im
folgenden als "Block mit schmalerem Zeichen" bezeichnet. Es
sei ferner angemerkt, daß die vorläufige Zeichenblocksegmentierung,
die den unteren Schwellenpegel TH 0 verwendet, im
folgenden als "grobe Segmentierung" bezeichnet wird. Außerdem
wird die vorläufige Zeichensegmentierung mit dem höheren
Schwellenpegel TH 1 im folgenden als "genaue Segmentierung"
bezeichnet.
Bei der groben Segmentierung für den Zeichenfolgenblock ARN
gemäß Fig. 5 wird das x-Projektionssignal S x mit dem niedrigeren
Schwellenpegel TH 0 verglichen. Als Ergebnis wird ein
die grobe Blocksegmentierung kennzeichnendes Signal DT 1,
vergl. Fig. 5 (B2), erzeugt. Das die grobe Blocksegmentierung
kennzeichnende Signal DT 1 hat den logischen Pegel HIGH
in einem Bereich, der mit der Zeichenblockbreite korrespondiert,
in welcher der x-Projektionssignalwert größer Null
ist. Daher grenzen die seitlichen Ränder jedes Zeichenblocks
an die seitlichen Konturen des korrespondierenden Zeichens.
Andererseits wird bei der genauen Segmentierung das x-Projektionssignal
S x mit dem höheren Schwellenpegel TH 1 verglichen.
Als Ergebnis wird ein die genaue Blocksegmentierung
kennzeichnendes Signals DT 2, vergl. Fig. 5 (C2), erzeugt.
Auf ähnliche Weise wie bei dem zuvor erläuterten, die grobe
Blocksegmentierung kennzeichnenden Signal DT 1 hat das die
genaue Blocksegmentierung kennzeichnende Signal DT 2 den
logischen Pegel HIGH in einem Bereich, der mit dem entsprechenden
schmaleren Zeichenblock korrespondiert, in welchem
das x-Projektionssignal S x einen Wert hat, der größer als
der höhere Schwellenpegel TH 1 ist. Da der höhere Schwellenpegel
TH 1 in dem gezeigten Ausführungsbeispiel auf "1" gesetzt
ist, wird die vertikale Abtastlinie oder werden die
vertikalen Abtastlinien, die nur einen einzigen Block aufweisen
oder Bits mit dem logischen Pegel HIGH hat bzw. haben,
vernachlässigt und außerhalb des Blocks mit schmalerem
Zeichen plaziert, der zu segmentieren ist. Daher hat jeder
Block mit schmalerem Zeichen, der bei der genauen Segmentierung
segmentiert wurde, eine allgemein geringere Blockbreite
im Vergleich mit derjenigen des breiteren Blocks, der bei
der groben Segmentierung segmentiert wurde.
Wie ausgeführt wurde, ist das bevorzugte Ausführungsbeispiel
für ein Zeichenerkennungssystem gemäß der vorliegenden Erfindung
insbesondere für das Erkennen von Zeichen in Texten
bestimmt, die ein Gemisch aus japanischen Schriftzeichen und
alphabetischen, z. B. lateinischen Schriftzeichen, beispielsweise
in englischen, deutschen, französischen Wörtern,
Sätzen oder Absätzen enthalten. Um die japanischen Schriftzeichen
oder Kanji-Schriftzeichen zu erkennen, wird im allgemeinen
eine grobe Segmentierung zu bevorzugen sein, da die
Gesamtbreite des Zeichens innerhalb des korrespondierenden
Zeichenblocks enthalten sein kann. Andererseits wird wegen
der höheren Genauigkeit der Segmentierung zu bevorzugen
sein, für die alphabetischen Schriftzeichen die Zeichenblöcke,
die mit einem einzigen Zeichen korrespondieren,
akkurat zu segmentieren. Wie ausgeführt, können durch Verwendung
der genauen Segmentierung die überlappenden Zeichen
in korrespondierende Zeichenblöcke zerlegt werden. Andererseits
werden im Falle des in Fig. 5 (A) an zweiter Stelle
von rechts dargestellten japanischen Schriftzeichens, das
ein Schriftzeichen mit voneinander getrennten Komponenten
ist, diese Komponenten in getrennte Zeichenblöcke segmentiert,
und zwar sowohl bei der groben Segmentierung als auch
bei der genauen Segmentierung. Derartige getrennte Zeichenkomponenten
enthaltende Zeichenblöcke können durch die Zeichenblockkombinierungs-
Stufe 18 kombiniert werden, die weiter
unten beschrieben wird.
Wie zuvor ausgeführt, werden das Kombinieren zweier oder
mehrerer Zeichenblöcke in der Zeichenblockkombinierungs-
Stufe 18 oder das Resegmentieren, das in der Resegmentierungs-
Stufe 40 auszuführen ist, auf der Grundlage der Historie
der Segmentierung gesteuert. (Die Art und Weise der
Verwendung der Segmentierungshistorie oder der Segmentierungshysterese
jedes der Zeichenblöcke wird weiter unten
beschrieben). Daher werden, um ein Kombinieren von zwei oder
mehr Zeichen und ein Resegmentieren in der Resegmentierungs-
Stufe 40 zu ermöglichen oder freizugeben, das die
grobe Blocksegmentierung kennzeichnende Signal DT 1 und die
Daten sowie das die genaue Blocksegmentierung kennzeichnende
Signal DT 2 in die Segmentierungshistoriecodierungs-Stufe 35
eingegeben, die ebenfalls weiter unten beschrieben wird. Die
Historie-Daten, wie sie durch die Segmentierungshistoriecodierungs-
Stufe 35 codiert wurden, werden in den Datenspeicher
eingegeben. Andererseits werden Videobild-Daten, die in
den segmentierten Zeichenblöcken aufgrund der genauen Segmentierung
enthalten sind, d. h. in einem Block mit schmalerem
Zeichen, in die zweite Unterstufe 13 als vorläufig
segmentierte, den Zeichenblock kennzeichnende Daten S 5 eingegeben.
Die vorläufig segmentierten Zeichen-Daten, die auf diese
Weise in der ersten Unterstufe 12 erzeugt werden, enthalten
Videobild-Daten eines Zeichens, von Zeichen oder Zeichenkomponenten
in dem segmentierten Zeichenblock. Wie aus Fig. 5
ersichtlich, hat der Zeichenblock, der in der ersten Unterstufe
12 segmentiert wurde, eine veränderliche Breite, die
von der Breite der darin befindlichen Zeichen abhängt, und
eine Höhe, die mit der Zeichenfolgenhöhe korrespondiert. Die
vorläufig segmentierten Zeichen-Daten S 5 werden in die
zweite Unterstufe 13 eingegeben. Die zweite Unterstufe 13
ist zum Trennen überlappender Zeichen bestimmt, die in dem
einzigen Zeichenblock enthalten sind, der entweder durch
grobe Segmentierung oder durch genaue Segmentierung gewonnen
wurde.
Ein Beispiel für überlappende Zeichen, die als ein einziges
Zeichen zu segmentieren sind, ist in Fig. 6 (A) gezeigt. In
diesem Beispiel enthält ein einziger Zeichenblock, der durch
die erste Unterstufe 12 segmentiert wurde, alphabetische
Schriftzeichen, nämlich "f" u. "o". Wie aus Fig. 6 (A) ersichtlich,
grenzen die vertikalen Abtastlinien, die auf der
x-Koordinatenlinie X +1 liegen, nämlich in der rechten Seitenkontur
des "f" und in der linken Seitenkontur des "o",
aneinander. Daher weist das x-Projektionssignal S x keinen
Punkt auf, in dem der Signalpegel unter den niedrigeren bzw.
den höheren Schwellenpegel TH 0 bzw. TH 1 bei der groben Segmentierung
bzw. der genauen Segmentierung in der ersten
Unterstufe fällt. Das bedeutet, daß in dem gezeigten Beispiel
der minimale x-Projektionssignalwert bei der vertikalen
Abtastlinie gewonnen wird, die auf der x-Koordinatenlinie
x 0 liegt. Wie zu erkennen, befinden sich bei der vertikalen
Abtastlinie, die auf der Koordinatenlinie x 0 liegt,
vier Bits mit dem logischen Pegel HIGH oder vier "schwarze"
Bits in den betreffenden Koordinatenpositionen x 0, y 3; x 0,
y 4; x 0, y 5; x 0, y 6. Um daher zu erfassen, daß mehr als ein
Zeichen in dem vorläufig segmentierten Zeichenblock enthalten
ist, wird die Kontinuität der Bits des logischen Pegels
HIGH um die vertikale Abtastlinie herum, bei der der minimale
x-Projektionssignalwert gewonnen wurde, geprüft. In dem
gezeigten Ausführungsbeispiel werden die Kontinuitäten der
Bits mit logischem Pegel HIGH auf der vertikalen x -1-Abtastlinie,
der vertikalen x 0-Abtastlinie und der vertikalen
x +1-Abtastlinie geprüft. Wie aus Fig. 6 (A) ersichtlich,
enthält die vertikale x -1-Abtastlinie fünf Bits mit dem
logischen Pegel HIGH, die jeweils bei Koordinatenpositionen
x -1, y 2; x -1, y 3; x -1, y 4; x -1, y 5; x -1, y 6 liegen. Wie
ausgeführt, weist die vertikale x 0-Abtastlinie Bits mit dem
logischen Pegel HIGH bei x 0, y 3; x 0, y 4; x 0, y 5; x 0, y 6 auf.
Andererseits weist die vertikale x +1-Abtastlinie Bits mit
dem logischen Pegel HIGH bei x +1, y 4; x +1, y 5; x +1, y 6; x +1,
y 18; x +1, y 19; x +1, x 20; x +1, y 21; x +1, y 22 auf.
Die Art und Weise der Erfassung einer Diskontinuität in dem
einzigen Zeichenblock kann anhand von Fig. 7 (A) u. Fig. 7
(B) erläutert werden. In dem in Fig. 7 (A) gezeigten Beispiel
liegen Bits mit dem logischen Pegel HIGH jeweils bei
x a1, y a2; x a1, y a3; x a1, y a4; x a2, y a3; x a2, y a4; x a3, y a4;
x a3, y a5; x a3, y a6 vor. In diesem Fall hat jede Abtastlinie
x a1, x a2 u. x a3 zumindest ein Bit mit dem logischen Pegel
HIGH in Kontinuität mit den benachbarten Bits in den benachbarten
vertikalen Abtastlinien. In einem derartigen Fall
wird das Zeichen in dem Zeichenblock so behandelt, als hätte
es Kontinuität, und es wird demzufolge als ein einziges
Zeichen betrachtet. Andererseits sind in dem Beispiel gemäß
Fig. 7 (B) Bits mit dem logischen Pegel HIGH bei x b1, y b3;
x b1, y b4; x b1, y b5; x b2, y b4; x b2, y b5; x b3, y b6; x b4, y b1;
x b4, y b2; x b5, y b1; x b5, y b2; x b5, y b3; x b6, y b2; x b6, y b3
vorhanden. In diesem Fall bilden die Bits mit dem logischen
Pegel HIGH bei x b1, y b3; x b1, y b4; x b1, y b5; x b2, y b4; x b2,
y b5; x b3, y b6 eine erste Zeichenkomponente, und die Bits mit
dem logischen Pegel HIGH bei x b4, y b1; x b4, y b2; x b5, y b1;
x b5, y b2; x b5, y b3; x b6, y b2; x b6, y b3 bilden eine zweite
Zeichenkomponente in dem Zeichenblock. Wie hieraus zu ersehen,
haben die Bits mit dem logischen Pegel HIGH auf der
vertikalen Abtastlinie x b3 keine Verbindung mit den Bits mit
dem logischen Pegel HIGH auf der benachbarten vertikalen
Abtastlinie x b4. Daher wird die Behandlung des Zeichenblocks
so vorgenommen, daß die erste Zeichenblockkomponente und die
zweite Zeichenblockkomponente getrennt werden. Dazu ist es
erforderlich, daß um die Diskontinuität der Komponenten zu
erfassen, benachbarte Bits der benachbarten Abtastlinien in
bezug auf jedes Bit, das den logischen Pegel HIGH hat,
überprüft werden. In dem Beispiel gemäß Fig. 7 (B) hat das
Bit bei x b3, y b5 kein benachbartes Bit mit dem logischen
Pegel HIGH auf der vertikalen x b4-Abtastlinie. Andererseits
hat das Bit mit dem logischen Pegel HIGH bei x b4, y b2 ebenfalls
kein benachbartes Bit mit dem logischen Pegel HIGH auf
der vertikalen x b3-Abtastlinie. Daher hat eine Trennung
zwischen der ersten und der zweiten Zeichenblockkomponente
zwischen den ver 66587 00070 552 001000280000000200012000285916647600040 0002003632832 00004 66468tikalen x b3- und x b4-Abtastlinien zu erfolgen.
Zurückkommend auf Fig. 6 (A) ist festzustellen, daß in dem
Fall des gezeigten Beispiels keine Bits mit dem logischen
Pegel HIGH auf der vertikalen x 0-Abtastlinie benachbart zu
den Bits mit dem logischen Pegel HIGH bei x +1, y 18; x +1,
y 19; x +1, y 20; x +1, y 22; x +1, y 22 vorliegen. Zusätzlich kann
eine Diskontinuität zwischen den Bits bei x +1, y 6 und x +1,
y 18 festgestellt werden. Daher wird der vorläufig segmentierte
Zeichenblock in zwei getrennte Blöcke bei der vertikalen
x +1-Abtastlinie zerlegt.
Wie zuvor ausgeführt, wird in der zweiten Unterstufe 13 der
vorläufig mittels der groben Segmentierung und der genauen
Segmentierung in der ersten Unterstufe 12 segmentierte Zeichenblock
wiederumin schmälere Blöcke segmentiert, um so die
Unmöglichkeit einer Zeichenerkennung aufgrund des Vorhandenseins
von mehr als einem Zeichen in einem einzigen Zeichenblock
zu verhindern.
Es ist ersichtlich, daß ein Bildleser, wie ihn der Dokumentleser
2 darstellt, der in dem Zeichenerkennungssystem
gemäß der vorliegenden Erfindung benutzt wird, dem Einfluß
einer Modulationsverstärkung ausgesetzt ist, die einen
Schwund (fading) bei der Kontur eines Zeichens bewirken
kann, der zu einer Zeichenblocksegmentierung führen kann.
Insbesondere dann, wenn der Text alphabetische Zeichen enthält,
die in einer relativ dichten Anordnung stehen, kann
ein Schwund (fading) der Konturen der Zeichen eine Segmentierung
dahingehend bewirken, daß mehr als ein Zeichen in
einem einzigen Zeichenblock enthalten ist. Dies verursacht
offensichtlich Schwierigkeiten bei der Zeichenerkennung in
der Zeichenerkennungs-Stufe 23. Gemäß dem bevorzugten Ausführungsbeispiel
kann eine derartige Schwierigkeit durch
Ausführen einer trennenden Segmentierung der zweiten Unterstufe
zum Trennen der Zeichenblöcke mittels Überprüfen auf
eine Diskontinuität des Zeichens oder der Zeichenkomponenten
in dem Zeichenblock umgangen werden. Daher wirkt sich die
Benutzung der zweiten Unterstufe in dem bevorzugten Ausführungsbeispiel
für das Zeichenerkennungssystem gemäß der
vorliegenden Erfindung vorteilhaft aus.
Es ist ersichtlich, daß die Kanji-Schriftzeichen und die
japanischen Schriftzeichen von einer Art sind, bei der eine
Diskontinuität in einem einzigen Zeichen gegeben ist, selbst
wenn ein solches Zeichen einen "nichtseparierten" Charakter
hat. Beispielsweise kann das in Fig. 5 (A) auf der linken
Seite gezeigt Kanji-Schriftzeichen offensichtlich in zwei
getrennte Komponenten zerlegt aufgefaßt werden, obwohl sie
zum Zwecke der Zeichenerkennung nicht zu trennen sind. Tatsächlich
werden derartige getrennte Komponenten des Zeichens
in der zweiten Unterstufe 12 getrennt. Indessen können in
dem bevorzugten Ausführungsbeispiel für das erfindungsgemäße
Zeichenerkennungssystem die getrennten Zeichenkomponenten
durch die Zeichenblockkombinierungs-Stufe 18 rekombiniert
werden, die weiter unten beschrieben wird. Daher tritt keine
Schwierigkeit beim Erkennen eines Zeichens durch ein Zerlegen
dieses einzigen Zeichens in zwei oder mehr Zeichenkomponenten
auf.
Auf der Grundlage des Ergebnisses der den Zeichenblock zerlegenden
Segmentierung, die durchgeführt wurde, werden sekundäre
Zeichenbild-Daten S 6 durch die zweite Unterstufe 13
extrahiert. Die sekundären Zeichenbild-Daten S 6 enthalten
Bild-Daten in dem Zeichenblock, der durch die trennende Segmentierung
in der Breite definiert ist. Der Zeichenblock,
der durch die zweite Unterstufe definiert ist, hat eine
Höhe, die mit der Zeichenfolgenhöhe korrespondiert, wie dies
weiter oben ausgeführt wurde.
Während der zuvor erläuterten trennenden Segmentierung in
der zweiten Unterstufe werden die Segmentierungshistorie-
Daten fortlaufend zu der Segmentierungshistoriecodierungs-
Stufe 35 übertragen und in dem Datenspeicher 25 gespeichert.
Die sekundären Zeichenbild-Daten S 6, die in der zweiten Unterstufe
13 gewonnen wurden, werden zu der dritten Unterstufe
übertragen. In der dritten Unterstufe wird eine weitere
Segmentierung zum Bestimmen des oberen und des unteren
Randes des Zeichenblocks bei den Positionen durchgeführt,
die im wesentlichen mit den grobdefinierten oberen und unteren
Konturen jedes individuellen Zeichens korrespondieren.
Um die Segmentierung in der dritten Unterstufe durchzuführen,
wird wiederum ein y-Projektionsprofil PR y mit Bezug auf
jeden individuellen Zeichenblock gewonnen, wie dies in Fig. 8
(A) gezeigt ist. Wie zuvor ausgeführt, hat der Zeichenblock,
wie er durch die zweite Unterstufe 13 definiert ist,
eine Breite, die mit der Breite W x des betreffenden Zeichens
oder der betreffenden Zeichenkomponente korrespondiert, und
eine Höhe W y1, die mit der Zeichenfolgenhöhe korrespondiert.
Um einen Rausch- oder Störanteil auf den vertikalen Abtastlinien
zu beseitigen, wird das y-Projektionsprofil PR y mit
einem gegebenen Schwellenpegel PR th verglichen. In der
Praxis kann der Schwellenpegel PR th in Beziehung zu der
Dicke der Linie bestimmt werden, die das Zeichen darstellt.
Beispielsweise kann der Schwellenpegel PR th ungefähr auf die
Hälfte der Liniendicke des Zeichens eingestellt sein. Als
ein Ergebnis des Vergleichsvorgangs kann in der dritten
Unterstufe ein modifizierter Zeichenblock, der die Breite W x
und die Höhe W y2 hat, die mit der Höhe des Zeichens korrespondiert,
gewonnen werden.
Daher werden die Bild-Daten in dem modifizierten Zeichenblock
im wesentlichen identisch mit denjenigen gehalten, die
in den sekundären Zeichenbild-Daten S 6 enthalten sind, die
durch die zweite Unterstufe gewonnen wurden, ausgenommen
betreffend die Bits für die Leerstelle, in der nur "weiße"
Bits und einen Rausch- oder Störanteil beinhaltende Bits in
oberen und/oder unteren Sonderbereichen in dem Zeichenblock
vorliegen, der durch die zweite Unterstufe segmentiert wurde.
Es sei angemerkt, daß der Zeichenblock, der in der dritten
Unterstufe 14 der Zeichenblocksegmentierungs-Stufe 11 bestimmt
wurde, einen Basiszeichenblock für den Zeichenerkennungsprozeß
bildet, der weiter unten beschrieben wird. Die
Bild-Daten, die in dem Basiszeichenblock enthalten sind,
werden im folgenden als "Basiszeichenbild-Daten S 7" bezeichnet.
Im allgemeinen wird der Zeichenerkennungsprozeß unter
Verwendung der Basiszeichenbild-Daten S 7 in der Zeichenerkennungs-
Stufe 23 durchgeführt.
Die Zeichenblockkombinierungs-Stufe 18 ist zwischen die
Zeichenblocksegmentierungs-Stufe 11, die zuvor beschrieben
wurde, und die Zeichenerkennungs-Stufe 23 eingefügt. Die
Zeichenblockkombinierungs-Stufe 18 enthält eine Diskriminator-
Stufe 20 zum Diskriminieren von Kanji-Schriftzeichen
oder japanischen Schriftzeichen und alphabetischen Schriftzeichen.
Es sei angemerkt, daß arabische Ziffern (1, 2, 3
. . .) und arabische oder oder vergleichbare Schriftzeichen in
dem gezeigten Ausführungsbeispiel für das erfindungsgemäße
Zeichenerkennungssystem wie alphabetische Schriftzeichen
behandelt werden. Die Diskriminator-Stufe 20 ist einer
Schalt-Stufe 21 zugeordnet. Wenn die Beurteilung in der
Diskriminator-Stufe 20 ergibt, daß das durch die Zeichenerkennungs-
Stufe 23 zu erkennende Zeichen ein Kanji-Schriftzeichen
oder ein japanisches Schriftzeichen ist, wird ein
Schalter in der Schalt-Stufe zu einer Klemme SW 1 umgelegt,
um die dritte Unterstufe 14 der Zeichenblocksegmentierungs-
Stufe 11 mit einer Kombinator-Stufe 22 zu verbinden. In der
Kombinator-Stufe 22 wird eine Kombinierungsoperation für die
Basiszeichenblöcke in einer Art und Weise durchgeführt, wie
sie weiter unten beschrieben wird. Als Ergebnis der Kombinierungsoperation
in der Kombinator-Stufe 22 werden kombinierte
Bild-Daten S 8 in die Zeichenerkennungs-Stufe 23 eingegeben.
Andererseits wird, wenn die Beurteilung in der
Diskriminator-Stufe 20 ergibt, daß das Zeichen, das zu erkennen
ist, ein alphabetisches Schriftzeichen ist, der
Schalter in der Schalt-Stufe 21 zu einer Klemme SW 2 umgelegt,
um die dritte Unterstufe 14 der Zeichenblocksegmentierungs-
Stufe 11 direkt mit der Zeichenerkennungs-Stufe 23
zu verbinden. Daher werden in diesem Fall die Basiszeichenbild-
Daten S 7 in die Zeichenerkennungs-Stufe 23 eingegeben.
Die Diskriminator-Stufe 20 ist dazu bestimmt, ein Signal
DTE, das kennzeichnend für die Art des Zeichens (Kanji-
Schriftzeichen oder japanisches Schriftzeichen oder alphabetisches
Schriftzeichen) ist, das in der Zeichenerkennungs-
Stufe 23 erkannt wurde, von der Zeichenerkennungs-
Stufe aufzunehmen. Mit Bezug auf das Signal DTE aus der
Zeichenerkennungs-Stufe 23 wird ein Schaltsteuersignal in
der Diskriminator-Stufe 20 zum Ändern der Schalterstellung
in der Schalt-Stufe 21 erzeugt.
In der Kombinator-Stufe 22 findet eine Basiszeichenblock-
Kombinierungsoperation statt, die in Fig. 9 dargestellt ist.
Grundsätzlich wird die Basiszeichenblock-Kombinierungsoperation
auf der Grundlage der allgemeinen Logik durchgeführt,
daß die Kanji-Schriftzeichen und die japanischen Schriftzeichen
vertikale und horizontale Proportionen, die im folgenden
als "H/W-Verhältnis" bezeichnet werden, aufweisen,
die im wesentlichen oder angenähert den Wert "1" haben. Das
bedeutet, daß wenn der Basiszeichenblock, der durch die
Zeichenblocksegmentierungs-Stufe 11 definiert wurde, ein
H/W-Verhältnis von angenähert 1 hat, die Beurteilung dahingehend
ausfällt, daß der Basiszeichenblock ein einziges, d. h.
ein "Vollkomponenten"-Zeichen enthält. Andererseits
fällt, wenn der Basiszeichenblock, der durch die Zeichenblocksegmentierungs-
Stufe 11 definiert wurde, ein H/W-Verhältnis
hat, das weit größer als 1 ist, die Beurteilung
dahingehend aus, daß der Basiszeichenblock nur eine Zeichenkomponente
enthält, die mit einer anderen in einem folgenden
Basiszeichenblock zu kombinieren ist.
Fig. 9 zeigt den Kombinierungsoperationsprozeß, der in der
Kombinator-Stufe 22 auszuführen ist. Das Programm, das gemäß
dem Flußdiagramm in Fig. 9 ablaufen soll, wird in Reaktion
auf die Basiszeichenbild-Daten S 7 aus der Zeichenblocksegmentierungs-
Stufe 11 inganggesetzt. Nach dem Starten des
Programms in einem Schritt SP 1 wird das H/W-Verhältnis des
Basiszeichenblocks, der durch die Basiszeichenbild-Daten S 7
definiert ist, in einem Schritt SP 2 geprüft. Wenn das H/W-
Verhältnis des Basiszeichenblocks angenähert 1 ist, setzt
sich das Programm zu seinem Ende in einem Schritt SP 3 fort.
Andererseits wird, wenn der Basiszeichenblock ein H/W-Verhältnis
hat, das sich von 1 stark unterscheidet, wie dies in
dem Schritt SP 2 geprüft wurde, der Prozeß in einem Wartezustand
zum Warten auf die nächste Eingabe von Basiszeichenbild-
Daten S 7 aus der Zeichenblocksegmentierungs-Stufe 11 in
einem Schritt SP 4 gehalten. Die Prozeßoperation wird in
Reaktion auf die Eingabe nachfolgender Basiszeichenbild-
Daten S 7 wiederholt, um die zuletzt eingegebenen Zeichenbild-
Daten mit den unmittelbar vorhergehenden Basiszeichenbild-
Daten in dem Schritt SP 4 zu kombinieren. Desweiteren
wird in dem Schritt SP 4 die Höhe h 0 des kombinierten Zeichenblocks
gewonnen. In einem Schritt SP 5 wird das H/W-
Verhältnis des neu kombinierten Zeichenblocks unter Verwendung
der Breite w 0 und der Höhe h 0, die in dem Schritt Sp 4
gewonnen wurde, geprüft. Wenn das H/W-Verhältnis des kombinierten
Zeichenblocks angenähert oder nahezu 1 ist, setzt
sich der Prozeß zu dem Schritt SP 3 fort, um das Kombinierungsprogramm
zu beenden. Daher werden in diesem Fall die
kombinierten Bild-Daten S 8 zu der Zeichenerkennungs-Stufe 23
übertragen, wobei diese kombinierten Bild-Daten S 8 Bild-
Daten der kombinierten Zeichenblöcke enthalten. Andererseits
wird, wenn das H/W-Verhältnis immer noch stark verschieden
von 1 ist, das H/W-Verhältnis, das auf der Grundlage der
Breite w 0 und der Höhe h 0 gewonnen wurde, dahingehend in
einem Schritt SP 6 geprüft, ob es größer als 1 ist. Wenn dies
der Fall ist, kehrt der Prozeß zu dem Schritt SP 4 zurück, um
nachfolgend eingegebene weitere Basiszeichenbild-Daten mit
den vorhergehenden zu kombinieren. Der Prozeß in den
Schritten SP 4 und Sp 5 wird solange wiederholt, bis das H/W-
Verhältnis angenähert 1 ist oder bis das H/W-Verhältnis
größer als 1 ist. Wenn das H/W-Verhältnis zu kleiner als 1
erfaßt wird, wie dies in dem Schritt SP 6 geprüft wird, setzt
sich der Prozeß zu einem Schritt SP 7 fort, um den kombinierten
Zeichenblock auszuwählen, der in der unmittelbar
vorhergehenden Kombinierungsoperation in der Schleife der
Schritte gewonnen wurde, um ihn als kombinierte Bild-Daten
S 8 auszugeben. Nach dem Schritt SP 7 setzt sich der Prozeß zu
dem Schritt SP 3 fort, um den Kombinierungsprozeß zu beenden.
Ein Beispiel für die Kombinierungsoperation für Zeichenblöcke,
die in der Zeichenblockkombinierungs-Stufe 18
durchzuführen ist, wird im folgenden anhand von Fig. 10
erläutert. In Fig. 10 sind die oberen rechteckförmigen
Blöcke 0 bis 22 Zeichenblöcke, wie sie in der Zeichenblocksegmentierungs-
Stufe 11 als Basiszeichenblöcke segmentiert
wurden. In den Basiszeichenblöcken 0 bis 22 werden die Zeichenblöcke
0, 1, 4, 5, 9, 10, 13, 14, 17, 18, 21 u. 22, die
jeweils Zeichenbilddaten einer ersten Kategorie aufweisen,
als ein H/W-Verhältnis von angenähert 1 aufweisend beurteilt.
Andererseits sind die H/W-Verhältnisse der Zeichenblöcke
2, 3, 6, 7, 8, 11, 12, 15, 16, 19 u. 20 kleiner als
1. Jeder der Zeichenblöcke 2, 3, 6, 7, 8, 11, 12, 15, 16, 19
u. 20 enthält jeweils Zeichenbild-Daten einer zweiten Kategorie.
Beim Prüfen des H/W-Verhältnisses in dem Schritt SP 2
in dem zuvor beschriebenen Programmablauf gemäß Fig. 9,
fällt daher die Beurteilung dahingehend aus, daß die Basiszeichenblöcke
2, 3, 6, 7, 8, 11, 12, 15, 16, 19 u. 20 Zeichenkomponenten
enthalten, die einen Trennungscharakter
aufweisen, vergl. Fig. 10. Daher werden die Schritte SP 4 bis
SP 6 ausgeführt, um benachbarte Zeichen zu kombinieren, wie
dies durch entsprechende waagerechte Striche unter den betreffenden
Zeichenblöcken in Fig. 10 angedeutet ist. In
bezug auf den Zeichenblock 8 fällt die Beurteilung so aus,
daß der Zeichenblock mit dem nachfolgenden Zeichenblock in
dem Schritt SP 2 zu kombinieren ist. Indessen wird nach dem
Kombinieren dieses Zeichenblocks 8 mit dem nachfolgenden
Zeichenblock 9 das H/W-Verhältnis größer als 1. Daher wird
in dem Schritt SP 7 der Zeichenblock 8 als alleinstehender
Zeichenblock bewertet, der ein Zeichenbild enthält, das in
seiner Form etwa dem Spiegelbild eines Komma entspricht.
Andererseits hat im Falle eines mit alphabetischen Schriftzeichen
ausgeführten Textes (in Englisch), wie dies in Fig. 11
gezeigt ist, jeder Zeichenblock 0 bis 27 ein H/W-Verhältnis,
das kleiner als 1 ist. Indessen wird die Schalt-
Stufe 21 durch das Schaltersteuersignal aus der Diskriminator-
Stufe 20 betätigt, das in Reaktion auf das Signal DTE
aus der Zeichenerkennungs-Stufe 23 erzeugt wird, um den
Schalter der Schalt-Stufe zu der Klemme SW 2 umzulegen, womit
die Zeichenblocksegmentierungs-Stufe 11 direkt mit der Zeichenerkennungs-
Stufe 23 verbunden wird. Daher werden die
Zeichenblöcke 0 bis 27, die der Reihe nach Zeichenbilder für
"s", "o", "o", "n", ")", "a", "r", "e", "o", "u", "t", "s",
"i", "d", "e", "t", "h", "e", "s", "c", "o", "p", "e", "o",
"f", "t", "h" u. "e" enthalten, zu der Zeichenerkennungs-
Stufe 23 direkt von der Zeichenblocksegmentierungs-Stufe 11
in der genannten Reihenfolge übertragen. Wie ausgeführt,
wird, da die alphabetischen Schriftzeichen in sich keine
Trennung aufweisen, die Zeichenblockkombinierungs-Stufe 18
beim Übertragen der Zeichenbild-Daten S 7 zu dem Zeichenerkennungssystem
umgangen.
Der Datenspeicher speichert verschiedene Daten, die in der
zuvor beschriebenen Zeichenkombinierungsoperation in der
Zeichenblockkombinierungs-Stufe 18 verwendet werden können.
Jede Speicheradresse zum Speichern von Daten über den Zeichenblock
hat eine Struktur, wie sie beispielsweise in Fig. 12
gezeigt ist. Wie aus Fig. 12 ersichtlich, hat die Speicheradresse
des Datenspeichers 25 ein Datenformat, das einen
ersten Datenblock DATA1, der Daten D w speichert, die kennzeichnend
für die Breite des korrespondierenden Basiszeichenblocks
ist, einen zweiten Datenblock DATA2, der Daten D h
speichert, die kennzeichnend für die Höhe des korrespondiernden
Basiszeichenblocks sind, einen dritten Datenblock
DATA3 zum Setzen/Rücksetzen von Kennzeichnungsbits (flags)
FLG1, FLG2, FLG3 u. FLG4 und einen vierten Datenblock DATA4
umfaßt, der Positionsdaten D ps , H/W-Verhältnis-Daten D vh ,
Daten für die relative Höhe D szv und Daten für die relative
Breite D szh speichert. Der erste Datenblock DATA1 hat 8 Bits
zum Speichern der 8 Bits der Zeichenblockbreiten-Daten D w .
In ähnlicher Weise besteht der Datenblock DATA2 aus einem
8-Bit-Speicherblock zum Speichern der 8 Bits von Zeichenblockhöhen-
Daten D h . In dem dritten Datenblock DATA3 ist
jedes Bit der zuvor genannten Kennzeichnungsbits FLG1, FLG2,
FLG3 u. FLG4 zu setzen. Das Kennzeichnungsbit FLG1 kennzeichnet
die Segmentierungshistorie in der ersten Unterstufe
12 unter Verwendung des unteren Schwellenpegels TH 0. Das
Kennzeichnungsbit FLG1 wird jedesmal dann gesetzt bzw. rückgesetzt,
wenn die grobe Segmentierung in der ersten Unterstufe
12 stattfindet. Beispielsweise hat das Kennzeichnungsbit
FLG1 den logischen Pegel LOW ("0") für den ersten
Zeichenblock und den logischen Pegel HIGH ("1") für den
darauffolgenden zweiten Zeichenblock. Auf ähnliche kennzeichnen
die Kennzeichnungsbits FLG2 die Segmentierungshistorie
in der ersten Unterstufe 12 unter Verwendung des
höheren Schwellenpegels TH 1. Dabei wird das Kennzeichnungsbit
FLG2 abwechselnd jedesmal dann gesetzt bzw. rückgesetzt,
wenn die genaue Segmentierung durch die erste Unterstufe 12
stattfindet. Daher kennzeichnet auf ähnliche Weise das
Kennzeichnungsbit FLG3 die Segmentierungshistorie in der
zweiten Unterstufe 13 und wird abwechselnd jedesmal dann
gesetzt bzw. rückgesetzt, wenn die Segmentierung in der
zweiten Unterstufe 13 stattfindet. Das Kennzeichnungsbit
FLG4 wird gesetzt, wenn eine Rausch- oder Störanteil-Beseitigung
unter Verwendung des y-Projektionsprofils in der
dritten Unterstufe 14 durchgeführt wird. Weitere Einzelheiten
der Prozedur beim Codieren der Segmentierungshistorie in
der der Zeichenblocksegmentierungs-Stufe werden weiter unten
beschrieben.
Andererseits sind die Positionsdaten D ps , die H/W-Verhältnis-
Daten D vh , die Daten für die relative Höhe D szv und die
Daten für die relative Breite D szh jeweils 2-Bit-Daten, die
in dem vierten 8-Bit-Datenblock DATA4 zu speichern sind. Die
Daten für die relative Höhe D szv kennzeichnen die relative
Höhe des Basiszeichenblocks relativ zu der Höhe h R eines
Standard-Basiszeichenblocks. Auf ähnliche Weise kennzeichnen
die Daten für die relative Breite D szh die relative Breite
des Basiszeichenblocks bezogen auf eine Breite w R eines
Standard-Basiszeichenblocks.
Die Zeichenblockbreiten-Daten D w werden durch die Parametercodierungs-
Stufe 30 gewonnen, die weiter unten beschrieben
wird, und zwar relativ zu dem Zeichenblock, der in der
zweiten Unterstufe 13 in der Zeichenblocksegmentierungs-
Stufe 11 segmentiert wird. In der Praxis wird die Breite des
Zeichenblocks, der in der zweiten Unterstufe 13 segmentiert
wird, durch eine H/W-Verhältnis- u. Zeichengrößendetektor-
Stufe 31 innerhalb der Parametercodierungs-Stufe 30 erfaßt.
Die Zeichenblockhöhen-Daten D h werden ebenso durch die Parametercodierungs-
Stufe 30, insbesondere durch die H/W-
Verhältnis- u. Zeichengrößendetektor-Stufe 31 mit Bezug auf
den Basiszeichenblock gewonnen, der durch die dritte Unterstufe
14 der Zeichenblocksegmentierungs-Stufe 11 segmentiert
wird. Die H/W-Verhältnis- u. Zeichengrößendetektor-Stufe 31
innerhalb der Parametercodierungs-Stufe 30 bestimmt außerdem
das H/W-Verhältnis auf der Grundlage der Zeichenblockbreite
und der Zeichenblockhöhe, die wie zuvor ausgeführt gewonnen
werden. Die H/W-Verhältnis- Daten D vh werden dann in dem
vierten Datenblock DATA4 gespeichert. Desweiteren gewinnt
die H/W-Verhältnis- u. Zeichengrößendetektor-Stufe 31 die
relativen Zeichenbreiten-Daten D szh und die relativen Zeichenhöhen-
Daten D szv durch Vergleichen der gewonnenen Zeichenbreite
und der gewonnenen Zeichenhöhe mit einer Standardbreite
und einer Standardhöhe w R bzw. h R . Wie zuvor
ausgeführt, werden diese relativen Zeichenbreiten-Daten D dzh
und relativen Zeichenhöhen-Daten D szv ebenfalls in dem
vierten Datenblock DATA4 gespeichert.
Die relativen Zeichenbreiten-Daten D szh und die relativen
Zeichenhöhen-Daten D szv werden zum Unterscheiden von Klein-
und Großbuchstaben gleicher Zeichenmuster verwendet. Beispielsweise
besteht bei japanischen Schriftzeichen eine
unterschiedliche Größe der Schriftzeichen für formgleiche
Schriftzeichenmuster, wie beispielsweise "" u. ""; ""
u. ""; "" u. "". Unter diesen Schriftzeichen, die
formgleiche Schriftzeichen haben, haben die jeweils zuerst
genannten gegenüber den jeweils an zweiter Stelle genannten
eine unterschiedliche Größe. Solche Schriftzeichen, die
formgleiche Zeichenmuster in bezug auf die normale Größe
haben und kleiner als die zuerst genannten sind, dienen als
silbenhafte Nasallaute in japanischen Texten und werden im
folgend als "kleine Zeichen" bezeichnet. Wegen des Vorhandenseins
solcher kleiner Schriftzeichen im Japanischen ist
es notwendig, solche kleinen Schriftzeichen von den
Schriftzeichen normaler Größe zu unterscheiden. Die relativen
Zeichenbreiten-Daten D szh und die relativen Zeichenhöhen-
Daten D szv sind notwendig, um die Zeichenerkennungs-
Stufe in die Lage zu versetzen, die kleinen Schriftzeichen
von den korrespondieren Schriftzeichen normaler Größe zu
unterscheiden. Desweiteren wird ein derartiger Größenfaktor
zum Unterscheiden von Kleinbuchstaben und Großbuchstaben mit
im wesentlichen identischen Zeichenmusterformen bei alphabetischen
Schriftzeichen, wie beispielsweise "C" u. "c", "S"
u. "s", "Z" u. "z" usw..
Die Positionsdaten D ps sind repräsentativ für die Position
des Zeichens innerhalb eines Standard-Zeichenblocks P R , der
eine Standardbreite w R und eine Standardhöhe h R hat, wie
dies in Fig. 14 gezeigt ist. In dem gezeigten Ausführungsbeispiel
repräsentieren die Positionsdaten D ps die Tatsache,
daß das Zeichen den oberen Bereich P RU oder den unteren Bereich
P RD des Standardzeichenblocks P R besetzt hat. Das
erste Bit der 2-Bit-Positionsdaten D ps nimmt den logischen
Pegel HIGH ("1") an, wenn der obere Bereich P RU durch das
Zeichen besetzt ist, und es nimmt den logischen Pegel LOW
("0") im anderen Fall an. Auf ähnliche Weise nimmt das
zweite Bit der 2-Bit-Positionsdaten D ps den logischen Pegel
HIGH ("0") an, wenn der untere Bereich P RD durch das Zeichen
besetzt ist, und den logischen Pegel LOW ("0") im anderen
Fall. Daher kennzeichnen die Positionsdaten D ps , wenn deren
Bits den Wert "1, 1" haben, daß das Zeichen sowohl den oberen
als auch den unteren Bereich P RU und P RD besetzt. Wenn
die Positionsdaten D ps Bits mit den Werten "1, 0" haben,
kennzeichnet dies die Tatsache, daß das Zeichen nur den
oberen Bereich P RU des Standard-Zeichenblocks P R besetzt.
Solche Zeichen sind beispielsweise das Apostroph (′), das
Zeichen für Grad (°), hochgestellte Buchstaben usw.. Andererseits
kennzeichnen die Positionsdaten D ps , wenn deren
Bits die Werte "0, 1" haben, daß das Zeichen nur den unteren
Bereich P RU des Standard-Zeichenblocks P R besetzt. Solche
Zeichen können beispielsweise der Punkt (.), das Komma (,),
das japanische Ende-Zeichen (o), ein weiteres japanisches
Sonderzeichen (bressing mark) (in der Form des Spiegelbilds
des Komma), tiefgestellte Buchstaben usw. sein. Die Zeichen,
die nur den oberen oder nur den unteren Bereich P RU oder P RD
des Standard-Zeichenblocks P R besetzen, sind spezielle Zeichen.
Da die Anzahl solcher spezieller Zeichen begrenzt ist,
kann die Erkennung dieser speziellen Zeichen unter Benutzung
von speziellen und vereinfachten Zeichenerkennungs-Algorithmen,
die verschieden von denen zur Erkennung normaler
Zeichen sind, durchgeführt werden. Daher werden die Positionsdaten
D ps zum Erfassen derartiger spezieller Zeichen
verwendet.
Wie kurz in dem vorhergehenden Abschnitt ausgeführt, steuert
die Segmentierungshistoriecodierungs-Stufe 35 das Setzen und
Rücksetzen der Kennzeichnungsbits FLG1, FLG2, FLG3, FLG4 in
dem dritten Datenblock DATA3 des Datenspeichers. Wie ebenfalls
zuvor ausgeführt, kennzeichnen diese Kennzeichnungsbits
FLG1, FLG2, FLG3 u. FLG4 in Kombination die Historie
der Segmentierung, die in der Zeichenblocksegmentierungs-
Stufe 11 durchgeführt wurde. Da jeweils ein Bit für den
Zustand "Gesetzt" oder "Rückgesetzt" jedes der Kennzeichnungsbits
FLG1, FLG2, FLG3 u. FLG4 vorgesehen ist, wird die
Segmentierungshistorie durch einen 4-Bit-Binärcode dargestellt.
Der Prozeß zum Codieren der Segmentierungshistorie
wird weiter unten anhand von Fig. 15 beschrieben.
Wie in Fig. 15 gezeigt, werden währen einer Zeichenblocksegmentierung
in der ersten Unterstufe 12 unter Verwendung
des unteren Schwellenpegels TH 0 durchgeführt wird, die Werte
des Kennzeichnungsbits FLG1 für die betreffenden Zeichenblöcke
SQ 1, SQ 2, SQ 3, SQ 4 abwechselnd auf "0", "1", "0", "1"
. . . gesetzt. Daher werden in diesem Beispiel für die Zeichenblöcke
SQ 1, SQ 3 . . ., die in ungeradzahligen Zyklen der
Segmentierungsoperation segmentiert werden, die Kennzeichnungsbits
FLG1 auf "0" gesetzt, und für die Zeichenblöcke
SQ 2, SQ 4 . . ., die in geradzahligen Zyklen der Segmentierungsoperation
segmentiert werden, werden die Kennzeichnungsbits
FLG1 auf "1" gesetzt. Auf ähnliche Weise wird,
während die Zeichenblocksegmentierung in der ersten Unterstufe
12 unter Verwendung des höheren Schwellenpegels TH 1
durchgeführt wird, der Wert des Kennzeichnungsbits FLG2 für
die betreffenden Zeichenblöcke SQ 11, SQ 12, SQ 21, SQ 31, SQ 41,
SQ 42 . . . abwechselnd auf "0", "1", "0", "1", "0", "1" . . .
gesetzt. Daher werden in diesem Beispiel für die Zeichenblöcke
SQ 11, SQ 21, SQ 41 . . ., die in ungeradzahligen Zyklen
der Segmentierungsoperation segmentiert werden, die Kennzeichnungsbits
FLG2 auf "0" und für die Zeichenblöcke SQ 12,
SQ 31, SQ 42 . . ., die in geradzahligen Zyklen der Segmentierungsoperation
segmentiert werden, die Kennzeichnungsbits
FLG2 auf "1" gesetzt. Wie aus Fig. 15 ersichtlich, sind die
Zeichenblöcke SQ 11, SQ 12 u. SQ 41 und SQ 42 bei der genauen
Segmentierung aus denbetreffenden einzigen Zeichenblöcken
SQ 1 u. SQ 4, wie sie in der groben Segmentierung segmentiert
würden, hervorgegangen.
Das Kennzeichnungsbit FLG3 wird gemäß der Reihenfolge oder
des Ablaufs der Segmentierung, die in der zweiten Unterstufe
13 durchgeführt wird, gesetzt/rückgesetzt. In dem gezeigten
Beispiel werden die Zeichenblöcke SQ 111, SQ 121, SQ 211,
SQ 212, SQ 311, SQ 411, SQ 412, SQ 421. . . in der zweiten Unterstufe
13 segmentiert, vergl. auch Fig. 16. Das Kennzeichnungsbit
FLG3 wird jeweils auf "0", "1", "0", "1", "0", "1",
"0" . . . für die Zeichenblöcke SQ 111, SQ 121, SQ 211, SQ 212,
SQ 311, SQ 411, SQ 412, SQ 421 . . . gesetzt. Wie ersichtlich,
wird der Zeichenblock SQ 21, der in der genauen Segmentierung
segmentiert wird, in zwei separate Zeichenblöcke SQ 211 u.
SQ 212 unterteilt. Außerdem wird der Zeichenblock SQ 41, der
ursprünglich als einziger Zeichenblock mit dem Zeichenblock
SQ 42 in der groben Segmentierung in der ersten Unterstufe 12
segmentiert und von dem Zeichenblock SQ 42 in der genauen
Segmentierung in der ersten Unterstufe getrennt wurde, wiederum
in zwei Zeichenblöcke SQ 411 u. SQ 412 in der zweiten
Unterstufe 13 zerlegt.
Wie zuvor ausgeführt, wird das Kennzeichnungsbit FLG4 abhängig
davon gesetzt oder rückgesetzt, ob die Segmentierung
zum Entfernen des einen Rausch- oder Störanteil enthaltenen
Bereichs in dem Zeichenblock, der in der zweiten Unterstufe
13 gewonnen wurde, in der dritten Unterstufe 14 durchgeführt
wird oder nicht durchgeführt wird. Das bedeutet, daß wenn
ein bestimmter Bereich von dem Zeichenblock entfernt wird,
um den Basis-Zeichenblock in der dritten Unterstufe zu bilden,
das Kennzeichnungsbit FLG4 auf den logischen Pegel HIGH
"1" gesetzt wird. Im anderen Falle wird das Kennzeichnungsbit
FLG4 auf den logischen Pegel LOW ("0") gesetzt.
Daher werden während der Segmentierung in der ersten bis
dritten Unterstufe 11, 12, 13 der Zeichenblocksegmentierungs-
Stufe 11 die Kennzeichnungsbits FLG1, FLG2, FLG3 u.
FLG4 in dem dritten Datenblock DATA3 jeder Speicheradresse
in dem Datenspeicher 25 gesetzt. Die Kennzeichnungsbits FLG1
bis FLG4 in dem Datenspeicher 25 kennzeichnen die Historie
der Segmentierung des jeweiligen Bais-Zeichenblocks, der
durch die Zeichenerkennungs-Stufe 23 erkannt werden soll. Im
einzelnen werden die Kennzeichnungsbits FLG1, FLG2 u. FLG3
kombiniert, um die Historie der Segmentierung mit Bezug auf
die Zeichenblöck SQ 111, SQ 121, SQ 211 . . . darzustellen. In
anderen Worten ausgedrückt heißt dies, daß durch Prüfen der
kombinierten Kennzeichnungsbits FLG1, FLG2 u. FLG3 erkannt
werden kann, wie die Zeichenblöcke gewonnen wurden.
Fig. 16 zeigt die kombinierten Werte der Kennzeichnungsbits
FLG1, FLG2, FLG3, die mit Bezug auf die Zeichenblöcke SQ 111,
SQ 121, SQ 211, SQ 212, SQ 311, SQ 411, SQ 412, SQ 421 gesetzt
sind. Wie zuvor ausgeführt, kennzeichnen die kombinierten
Kennzeichnungsbits FLG1, FLG2, FLG3 die Segmentierungshistorie
des korrespondierenden Zeichenblocks. Wenn die
Segmentierungshistorie geprüft wird, werden daher die logischen
Pegel dieser Kennzeichnungsbits für aufeinanderfolgende
Zeichenblöcke geprüft. Beispielsweise sind mit Bezug
auf die aufeinanderfolgenden Zeichenblöcke SQ 111, SQ 121 die
logischen Pegel der Kennzeichnungsbits FLG1 jeweils "0".
Dies bedeutet, daß die Zeichenblöcke SQ 111, SQ 121 als ein
einziger Zeichenblock in der groben Segmentierung segmentiert
wurden, die in der ersten Unterstufe 12 der Zeichenblocksegmentierungs-
Stufe 11 durchgeführt wurde. Beim Prüfen
des Kennzeichnungsbits FLG2 mit Bezug auf die Zeichenblöcke
SQ 111 u. SQ 121 sind die betreffenden logischen Pegel "0" u.
"1". Dies bedeutet, daß die Zeichenblöcke SQ 111, SQ 121 als
separate Zeichenblöcke in der genauen Segmentierung innerhalb
der ersten Unterstufe 12 segmentiert wurden. Hieraus
ergibt sich, daß die Zeichenblöcke SQ 111, SQ 121 als einziger
Zeichenblock betrachtet wurden, als sie unter Verwendung des
niedrigen Schwellenpegels TH 0 segmentiert wurden. Dies bedeutet,
daß eine Möglichkeit besteht, daß ein einziges Zeichen
in zwei Zeichenkomponenten in der genauen Segmentierung
zerlegt werden kann. Dies bedeutet wiederum, daß die Zeichenblöcke
SQ 111 u. SQ 121 kombiniert werden können, um
Bild-Daten zu bilden, die in der Zeichenerkennungs-Stufe 23
durch die Zeichenblockkombinierungs-Stufe 18 erkannt werden
können.
Andererseits sind mit Bezug auf die Zeichenblöcke SQ 112 u.
SQ 211 die betreffenden logischen Pegel der Kennzeichnungsbits
FLG1 "0" und "1". Dies bedeutet, daß diese beiden Zeichenblöcke
SQ 121 u. SQ 211 ursprünglich als getrennte Blöcke
in der groben Segmentierung segmentiert wurden. Daraus ergibt
sich, daß eine Beurteilung dahingehend erfolgen kann,
daß die Zeichen, die in den Zeichenblöcken SQ 121 u. SQ 211
enthalten sind, unterschiedliche und getrennte Zeichen sind
und daher nicht in der Zeichenblockkombinierungs-Stufe 18
kombiniert werden sollten.
In gleicher Weise kann eine Beurteilung mit Bezug auf die
Zeichenblöcke SQ 411, SQ 412 u. SQ 421 vorgenommen werden. Beim
Prüfen des Kennzeichnungsbits FLG1 sind die betreffenden
logischen Pegel "1". Daher ergibt sich, daß alle dieser drei
Zeichenblöcke SQ 411, SQ 412 u. SQ 421 ursprünglich als ein
einziger Zeichenblock SQ 4 segmentiert wurde, vergl. Fig. 15.
Dies eröffnet die Möglichkeit des Kombinierens dieser drei
Zeichenblöcke in der Zeichenblockkombinierungs-Stufe 18 zum
Bilden eines einzigen Zeichenbildes für die Zeichenerkennung.
Beim Prüfen des Kennzeichnungsbits FLG2 der Zeichenblöcke
SQ 411, Sq 412 u. SQ 421 sind deren betreffenden logischen
Pegel "0", "0" u. "1". Daraus ist ersichtlich, daß die
Zeichenblöcke SQ 411 u. SQ 412 als ein einziger Zeichenblock
segmentiert wurden, und zwar selbst in der genauen Segmentierung
in der ersten Unterstufe 12. Andererseits ist zu
erkennen, daß die Zeichenblöcke SQ 412 u. SQ 421 als separate
Zeichenblöcke in der genauen Segmentierung segmentiert wurden.
Obgleich die Zeichenblöcke SQ 411 u. SQ 412 in zwei Zeichenblöcke
in der genauen Segmentierung zerlegt wurden,
besteht eine Möglichkeit, daß jeder dieser Zeichenblöcke
Zeichenkomponenten enthält, die zu kombinieren sind. Daher
können die Zeichenblöcke SQ 411 u. SQ 412 ebenfalls in der
Zeichenblockkombinierungs-Stufe 18, wie zuvor ausgeführt,
kombiniert werden.
In bezug auf den Zeichenblock SQ 311 ist kein gemeinsamer
logischer Pegel für die aufeinanderfolgenden Zeichenblöcke
SQ 212 u. SQ 411 gegeben, wie aus Fig. 16 ersichtlich. Dies
bedeutet, daß das Zeichen in dem Zeichenblock SQ 311 ein
unabhängiges und getrenntes Zeichen von den Zeichen in den
Zeichenblöcken SQ 212 u. SQ 411 ist. Daher wird die
Erkennung des Zeichens für den Zeichenblock SQ 311 in bezug
auf das Zeichen in dem Zeichenblock SQ 311 allein durchgeführt.
Wie ausgeführt, sagt das Kennzeichnungsbit FLG4 aus, ob ein
bestimmter Bereich in dem Zeichenblock in der Segmentierung,
die in der dritten Unterstufe 14 durchgeführt wurde, entfernt
wurde. Daher sind Segmentierungshistorie-Daten D hs
über alles beim Steuern der Kombinierungsoperation nützlich,
die in der Zeichenblockkombinierungs-Stufe 18 durchgeführt
wird, welche zuvor erläutert wurde, und ebenso bei
der Resegmentierungs-Operation, die in der Resegmentierungs-
Stufe 40 durchgeführt wird, welche weiter unten beschrieben
wird.
Um die logischen Pegel "0" u. "1" für die jeweiligen Kennzeichnungsbits
FLG1, FLG2, FLG3 u. FLG4 in der Segmentierungshistoriecodierungsoperation,
die in der Segmentierungshistoriecodierungs-
Stufe 35 stattfindet, abwechselnd zu
setzen, wird eine Speicheradresse, die mit dem Zeichenblock
korrespondiert, aufgesucht. Unter der aufgesuchten Speicheradresse
wird auf jedes Bit zum Speichern der Kennzeichnungsbits
FLG1, FLG2, FLG3 u. FLG4 in der betreffenden Reihenfolge
entsprechend dem Fortschreiten der Zeichensegmentierung,
die in der ersten, der zweiten und der dritten
Unterstufe 12, 13 bzw. 14 der Zeichenblocksegmentierungs-
Stufe 11 stattfindet, zugegriffen.
In der Zeichenerkennungs-Stufe 23 wird eine Zeichenerkennung
für die Zeichenbild-Daten S 7 oder S 8, die von der Zeichenblockkombinierungs-
Stufe 18 übertragen werden, gemäß dem
Prozeß, der in Fig. 17 gezeigt ist, ausgeführt. Es werden,
um den Zeichenerkennungsprozeß wirksam durchzuführen, nicht
nur die Zeichenbild-Daten S 7 oder S 8, sondern auch die Daten,
die in dem Datenspeicher 25 gespeichert sind, wie dies
zuvor erläutert wurde, in dem Prozeß der Zeichenerkennung in
der Zeichenerkennungs-Stufe verwendet.
In dem Prozeß gemäß Fig. 17 wird unmittelbar nach dem Start
des Prozesses in einem Schritt SP 11 der vierte Datenblock
DATA4 der korrespondierenden Speicheradresse in einem
Schritt SP 12 geprüft. Insbesondere die Positions-Daten D ps
werden daraufhin überprüft, ob das Zeichen, das zu erkennen
ist, ein spezielles Zeichen, beispielsweise "′", "″", "-
(chinesisches Zeichen, das für "1" steht)", "°", das in der
oberen Hälfte P RU des Standard-Zeichenblocks P R positioniert
ist, oder eines der Zeichen "o" (japanisches Ende-Zeichen)",
".", ",", "", welche in der unteren Hälfte P RD des Standard-
Zeichenblocks P R positioniert sind, ist. Daher wird in
dem Schritt SP 12 eine Prüfung dahingehend durchgeführt, ob
die Positions-Daten D ps von der Form "1, 0" oder "0, 1"
sind. Wenn nämlich die Positions-Daten D ps von der Form "1,
0" sind, zeigt dies an, daß das Zeichen ein spezielles Zeichen
ist, das in der oberen Hälfte P RU des Standard-Zeichenblocks
P R zu positionieren ist. Auf ähnliche Weise ergibt
sich, wenn die Positionsdaten D ps von der Form "0, 1"
sind, daß das Zeichen ein spezielles Zeichen ist, das in der
unteren Hälfte P RD des Standard-Zeichenblocks P R zu positionieren
ist. Wenn die Beurteilung derart ausfällt, daß das
Zeichen, das zu erkennen ist, ein spezielles Zeichen ist,
setzt sich der Prozeß zu einem Schritt SP 13 fort.
In dem Schritt SP 13 wird ein spezieller Algorithmus für das
Erkennen des speziellen Zeichens zum Durchführen der Erkennung
des Zeichens benutzt. Vorzugsweise ist der Algorithmus
zum Erkennen von speziellen Zeichen, die in der oberen
Hälfte P RU zu positionieren sind, unterschiedlich von dem
für spezielle Zeichen, die in der unteren Hälfte P RD zu
positionieren sind. Der spezielle Algorithmus zum Erkennen
der speziellen oder spezifischen Zeichen ist an sich bekannt.
Nach dem Zeichenerkennungsprozeß in dem Schritt SP 13 wird in
einem Schritt SP 14 eine Prüfung vorgenommen, ob das Zeichen
erkannt ist. Wenn das Zeichen, das in dem Schritt SP 13 erkannt
ist, bestätigt wird, setzt sich der Prozeß zu einem
Schritt SP 15 fort, um das Ergebnis auszugeben. Ein Ausgangssignal
S 10 der Zeichenerkennungs-Stufe 23, wie es in
dem Schritt S 15 ausgegeben wird, kann ein an sich bekannter
Zeichencode, beispielsweise der ASCII-Code oder ein ähnlicher
Code, sein. Das Ausgangssignal S 10 in Form eines Zeichencodes
wird im folgenden als "Zeichencode-Daten S 10"
bezeichnet.
Wie ausgeführt, können unter Verwendung der Positions-Daten
D ps zum Unterscheiden der speziellen Zeichen von normalen
Zeichen spezielle und vereinfacht Algorithmen in dem Schritt
SP 13 zur Verringerung der notwendigen Dauer zum Erkennen der
Zeichen benutzt werden.
Andererseits wird, wenn das Zeichen, das zu erkennen ist,
ein normales Zeichen ist, das Zeichensegment sowohl die
obere als auch die untere Hälfte P RU bzw. P RD des Zeichenblocks
P R besetzen. Daher werden die Positionsdaten D ps , die
ein normales Zeichen kennzeichnen, zu "1, 1". Wenn die Positions-
Daten D ps den logischen Pegel HIGH ("1") für beide
Bits aufweisen, wird eine Beurteilung dahingehend getroffen,
daß das Zeichen, das zu erkennen ist, nicht eines der speziellen
Zeichen ist, und zwar in dem Schritt SP 12. Dann
setzt sich der Prozeß zu einem Schritt SP 16 fort. Außerdem
setzt sich, wenn das Zeichen nicht in dem Schritt SP 13 erkannt
wird und eine Unmöglichkeit der Erkennung in dem
Schritt SP 14 erfaßt wird, der Prozeß ebenfalls zu dem
Schritt SP 16 fort. In dem Schritt SP 16 werden die H/W-Verhältnis-
Daten D vh , die relativen Höhen-Daten D scv und die
relativen Breiten-Daten D szh in dem vierten Datenblock DATA4
der korrespondierenden Speicheradresse des Datenspeichers 25
geprüft. Daher werden in diesem Schritt SP 16 das Vertikal/
Horizontal-Verhältnis und die Größe des Zeichens geprüft,
um so zu beurteilen, ob das Zeichen, das zu erkennen
ist, ein Zeichen ist, das ein besonderes H/W-Verhältnis oder
eine besondere Zeichengröße aufweist.
In dem bevorzugten Ausführungsbeispiel wird, um zu prüfen,
ob das Zeichen, das zu erkennen ist, das besondere H/W-Verhältnis
hat, eine Prüfung durchgeführt, ob die Bedingung
erfüllt ist oder ob die Bedingung
erfüllt ist.
Zeichen, die die zuvor angegebene Bedeutung erfüllen, sind
z. B. "=", "-", "→", "←", "∼" usw.. Andererseits sind
Zeichen, die die Bedingung (2) erfüllen, beispielsweise ":",
";", "0" bis "9", "", "", "", "I", "", "", "f",
"i" usw..
Andererseits werden, um zu prüfen, ob das Zeichen das zu
erkennen ist, eine besondere Größe hat, die relativen Höhen-
Daten D szv (h/h R (h ist eine Höhe des Zeichenblocks; und h R
ist eine Höhe des Standard-Zeichenblocks), dahingehend geprüft,
ob die Bedingung
erfüllt ist oder nicht erfüllt ist. Zeichen, die die vorstehende
Bedingung (3) erfüllen, sind z. B. "mm", "cm", "o
(japanisches Ende-Zeichen)", "", "", "", "", "a",
"e", "C", "T" usw..
Desweiteren werden, um zu prüfen, ob das Zeichen, das zu erkennen
ist, eine besondere Größe aufweist, die relativen
Breiten-Daten D szh (w/w R : w ist eine Breite des Zeichenblocks;
und w R ist eine Breite des Standard-Zeichenblocks)
dahingehend geprüft, ob die Bedingung
erfüllt ist. Zeichen, die diese Bedingung (4) erfüllen, sind
beispielsweise "′", "″", "o (japanisches Ende-Zeichen)",
":", ";", "0" bis "9", "", "", "", "a", "c", "e" usw..
Wenn das Zeichen, das zu erkennen ist, ein besonderes Höhen/
Breiten-Verhältnis oder eine besondere Zeichengröße
aufweist, das oder die eine der Bedingungen (1) bis (4)
erfüllt, setzt sich der Prozeß zu einem Schritt SP 17 fort,
um eine Zeichenerkennung unter Benutzung eines Algorithmus
durchzuführen, der einfacher ist, als der, der für eine
Zeichenerkennung für normale Zeichen zu benutzen ist. Da die
Zeichen, die eine der vorhergehenden Bedingungen erfüllen,
absolut begrenzt sind, können die Algorithmen, die zu benutzen
sind, um derartige Zeichen zu erkennen, wesentlich
vereinfacht sein. Daher kann die Prozeßdauer, die zum Erkennen
der Zeichen notwendig ist, verkürzt sein. Nach dem
Zeichenerkennungs-Prozeß in dem Schritt SP 17 wird eine Prüfung
durchgeführt, ob das Zeichen während des Prozesses in
dem Schritt SP 17 erkannt wurde. Wenn die Erkennung des Zeichens
in einem Schritt SP 18 bestätigt wird, setzt sich der
Prozeß zu dem Schritt SP 15 fort, um die Zeichencode-Daten
S 10 auszugeben.
Andererseits setzt sich, wenn das Zeichen, das zu erkennen
ist, keine der zuvor genannten Bedingungen (1) bis (4) erfüllt,
wie dies in dem Schritt SP 16 geprüft wird, der Prozeß
zu einem Schritt SP 19 fort, um eine Zeichenerkennung unter
Benutzung eines Standard-Algorithmus durchzuführen. Auf
ähnliche Weise wird, wenn das Zeichen nicht in dem Schritt
SP 17 erkannt werden kann und wenn eine Unmöglichkeit der
Erkennung des Zeichens in dem Schritt SP 18 erfaßt wird, der
Prozeß ebenfalls zu dem Schritt SP 19 fort. In dem Zeichenerkennungsprozeß
in dem Schritt SP 19 werden die Zeichenbild-
Daten mit Standard-Zeichen-Daten verglichen, die in dem
Zeichenerkennungssystem vorgegeben sind. Wenn die Zeichenbild-
Daten im wesentlichen mit den vorgegebenen Standard-
Zeichen-Daten übereinstimmen, wird das Zeichen erkannt, das
durch die vorgegebenen Standard-Zeichen-Daten repräsentiert
wird. Das Erkennen des Zeichens wird durch einen Schritt
SP 20 bestätigt. Auf der Grundlage des Ergebnisses der Zeichenerkennung
in dem Schritt SP 19 werden die Zeichencode-
Daten S 10 in dem Schritt SP 15 ausgegeben.
Andererseits wird, wenn die Zeichenbild-Daten S 7 oder S 8
nicht mit irgendeinem der Standard-Zeichendatensätze übereinstimmt,
die Unmöglichkeit der Zeichenerkennung in dem
Schritt SP 20 erfaßt. In diesem Fall wird eine Resegmentierung
in einem Schritt SP 21 durchgeführt. Die Resegmentierung
in dem Schritt SP 21 enthält eine Rekombination der
Zeichenblöcke und eine Reseparation der Zeichenblöcke. Während
des Resegmentierungsprozesses in dem Schritt SP 21 werden
die Historie-Daten D hs in Form der Kennzeichnungsbits
FLG1, FLG2, FLG3 u. FLG4 des dritten Datenblocks DATA3 unter
der korrespondierenden Speicheradresse in dem Datenspeicher
25 gesetzt. Nach dem Resegmentierungsprozeß, der in dem
Schritt SP 21 durchgeführt wird, kehrt der Prozeß zu dem
Schritt SP 19 zurück, um eine Zeichenerkennung unter Benutzung
des Standard-Algorithmus in dem Schritt SP 19 durchzuführen.
Es ist ersichtlich, daß wenn die Resegmentierung des Zeichenblocks,
der nicht in dem Schritt SP 19 erkannt werden
kann, freigegeben wird, die Resegmentierung unter Benutzung
der Historie-Daten wirksam durchzuführen ist. Mit diesem
Prozeß kann die Erkennungsrate der Zeichen wesentlich angehoben
oder verbessert werden.
Wie zuvor ausgeführt, wird in dem bevorzugten Ausführungsbeispiel
für das Zeichenerkennungssystem gemäß der vorliegenden
Erfindung das Dokumentbild durch den Dokumentleser 2
aufgenommen und zu dem Bereichssegmentierungs-Abschnitt 3
übertragen. In dem Bereichssegmentierungs-Abschnitt wird
eine Schräglagen-Normalisierung und eine Rausch- oder Störanteilbeseitigung
zusätzlich zu der Segmentierung für die
Zeichenfolgen AR 1, AR 2 . . . durchgeführt, wie dies in Fig. 2
gezeigt ist.
Die Art und Weise der Schräglagen-Normalisierung und der
Rausch- oder Störanteilbeseitigung ist bereits in "IEEE",
CH2145-1/85/0000/055, veröffentlicht 1985, S. 550 bis 575
offenbart. Auf die Offenbarung in dieser Veröffentlichung
wird hierin aus Gründen der Einfachheit der Beschreibung
Bezug genommen.
In dem Bereichssegmentierungs-Abschnitt 3 startet eine Segmentierungsprozeß
vom Definieren eines Textbereichs an für
die Dokumentbild-Daten aus dem Dokumentleser. Dann werden
Zeichenfolgenblöcke auf der Grundlage des y-Projektionsprofils
des Textbereichs segmentiert. Das bedeutet, daß in dem
Bereichssegmentierungsprozeß horizontale Abtastlinien, die
Zeichenbild-Daten enthalten, zum weiteren Verarbeiten zum
Zwecke der Zeichenerkennung ausgewählt werden, wodurch die
Zeichenbild-Daten extrahiert werden. Daher werden Bereichssegmentierungs-
Daten S 4 erzeugt, die die Bild-Daten auf den
horizontalen Abtastlinien in jeder der segmentierten Zeichenfolgen
enthalten.
Die Bereichssegmentierungs-Daten S 4 werden zu dem Zeichenerkennungs-
Abschnitt 7 übertragen. Eine Zeichenblocksegmentierung
wird durch die Zeichenblocksegmentierungs-Stufe 11
in dem Zeichenerkennungs-Abschnitt 7 durchgeführt. In der
Zeichenblocksegmentierungs-Stufe 11 wird eine vorläufige
Zeichenblocksegmentierung in der ersten Unterstufe 12 auf
der Grundlage des x-Projektionsprofils durchgeführt. In der
vorläufigen Zeichenblocksegmentierung in der ersten Unterstufe
12 wird eine grobe Segmentierung unter Benutzung des
niedrigeren Schwellenpegels TH 0 und eine genaue Segmentierung
unter Benutzung des höheren Schwellenpegels TH 1 durchgeführt.
Während dieser groben Segmentierung wird das Kennzeichnungsbit
FLG1 in dem dritten Datenblock DATA3 der korrespondierenden
Speicheradresse abwechselnd der Reihe nach
auf die logischen Pegel "0" u. "1" nach gesetzt. Auf ähnliche
Weise wird das Kennzeichnungsbit FLG2 in dem dritten
Datenblock DATA3 der korrespondierenden Speicheradresse
abwechselnd der Reihe nach auf die logischen Pegel "0" u.
"1" gesetzt.
Die Zeichenbild-Daten, die durch die genaue Segmentierung in
der ersten Unterstufe 12 extrahiert wurden, werden zu der
zweiten Unterstufe übertragen. In der zweiten Unterstufe
wird die Kontinuität des Zeichens in dem vorläufig segmentierten
Zeichenblock mit Bezug auf das x-Projektionsprofil
geprüft. Wenn eine Diskontinuität in den Zeichen oder Zeichenkomponenten
in dem Zeichenblock vorgefunden wird, werden
die Zeichen oder Zeichenkomponenten mit dieser Diskontinuität
in separate Zeichenblöcke unterteilt. In diesem Prozeß
wird das Kennzeichnungsbit FLG3 in dem dritten Datenblock
DATA3 der korrespondierenden Speicheradresse abwechselnd der
Reihe nach auf die logischen Pegel "0" u. "1" gesetzt. Die
Zeichenbild-Daten, die in der zweiten Unterstufe 13 extrahiert
wurden, werden in der dritten Unterstufe 14 verarbeitet.
In der dritten Unterstufe wird die Höhe des Zeichenblocks
so modifiziert, daß die oberen und unteren horizontalen
Ränder der Zeichenblöcke im wesentlichen in Nachbarschaft
der oberen und unteren Konturen des betreffenden
Zeichens liegen. Dieser Prozeß wird durch Prüfen des y-
Projektionsprofils des Zeichens in dem Zeichenblock durchgeführt.
Gleichzeitig werden vertikal hintereinanderliegende
Rausch- oder Störanteile aus den Zeichenbild-Daten durch
Vergleichen des y-Projektionsprofils mit dem gegebenen
Schwellenpegel beseitigt.
Während dieses Prozesses in der dritten Unterstufe 14 wird
das Kennzeichnungsbit FLG4 in dem dritten Datenblock DATA3
auf den logischen Pegel "0" oder "1" abhängig von dem Ergebnis
der Vergleichsoperation des y-Projektionsprofils mit dem
Schwellenpegel gesetzt. Wenn beispielsweise irgendein Bereich
des Zeichenblocks als Ergebnis der Vergleichsoperation
entfernt wird, wird das Kennzeichnungsbit FLG4 auf den logischen
Pegel HIGH ("1") und andernfalls auf den logischen
Pegel LOW ("0") gesetzt.
Daher haben in der Zeichenblocksegmentierungs-Stufe 11 die
Basis-Zeichenblöcke Ränder, die an oberen, unteren und
seitlichen Konturen des Zeichens in dem Zeichenblock liegen.
Obgleich die Zeichenblöcke segmentiert werden, um im Endeffekt
den Basis-Zeichenblock durch die erste, die zweite
und die dritte Unterstufe 12, 13 bzw. 14 zu gewinnen, werden
die Zeichenbild-Daten, die in dem Zeichenblock enthalten
sind, aufrechterhalten, um die besonderen Eigenschaften der
Zeichen darin darzustellen zu können.
Grundsätzlich wird der Basis-Zeichenblock zu einem minimalen
Block segmentiert, so daß er eine Zeicheneinheit minimaler
Größe enthält, um so eine Erkennung der Zeichen durch Kombinieren
von zwei oder mehr Zeichenblöcken sicherzustellen
und die Möglichkeit eines Fehlers in der Erkennung zu vermeiden,
die durch das Vorhandensein von mehr als einem Zeichen
in einem einzigen Zeichenblock gegeben wäre. Während
die Zeichenblocksegmentierung in der Zeichenblocksegmentierungs-
Stufe 11 durchgeführt wird, werden Daten, die für die
Segmentierungshistorie kennzeichnend sind, in dem Datenspeicher
25 in Form der Kennzeichnungsbits FLG1, FLG2, FLG3
u. FLG4 gespeichert. Desweiteren werden in dem Datenspeicher
Daten D w , die kennzeichnend für die Breite des korrespondierenden
Basis-Zeichenblocks sind, in dem ersten Datenblock
DATA1, Daten D h , die kennzeichnend für die Höhe des korrespondierenden
Basis-Zeichenblocks sind, in dem zweiten Datenblock
DATA2 sowie Positions-Daten D ps , H/W-Verhältnis-
Daten D vh , relative Höhen-Daten D szv und relative Breiten-
Daten D szh in dem vierten Datenblock DATA4 gespeichert.
Diese Daten in dem Datenspeicher sind hilfreich für eine
wirksame Durchführung der Kombination von Zeichenblöcken in
der Zeichenblockkombinierungs-Stufe 18 und in der Zeichenerkennung
in der Zeichenerkennungs-Stufe 23. Die die Segmentierungshistorie
kennzeichnenden Kennzeichnungsbits FLG1,
FLG2, FLG3 u. FLG4 sind hilfreich für das Kombinieren von
Zeichenblöcken für solche Zeichenblöcke, die Zeichenkomponenten
enthalten. Andererseits sind die Positions-Daten D ps ,
die H/W-Verhältnis-Daten D vh , die relativen Höhen-Daten D szv
und die relativen Breiten-Daten D szh hilfreich für das Erfassen
spezieller Zeichen, die durch Benutzung vereinfachter
Algorithmen erkannt werden können. Durch Unterscheiden der
besonderen Zeichen von anderen, normalen Zeichen, was einen
Zeichenerkennungsprozeß unter Benutzung normaler oder Standard-
Algorithmen erfordert, wird die Anzahl von Zeichen, die
durch Benutzung des Standard-Algorithmus erkannt werden,
verringert, um so eine Verkürung der Prozeßdauer zu begünstigen,
die für das Erkennen des Textes erforderlich ist.
Es ist ersichtlich, daß die Zeichenerkennung in der Zeichenerkennungs-
Stufe 23 im allgemeinen in einem an sich
bekannten Prozeß durchgeführt wird. Beispielsweise kann die
Zeichenerkennung gemäß dem Algorithmus durchgeführt werden,
der in "CLASSIFCATION OF MIXED FONT ALPHABETICS BY
CHARACTERISTIC LOCI", eingesandt von Herbert. A. Glucksman
et al und veröffentlicht in "DIG FIRST IEEE COMPUTER
CONFERENCE, 1967" offenbart ist. Die Offenbarung des Inhalts
der zuvor genannten Veröffentlichung ist in der vorliegenden
Beschreibung durch die Bezugnahme darauf enthalten und wird
nicht wiederholt, um die Beschreibung nicht zu umfangreich
werden zu lassen.
Es ist ersichtlich, daß obwohl das bevorzugte Ausführungsbeispiel
eine Reextrahierungs-Stufe und eine Rekombinierungs-
Stufe zum Reextrahieren und Rekombinieren der Zeichenblöcke
zur Sicherstellung der Erkennung der Zeichen
benutzt, das bevorzugte Ausführungsbeispiel für die vorliegende
Erfindung auf ein beliebiges Zeichenerkennungssystem
anwendbar ist, das eine Segmentierung der Zeichenblöcke
erfordert. Insbesondere die Zeichenblock-Segmentierungstechnik,
die in dem bevorzugten Ausführungsbeispiel für die
vorliegende Erfindung benutzt wird, könnte in irgendeinem
Typ von Zeichenerkennungssystem nutzvoll sein. Desweiteren
kann die Benutzung der Segmentierungshistorie- oder -hysterese-
Daten in dem Zeichenerkennungsprozeß die Zeichenerkennung
in irgendeinem Zeichenerkennungssystem sicherstellen.
Daher würden Zeichenerkennungssysteme, die die Segmentierungstechnik
verwenden, wie sie durch die Ansprüche bestimmt
wird, als innerhalb des Schutzumfangs für die vorliegenden
Erfindung liegend zu betrachten sein.
Desweiteren können die Segmentierungshistorie-Daten, die
durch die Kennzeichnungsbits gekennzeichnet sind, zum Steuern
der Resegmentierung, die auszuführen ist, wenn die Zeichenerkennung
in bezug auf den Zeichenblock versagt, benutzt
werden.
Obgleich das spezielle Ausführungsbeispiel zuvor lediglich
anhand mehrerer Figuren beschrieben worden ist, kann die
vorliegende Erfindung darüber hinaus in verschiedener Weise
ausgeführt werden. Beispielsweise kann, obwohl die Erfindung
lediglich anhand eines Beispiels für eine Zeichenerkennung
in einem Text offenbart ist, in dem sich horizontal erstreckende
Zeichenfolgen enthalten sind, die Zeichenerkennung
auch für einen Text durchgeführt werden, der sich vertikal
erstreckende Zeichenfolgen enthält. Außerdem kann der
Inhalt des Datenspeichers 25 nicht nur zum Steuern des Kombinierens
von Zeichenblöcken, der Zeichenerkennung und der
Resegmentierung der Zeichenblöcke, sondern auch für andere
Prozesse verwendet werden. Desweiteren wird in dem gezeigten
Ausführungsbeispiel die Zeichenblocksegmentierung in der
ersten Unterstufe der Zeichenblocksegmentierungs-Stufe mit
unterschiedlichen Pegeln der Schwellen durchgeführt. Ein
ähnlicher Effekt kann durch wiederholtes Segmentieren der
identischen Zeichenfolgenblöcke erreicht werden.
Während die vorliegende Erfindung anhand eines bevorzugten
Ausführungsbeispiels beschrieben wurde, um ein besseres
Verständnis der Erfindung zu erreichen, ist ersichtlich, daß
die Erfindung in unterschiedlicher Weise angewendet werden
kann, ohne daß dazu Erfindungsprinzip verlassen werden müßte.
Daher ist die Erfindung so zu verstehen, daß sie alle
möglichen Ausführungsbeispiele und Modifikationen der gezeigten
Ausführungsbeispiele enthält, die ausgeführt werden
können, ohne daß dazu der Schutzumfang für die vorliegende
Erfindung verlassen werden müßte.
Claims (73)
1. Zeichenerkennungssystem, gekennzeichnet
durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bilddaten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Extrahieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten individueller Zeichen in dem Dokument enthält,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25) zum Steuern des Betriebs des dritten, vierten und fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes aus den dritten und vierten Mitteln (7/18, 7/40) gebildet ist.
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bilddaten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Extrahieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten individueller Zeichen in dem Dokument enthält,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25) zum Steuern des Betriebs des dritten, vierten und fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes aus den dritten und vierten Mitteln (7/18, 7/40) gebildet ist.
2. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) den
Zeichenblock mit einer minimalen Zeicheneinheit als dessen
Inhalt extrahiert.
3. Zeichenerkennungssystem nach Anspruch 2, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) den
Zeichenbereich derart definiert, daß er Ränder hat, die an
obere, untere und seitliche Konturen der minimalen Zeicheneinheit
grenzen.
4. Zeichenerkennungssystem nach Anspruch 2, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) eine
Überlappung zwischen benachbarten individuellen Zeichen zum
separaten Bilden der Zeichenblöcke für jeweilige individuelle
Zeichen erfaßt.
5. Zeichenerkennungssystem nach Anspruch 4, dadurch gekennzeichnet,
daß das zweite Mittel (7/11)
Rausch- oder Störanteile in den Zeichenbild-Daten in jedem
der Zeichenblöcke beseitigt.
6. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet,
daß desweiteren ein siebtes Mittel
(7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen
ist und daß das Zeichenerkennungssystem (7) die Zeichenerkennungsoperation
des fünften Mittels (7/23) für das vorbestimmte
Zeichen durch Auswählen eines Hilfsalgorithmus steuert,
der einfacher als der Algorithmus ist, welcher für die
Zeichen außer dem vorbestimmten Zeichen vorgesehen ist.
7. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet,
daß das sechste Mittel (7/25) mit
dem zweiten Mittel (7/11) zum Gewinnen von Historie-Daten
jedes der Zeichenblöcke, die kennzeichnend für den Verlauf
der Extraktion des Zeichenblocks sind, zum Steuern der Rekombination
des Zeichenblocks in dem dritten Mittel (7/18)
auf der Grundlage der Historie-Daten zusammenwirkt.
8. Zeichenerkennungssystem nach Anspruch 7, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) eine
Vielzahl von Stufen (7/12, 7/13, 7/14) zum Extrahieren der
Zeichenblöcke aus den Dokumentbild-Daten enthält und daß das
sechste Mittel (7/25) Daten enthält, die kennzeichnend für
den Verlauf des Extraktionsprozesses in jedem aus einer
Vielzahl von Zeichenextraktions-Schritten sind.
9. Zeichenerkennungssystem nach Anspruch 8, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) eine
Stufe zum Segmentieren jedes von Zeichenfolgenblöcken, eine
Stufe zum Segmentieren jedes der Zeichenblöcke und eine
Stufe zum Erfassen von mehr als einer von getrennten, jedoch
dicht in einem einzigen Zeichenblock beieinander liegenden
individuellen Zeicheneinheiten zum jeweiligen Zerlegen des
Zeichenblocks in mehrere Zeichenblöcke, die getrennte individuelle
Zeicheneinheiten aufweisen, enthält.
10. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet,
daß die Stufe zum Zeichenfolgensegmentieren
y-Projektionsprofile der Dokumentbild-Daten zum
Auswählen von Horizontalabtastlinien überprüft, die in jedem
der Zeichenfolgenblöcke enthalten sein sollen.
11. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet,
daß die Stufe zum Zeichenfolgensegmentieren
x-Projektionsprofile mit Bezug auf einen vorbestimmten
Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien
überprüft, die in dem Zeichenblock enthalten
sein sollen.
12. Zeichenerkennungssystem nach Anspruch 11, dadurch gekennzeichnet,
daß die Stufe zum Zeichenblocksegmentieren
eine Vielzahl von unterschiedlichen Schwellenpegeln
zum Segmentieren des Zeichenblocks für unterschiedliche
Genauigkeitsstufen beim Segmentieren der Zeichenblöcke
mit einer minimalen Zeicheneinheit verwendet.
13. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet,
daß die Stufe zum Segmentieren
oder Zerlegen der Zeichenblöcke die Kontinuität der Zeicheneinheit
überprüft, die in dem Zeichenblock enthalten
ist, um eine Diskontinuität in der Zeicheneinheit zum Zerlegen
des Zeichenblocks zu erfassen.
14. Zeichenerkennungssystem nach Anspruch 13, dadurch gekennzeichnet,
daß die Stufe zum Zerlegen der
Zeichenblöcke die Kontinuität zwischen benachbarten Bild-
Daten überprüft, die Bits zum Erfassen einer Diskontinuität
der Zeicheneinheit in dem Zeichenblock enthalten.
15. Zeichenerkennungssystem nach Anspruch 9, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) eine
Stufe zum Überprüfen von y-Projektions-Profilen für die
Zeichenbild-Daten in dem Zeichenblock zum Bestimmen der Höhe
des Zeichenblocks enthält, so daß obere und untere Ränder
des Zeichenblocks an die oberen und unteren Konturen der
Zeicheneinheit in dem Zeichenblock grenzen.
16. Zeichenerkennungssystem, gekennzeichnet
durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Segmentieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten einer individuellen Zeicheneinheit enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenblöcken und einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten enthalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25), das dem zweiten Mittel (7/11) zum Gewinnen von Segmentierungs-Daten in bezug auf jeden der Zeichenblöcke, die durch das zweite Mittel (7/11) segmentiert wurden, zugeordnet ist, zum Steuern des Betriebs der dritten, vierten und fünften Mittel (7/18, 7/40, 7/23) auf der Grundlage der Segmentierungs-Daten in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet ist.
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Segmentieren von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild-Daten einer individuellen Zeicheneinheit enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenblöcken und einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten enthalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25), das dem zweiten Mittel (7/11) zum Gewinnen von Segmentierungs-Daten in bezug auf jeden der Zeichenblöcke, die durch das zweite Mittel (7/11) segmentiert wurden, zugeordnet ist, zum Steuern des Betriebs der dritten, vierten und fünften Mittel (7/18, 7/40, 7/23) auf der Grundlage der Segmentierungs-Daten in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet ist.
17. Zeichenerkennungssystem nach Anspruch 16, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) den
Zeichenblock mit einer minimalen Zeicheneinheit als dessen
Inhalt extrahiert.
18. Zeichenerkennungssystem nach Anspruch 17, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) eine
dritte Stufe zum Erfassen von Überlappungen benachbarter
Zeicheneinheiten, die in einem einzigen Zeichenblock enthalten
sind, zum getrennten Bilden von Zeichenblöcken für
die jeweiligen Zeicheneinheiten enthält.
19. Zeichenerkennungssystem nach Anspruch 18, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) desweiteren
eine vierte Segmentierungsstufe zum Beseitigen von
Rausch- oder Störanteilen in den Zeichenbild-Daten jedes der
Zeichenblöcke enthält.
20. Zeichenerkennungssystem nach Anspruch 16, dadurch gekennzeichnet,
daß desweiteren ein siebtes Mittel
(7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen
ist und daß das Zeichenerkennungssystem (7) die Erkennungsoperation
des fünften Mittels (7/23) für das vorbestimmte
Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der
einfacher als der Algorithmus ist, welcher für die Zeichen
außerdem dem vorbestimmten Zeichen vorgesehen ist.
21. Zeichenerkennungssystem nach Anspruch 19, dadurch gekennzeichnet,
daß die erste Segmentierungsstufe
y-Projektionsprofile der Dokumentbild-Daten zum Auswählen
von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke
enthalten sein sollen.
22. Zeichenerkennungssystem nach Anspruch 21, dadurch gekennzeichnet,
daß die zweite Segmentierungsstufe
x-Projektionsprofile mit Bezug auf einen vorbestimmten
Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien
überprüft, die in dem Zeichenblock enthalten sein
sollen.
23. Zeichenerkennungssystem nach Anspruch 22, dadurch gekennzeichnet,
daß die zweite Segmentierungsstufe
eine Vielzahl von unterschiedlichen Schwellenpegeln zum
Segmentieren des Zeichenblocks für unterschiedlichen Genauigkeitsstufen
beim Segmentieren von Zeichenblöcken mit einer
minimalen Zeicheneinheit als deren Inhalt verwendet.
24. Zeichenerkennungssystem nach Anspruch 23, dadurch gekennzeichnet,
daß die dritte Segmentierungsstufe
die Kontinuität der Zeicheneinheit, die in dem Zeichenblock
enthalten ist, zum Erfassen einer Diskontinuität in der
Zeicheneinheit zum Zerlegen des Zeichenblocks überprüft.
25. Zeichenerkennungssystem nach Anspruch 24, dadurch gekennzeichnet,
daß die dritte Segmentierungs-
oder Zerlegungsstufe die Kontinuität zwischen benachbarten
Bild-Daten, die Bits zum Erfassen einer Diskontinuität der
Zeicheneinheit in dem Zeichenblock enthalten, überprüft.
26. Zeichenerkennungssystem nach Anspruch 25, dadurch gekennzeichnet,
daß das sechste Mittel (7/25)
Segmentierungs-Daten mit Bezug auf die zweite, die dritte
und die vierte der Segmentierungsstufen enthält.
27. Zeichenerkennungssystem nach Anspruch 26, dadurch gekennzeichnet,
daß das sechste Mittel (7/25) Segmentierungshistorie-
Daten mit Bezug auf jeden Zeichenblock
in den jeweiligen zweiten, dritten und vierten Segmentierungsstufen
erhält.
28. Zeichenerkennungssystem, gekennzeichnet
durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild- Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten einer Zeicheneinheit enthalten, sowie einer dritten Segmentierungsstufe zum Überprüfen der Kontinuität von Bild-Daten, die innerhalb jedes Zeichenblocks Bits zum Erfassen einer Diskontinuität enthalten, zum Zerlegen der Zeichenblöcke in mehr als einen Zeichenblock derart, daß Zeichenblöcke gewonnen werden, die jeweils eine minimale Zeicheneinheit beinhalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25) zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet ist.
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild- Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten einer Zeicheneinheit enthalten, sowie einer dritten Segmentierungsstufe zum Überprüfen der Kontinuität von Bild-Daten, die innerhalb jedes Zeichenblocks Bits zum Erfassen einer Diskontinuität enthalten, zum Zerlegen der Zeichenblöcke in mehr als einen Zeichenblock derart, daß Zeichenblöcke gewonnen werden, die jeweils eine minimale Zeicheneinheit beinhalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25) zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet ist.
29. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) den
Zeichenbereich derart definiert, daß er Ränder hat, die an
obere, untere und seitliche Konturen der minimalen Zeicheneinheit
grenzen, die darin enthalten ist.
30. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) desweiteren
eine vierte Stufe zum Beseitigen eines Rausch- oder
Störanteils in den Bild-Daten der Zeicheneinheit enthält.
31. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet,
daß desweiteren ein siebtes Mittel
(7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen
ist und daß das Zeichenerkennungssystem (7) die Erkennungsoperation
des fünften Mittels (7/23) für das vorbestimmte
Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der
einfacher als der Algorithmus ist, welcher für die Zeichen
außer dem vorbestimmten Zeichen vorgesehen ist.
32. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet,
daß die erste Segmentierungsstufe
y-Projektionsprofile der Dokumentbild-Daten zum Auswählen
von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke
enthalten sein sollen.
33. Zeichenerkennungssystem nach Anspruch 32, dadurch gekennzeichnet,
daß die zweite Segmentierungsstufe
x-Projektionsprofile mit Bezug auf einen vorbestimmten
Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien
überprüft, die in dem Zeichenblock enthalten sein
sollen.
34. Zeichenerkennungssystem nach Anspruch 33, dadurch gekennzeichnet,
daß die zweite Segmentierungsstufe
eine Vielzahl von unterschiedlichen Schwellenpegeln zum
Segmentieren des Zeichenblocks für unterschiedliche Genauigkeitsstufen
beim Segmentieren von Zeichenblöcken mit einer
minimalen Zeicheneinheit als deren Inhalt verwendet.
35. Zeichenerkennungssystem nach Anspruch 28, dadurch gekennzeichnet,
daß das sechste Mittel (7/25)
Segmentierungs-Daten mit Bezug auf die zweite, die dritte
und die vierte der Segmentierungsstufen erhält.
36. Zeichenerkennungssystem nach Anspruch 35, dadurch gekennzeichnet,
daß das sechste Mittel (7/25) Segmentierungshistorie-
Daten mit Bezug auf jeden Zeichenblock
in den jeweiligen zweiten, dritten und vierten Segmentierungsstufen
erhält.
37. Zeichenerkennungssystem, gekennzeichnet
durch
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild- Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten einer Zeicheneinheit enthalten, sowie einer dritten Segmentierungsstufe zum Überprüfen der Kontinuität von Bild-Daten, die Bits innerhalb jedes Zeichenblocks zum Erfassen einer Diskontinuität aufweisen, zum Zerlegen der Zeichenblöcke in mehr als einen Zeichenblock, um so Zeichenblöcke zu gewinnen, die eine minimale Zeicheneinheit enthalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25), das dem zweiten Mittel (7/11) zum Übernehmen von Segmentierungshistorie-Daten in bezug auf zumindest die zweite und die dritte der Segmentierungsstufen, was durch das zweite Mittel (7/11) bewirkt wird, zugeordnet ist, wobei die Segmentierungshistorie-Daten kennzeichnend für den Verlauf der Segmentierung von Zeichenblöcken in jeder der ersten und dritten Stufen sind, zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet wurde.
ein erstes Mittel (3) zum Gewinnen eines Videosignals, das Bild-Daten eines Dokuments enthält,
ein zweites Mittel (7/11) zum Gewinnen einer Vielzahl von Zeichenblöcken, wobei jeder dieser Zeichenblöcke Bild- Daten individueller Zeichen in dem Dokument enthält und wobei das zweite Mittel (7/11) eine Vielzahl von Segmentierungsstufen mit einer ersten Segmentierungsstufe zum Segmentieren von Zeichenfolgenblöcken, einer zweiten Segmentierungsstufe zum Segmentieren jedes von Zeichenblöcken, die Zeichenbild-Daten einer Zeicheneinheit enthalten, sowie einer dritten Segmentierungsstufe zum Überprüfen der Kontinuität von Bild-Daten, die Bits innerhalb jedes Zeichenblocks zum Erfassen einer Diskontinuität aufweisen, zum Zerlegen der Zeichenblöcke in mehr als einen Zeichenblock, um so Zeichenblöcke zu gewinnen, die eine minimale Zeicheneinheit enthalten, aufweist,
ein drittes Mittel (7/18) zum Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
ein viertes Mittel (7/40) zum Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
ein fünftes Mittel (7/23) zum Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und zum Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
ein sechstes Mittel (7/25), das dem zweiten Mittel (7/11) zum Übernehmen von Segmentierungshistorie-Daten in bezug auf zumindest die zweite und die dritte der Segmentierungsstufen, was durch das zweite Mittel (7/11) bewirkt wird, zugeordnet ist, wobei die Segmentierungshistorie-Daten kennzeichnend für den Verlauf der Segmentierung von Zeichenblöcken in jeder der ersten und dritten Stufen sind, zum Steuern des Betriebs des dritten, des vierten und des fünften Mittels (7/18, 7/40, 7/23) in einer derartigen Weise, daß das sechste Mittel (7/25) wahlweise eines der dritten und vierten Mittel (7/18, 7/40) in Betrieb setzt, wenn das fünfte Mittel (7/23) nicht in der Lage ist, ein Zeichen in dem Zeichenblock zu erkennen, um auf diese Weise das Erkennen von Zeichen in dem fünften Mittel (7/23) mit dem Zeichenblock sicherzustellen, der durch ein ausgewähltes der dritten und vierten Mittel (7/18, 7/40) gebildet wurde.
38. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) eine
dritte Stufe zum Erfassen von Überlappungen benachbarter
Zeicheneinheiten, die in einem einzigen Zeichenblock enthalten
sind, zum getrennten Bilden von Zeichenblöcken für
die jeweiligen Zeicheneinheiten enthält.
39. Zeichenerkennungssystem nach Anspruch 38, dadurch gekennzeichnet,
daß das zweite Mittel (7/11) desweiteren
eine vierte Segmentierungsstufe zum Beseitigen von
Rausch- oder Störanteilen in den Zeichenbild-Daten jedes der
Zeichenblöcke enthält.
40. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet,
daß desweiteren ein siebtes Mittel
(7/30) zum Erfassen eines vorbestimmten Zeichens vorgesehen
ist und daß das Zeichenerkennungssystem (7) die Erkennungsoperation
des fünften Mittels (7/23) für das vorbestimmte
Zeichen durch Auswählen eines Hilfsalgorithmus steuert, der
einfacher als der Algorithmus ist, welcher für die Zeichen
außer dem vorbestimmten Zeichen vorgesehen ist.
41. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet,
daß die erste Segmentierungsstufe
y-Projektionsprofile der Dokumentbild-Daten zum Auswählen
von Horizontalabtastlinien überprüft, die in jedem der Zeichenfolgenblöcke
enthalten sein sollen.
42. Zeichenerkennungssystem nach Anspruch 41, dadurch gekennzeichnet,
daß die zweite Segmentierungsstufe
x-Projektionsprofile mit Bezug auf einen vorbestimmten
Schwellenpegel (TH 0, TH 1) zum Auswählen von Vertikalabtastlinien
überprüft, die in dem Zeichenblock enthalten sein
sollen.
43. Zeichenerkennungssystem nach Anspruch 42, dadurch gekennzeichnet,
daß die zweite Segmentierungsstufe
eine Vielzahl von unterschiedlichen Schwellenpegeln zum
Segmentieren des Zeichenblocks für unterschiedliche Genauigkeitsstufen
beim Segmentieren von Zeichenblöcken mit einer
minimalen Zeicheneinheit als deren Inhalt verwendet.
44. Zeichenerkennungssystem nach Anspruch 37, dadurch gekennzeichnet,
daß in dem sechsten Mittel (7/25)
abwechselnd hohe logische Pegel (HIGH) und niedrige logische
Pegel (LOW) für Zeichenblöcke gesetzt werden, die durch jede
der zweiten und dritten Segmentierungsstufen segmentiert
werden, um Segmentierungshistorie-Daten zu bilden.
45. Verfahren zum Erkennen von Zeichen, die in einem Dokument
enthalten sind, gekennzeichnet durch
Schritte zum
Gewinnen eines Videosignals, das Bild-Daten des Dokuments enthält,
Extrahieren von Zeichenblöcken, von denen jeder Bild- Daten von individuellen Zeichen in dem Dokument enthält,
Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
Steuern der Operationen in dem Schritt zum Rekombinieren, in dem Schritt zum Reextrahieren und in dem Schritt zum Zeichenerkennen in einer Weise, daß der Schritt zum Rekombinieren, der Schritt zum Reextrahieren und der Schritt zum Zeichenerkennen wahlweise durchgeführt wird, um eine Erkennung von Zeichen durch Wiederholen des Schritts zum Rekombinieren, des Schritts zum Reextrahieren und des Schritts zum Zeichenerkennen sicherzustellen.
Gewinnen eines Videosignals, das Bild-Daten des Dokuments enthält,
Extrahieren von Zeichenblöcken, von denen jeder Bild- Daten von individuellen Zeichen in dem Dokument enthält,
Rekombinieren zweier oder mehrerer Zeichenblöcke zum Bilden eines kombinierten Zeichenblocks,
Reextrahieren eines Zeichenblocks zum Bilden eines reextrahierten Zeichenblocks,
Durchführen einer Zeichenerkennung gemäß einem vorbestimmten Algorithmus und Ausgeben eines das erkannte Zeichen kennzeichnenden Signals (S 10) sowie
Steuern der Operationen in dem Schritt zum Rekombinieren, in dem Schritt zum Reextrahieren und in dem Schritt zum Zeichenerkennen in einer Weise, daß der Schritt zum Rekombinieren, der Schritt zum Reextrahieren und der Schritt zum Zeichenerkennen wahlweise durchgeführt wird, um eine Erkennung von Zeichen durch Wiederholen des Schritts zum Rekombinieren, des Schritts zum Reextrahieren und des Schritts zum Zeichenerkennen sicherzustellen.
46. Zeichenerkennungsverfahren nach Anspruch 45, dadurch
gekennzeichnet, daß der Schritt zum Extrahieren
der Zeichenblöcke ausgeführt wird, um den Zeichenblock
so zu extrahieren, daß er eine minimale Zeicheneinheit enthält.
47. Zeichenerkennungsverfahren nach Anspruch 46, dadurch
gekennzeichnet, daß in dem Zeichenblock-Extraktionsschritt
ein Zeichenblock so definiert wird, daß er
Ränder aufweist, die an obere, untere und seitliche Konturen
der minimalen Zeicheneinheit grenzen.
48. Zeichenerkennungsverfahren nach Anspruch 46, dadurch
gekennzeichnet, daß in dem Zeichenblock-Extraktionsschritt
eine Überlappung benachbarter individueller
Zeichen zum Bilden separater Zeichenblöcke für jeweilige
individuelle Zeichen erfaßt wird.
49. Zeichenerkennungsverfahren nach Anspruch 48, dadurch
gekennzeichnet, daß in dem Zeichenblock-Extraktionsschritt
ein Rausch- oder Störanteil in den Zeichenbild-
Daten jedes der Zeichenblöcke beseitigt wird.
50. Zeichenerkennungsverfahren nach Anspruch 45, dadurch
gekennzeichnet, daß desweiteren ein Schritt
zum Erfassen eines vorbestimmten Zeichens vorgesehen ist und
daß bei dem Verfahren die Zeichenerkennungsoperation für das
vorbestimmte Zeichen durch Auswählen eines Hilfsalgorithmus
gesteuert wird, der einfacher als der Algorithmus ist, welcher
für die Zeichen außer dem vorbestimmten Zeichen benutzt
wird.
51. Zeichenerkennungsverfahren nach Anspruch 45, dadurch
gekennzeichnet, daß der Schritt zum Steuern
des Rekombinationsschritts, des Reextraktionsschritts und
des Zeichenerkennungsschritts einen Schritt zum Gewinnen von
Historie-Daten von jedem Zeichenblock, die kennzeichnend für
den Ablauf der Extraktion des Zeichenblocks sind, zum Steuern
der Rekombination des Zeichenblocks in dem Rekombinationsschritt
auf der Grundlage der Historie-Daten enthält.
52. Zeichenerkennungsverfahren nach Anspruch 51, dadurch
gekennzeichnet, daß der Zeichenblock-Extraktionsschritt
eine Vielzahl von Stufen zum Extrahieren der
Zeichenblöcke aus den Dokumentbild-Daten enthält und daß die
Historie-Daten während des Prozesses der Extraktion gewonnen
werden, der in jeder aus der Vielzahl von Zeichenblock-
Extraktionsstufen ausgeführt wird.
53. Zeichenerkennungsverfahren nach Anspruch 52, dadurch
gekennzeichnet, daß der Zeichenblock-Extraktionsschritt
eine Stufe zum Segmentieren jedes der Zeichenfolgenblöcke,
eine Stufe zum Segmentieren jedes Zeichenblocks
und eine Stufe zum Erfassen von mehr als einer
trennbar einem einzigen Zeichenblock zugeordneten Zeicheneinheit
zum jeweiligen Zerlegen des Zeichenblocks in mehrere
Zeichenblöcke, die voneinander getrennte individuelle Zeicheneinheiten
enthalten, aufweist.
54. Zeichenerkennungsverfahren nach Anspruch 53, dadurch
gekennzeichnet, daß die Zeichenfolgensegmentierungs-
Stufe y-Projektionsprofile der Dokumentbild-
Daten zum Auswählen von Horizontalabtastlinien überprüft,
die in jedem der Zeichenfolgenblöcke enthalten sein sollen.
55. Zeichenerkennungsverfahren nach Anspruch 53, dadurch
gekennzeichnet, daß die Zeichenblocksegmentierungs-
Stufe x-Projektionsprofile mit Bezug auf einen
vorbestimmten Schwellenpegel (TH 0, TH 1) zum Auswählen von
Vertikalabtastlinien überprüft, die in dem Zeichenblock
enthalten sein sollen.
56. Zeichenerkennungsverfahren nach Anspruch 55, dadurch
gekennzeichnet, daß die Zeichenblocksegmentierungs-
Stufe eine Vielzahl von unterschiedlichen Schwellenpegeln
zum Segmentieren von Zeichenblöcken mit einer
minimalen Zeicheneinheit als deren Inhalt bei unterschiedlichen
Genauigkeitsstufen verwendet.
57. Zeichenerkennungsverfahren nach Anspruch 53, dadurch
gekennzeichnet, daß die Zeichenblocksegmentierungs-
oder -zerlegungs-Stufe die Kontinuität der Zeicheneinheit,
die in einem Zeichenblock enthalten ist, zum
Erfassen einer Diskontinuität in der Zeicheneinheit zum
Zerlegen des Zeichenblocks überprüft.
58. Zeichenerkennungsverfahren nach Anspruch 57, dadurch
gekennzeichnet, daß die Zeichenblock-zerlegungs-
Stufe die Kontinuität zwischen benachbarten Bilddaten,
die Bits zum Erfassen einer Diskontinuität der Zeicheneinheit
in dem Zeichenblock enthalten, überprüft.
59. Zeichenerkennungsverfahren nach Anspruch 53, dadurch
gekennzeichnet, daß der Zeichenblock-Extraktionsschritt
desweiteren eine Stufe zum Überprüfen eines y-
Projektionsprofils für die Zeichenbild-Daten in dem Zeichenblock
zum Bestimmen der Höhe des Zeichenblocks enthält,
so daß obere und untere Ränder des Zeichenblocks an die
oberen und unteren Konturen der Zeicheneinheit in dem Zeichenblock
stoßen.
60. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bilddaten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-Daten
eines individuellen Zeichens in dem Dokument enthält, und
Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals, gekennzeichnet
durch Zeichenblock-Extraktionsmittel mit
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert.
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert.
61. Zeichenerkennungssystem nach Anspruch 61, dadurch
gekennzeichnet, daß das erste Mittel den Pegel
eines x-Projektionsprofils jeder Folge von Zeichenfolgen mit
einem ersten Schwellenpegel (TH 0) zum Extrahieren jedes der
Zeichenblöcke bei einer ersten Genauigkeitsstufe vergleicht
und daß das zweite Mittel den Pegel des x-Projektionsprofils
mit einem zweiten Schwellenpegel (TH 1), der höher als der
erste Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke
bei einer zweiten Genauigkeitsstufe vergleicht.
62. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals, gekennzeichnet
durch Zeichenblock-Extraktionsmittel mit
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke und
einem zweiten Mittel zum Prüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem der Zeichenblöcke zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den Zeichenblock, der in dem ersten Mittel extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität zu benachbarten Bits mit dem Pegel HIGH ("1") haben.
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke und
einem zweiten Mittel zum Prüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem der Zeichenblöcke zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den Zeichenblock, der in dem ersten Mittel extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität zu benachbarten Bits mit dem Pegel HIGH ("1") haben.
63. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals, gekennzeichnet
durch Zeichenblock-Extraktionsmittel mit
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert, und
einem dritten Mittel zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden der Zeichenblöcke während der Extraktionsoperation in dem ersten und dem zweiten Mittel, welche Extraktionshysterese-Daten bei der Zeichenerkennung durch das Zeichenerkennungsmittel benutzt werden.
einem ersten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Mittel zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert, und
einem dritten Mittel zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden der Zeichenblöcke während der Extraktionsoperation in dem ersten und dem zweiten Mittel, welche Extraktionshysterese-Daten bei der Zeichenerkennung durch das Zeichenerkennungsmittel benutzt werden.
64. Zeichenerkennungssystem nach Anspruch 63, dadurch
gekennzeichnet, daß das erste Mittel den Pegel
eines x-Projektionsprofils jeder Folge von Zeichenfolgen mit
einem ersten Schwellenpegel (TH 0) zum Extrahieren jedes der
Zeichenblöcke bei einer ersten Genauigkeitsstufe vergleicht
und daß das zweite Mittel den Pegel des x-Projektionsprofils
mit einem zweiten Schwellenpegel (TH 1), der höher als der
erste Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke
bei einer zweiten Genauigkeitsstufe vergleicht.
65. Zeichenerkennungssystem nach Anspruch 63, dadurch
gekennzeichnet, daß die Extraktionshysterese-
Daten, die durch das dritte Mittel gespeichert werden,
kennzeichnend für den Ablauf der Extraktion in jedem der
ersten und zweiten Mittel sind.
66. Zeichenerkennungssystem nach Anspruch 65, dadurch
gekennzeichnet, daß das dritte Mittel jeweils
einen Speicherplatz für jedes Bit der Extraktionshysterese-
Daten in jedem der ersten und zweiten Mittel zum Speichern
dieser Bits in Form eines Binärcodes aufweist.
67. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals, gekennzeichnet
durch ein Verfahren zum Extrahieren der Zeichenblöcke,
wovon jeder Bild-Daten einer Zeicheneinheit enthält,
mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert.
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe zum Gewinnen von ersten Extraktions-Daten und
einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe zum Gewinnen von zweiten Extraktions-Daten, wobei die zweite Genauigkeitsstufe eine höhere Genauigkeit als die erste Genauigkeitsstufe repräsentiert.
68. Verfahren nach Anspruch 67, dadurch gekennzeichnet,
daß in dem ersten Schritt der Pegel eines
x-Projektionsprofils jeder Folge von Zeichenfolgen mit einem
ersten Schwellenpegel (TH 0) zum Extrahieren jedes der Zeichenblöcke
bei einer ersten Genauigkeitsstufe verglichen wird
und daß in dem zweiten Schritt der Pegel des x-Projektionsprofils
mit einem zweiten Schwellenpegel (TH 1), der höher
als der erste Schwellenpegel (TH 0) liegt, zum Extrahieren
der Zeichenblöcke bei einer zweiten Genauigkeitsstufe verglichen
wird.
69. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals, gekennzeichnet
durch ein Verfahren zum Extrahieren der Zeichenblöcke,
wovon jeder Bild-Daten betreffend ein Einheitszeichen
enthält, mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke und
einem zweiten Schritt zum Prüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem Zeichenblock zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den betreffenden Zeichenblock, der in dem ersten Schritt extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität zu benachbarten Bits mit dem Pegel HIGH ("1") aufweisen.
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke und
einem zweiten Schritt zum Prüfen der Kontinuität von Bild-Daten, die Bits mit dem Pegel HIGH ("1") enthalten, in jedem Zeichenblock zum Erfassen einer Diskontinuität der Bits mit dem Pegel HIGH ("1") zu benachbarten Bits mit dem Pegel HIGH ("1"), um den betreffenden Zeichenblock, der in dem ersten Schritt extrahiert wurde, in eine Vielzahl von Blöcken zu zerlegen, wovon jeder Zeichenbild-Daten enthält, die aus Bits mit dem Pegel HIGH ("1") bestehen, die eine Kontinuität zu benachbarten Bits mit dem Pegel HIGH ("1") aufweisen.
70. Zeichenerkennungssystem mit Mitteln zum Gewinnen eines
Videosignals, das Bild-Daten eines Dokuments enthält, Mitteln
zum Extrahieren von Zeichenblöcken, wovon jeder Bild-
Daten eines individuellen Zeichens in dem Dokument enthält,
und Mitteln zum Durchführen einer Zeichenerkennung auf der
Grundlage von Extraktions-Daten, die durch die Zeichenblock-
Extraktionsmittel gewonnen wurden, gemäß einem vorbestimmten
Algorithmus und zum Ausgeben eines das erkannte
Zeichen kennzeichnenden Signals, gekennzeichnet
durch ein Verfahren zum Extrahieren der Zeichenblöcke,
wovon jeder Bild-Daten einer Zeicheneinheit enthält,
mit
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die der ersten Genauigkeitsstufe repräsentiert, und
einem dritten Schritt zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden Zeichenblock während der Extraktionsoperation in dem ersten und dem zweiten Schritt, welche Extraktionshysterese-Daten in dem Zeichenerkennungsprozeß, der durch das Zeichenerkennungsmittel ausgeführt wird, benutzt werden.
einem ersten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer ersten Genauigkeitsstufe,
einem zweiten Schritt zum Extrahieren jedes der Zeichenblöcke bei einer zweiten Genauigkeitsstufe, die eine höhere Genauigkeit als die der ersten Genauigkeitsstufe repräsentiert, und
einem dritten Schritt zum Aufzeichnen oder Speichern von Extraktionshysterese-Daten in bezug auf jeden Zeichenblock während der Extraktionsoperation in dem ersten und dem zweiten Schritt, welche Extraktionshysterese-Daten in dem Zeichenerkennungsprozeß, der durch das Zeichenerkennungsmittel ausgeführt wird, benutzt werden.
71. Verfahren nach Anspruch 70, dadurch gekennzeichnet,
daß der Pegel eines x-Projektionsprofil
jeder Folge von Zeichenfolgen mit einem ersten Schwellenpegel
(TH 0) zum Extrahieren jedes der Zeichenblöcke bei einer
ersten Genauigkeitsstufe in dem ersten Schritt verglichen
wird und daß der Pegel des x-Projektionsprofils mit einem
zweiten Schwellenpegel (TH 1), der höher als der erste
Schwellenpegel (TH 0) liegt, zum Extrahieren der Zeichenblöcke
bei einer zweiten Genauigkeitsstufe in dem zweiten
Schritt verglichen wird.
72. Zeichenerkennungssystem, betrieben durch ein Verfahren
nach Anspruch 70, dadurch gekennzeichnet, daß
die Extraktionshysterese-Daten, die in dem dritten Schritt
aufgezeichnet oder gespeichert wurden, kennzeichnend für die
Reihenfolge der Schritte oder den Verlauf der Extraktion in
jedem der ersten und zweiten Schritte sind.
73. Zeichenerkennungssystem nach Anspruch 72, dadurch
gekennzeichnet, daß in dem dritten Schritt
alle der Extraktionshysterese-Daten in jedem der ersten und
zweiten Schritte in jeweils einem Speicherplatz für jedes
der Bits dieser Daten in Form eines Binärcodes gespeichert
werden.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60213755A JPS6274181A (ja) | 1985-09-27 | 1985-09-27 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3632832A1 true DE3632832A1 (de) | 1987-05-07 |
Family
ID=16644487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19863632832 Withdrawn DE3632832A1 (de) | 1985-09-27 | 1986-09-26 | Zeichenerkennungssystem |
Country Status (8)
Country | Link |
---|---|
US (1) | US4850025A (de) |
JP (1) | JPS6274181A (de) |
KR (1) | KR870003439A (de) |
CN (1) | CN1008022B (de) |
CA (1) | CA1273110A (de) |
DE (1) | DE3632832A1 (de) |
FR (1) | FR2588104B1 (de) |
GB (3) | GB2182796B (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19508135A1 (de) * | 1995-03-08 | 1996-09-12 | Licentia Gmbh | Verfahren zur Verbesserung der Erkennung von Maschinenschriften mit fester Schriftteilung |
DE19522394A1 (de) * | 1995-06-23 | 1997-01-02 | Licentia Gmbh | Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2212636A (en) * | 1987-11-17 | 1989-07-26 | Amoco Corp | Identifying data format |
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
JP3017740B2 (ja) * | 1988-08-23 | 2000-03-13 | ソニー株式会社 | オンライン文字認識装置およびオンライン文字認識方法 |
JP2847715B2 (ja) * | 1988-08-30 | 1999-01-20 | ソニー株式会社 | 文字認識装置及び文字認識方法 |
US5295198A (en) * | 1988-10-14 | 1994-03-15 | Harris Corporation | Pattern identification by analysis of digital words |
JPH07101441B2 (ja) * | 1989-02-21 | 1995-11-01 | 富士電機株式会社 | 文字認識方法 |
JP2597006B2 (ja) * | 1989-04-18 | 1997-04-02 | シャープ株式会社 | 矩形座標抽出方法 |
US5361309A (en) * | 1989-09-07 | 1994-11-01 | Canon Kabushiki Kaisha | Character recognition apparatus and method with low-resolution storage for character extraction |
US5272764A (en) * | 1989-12-08 | 1993-12-21 | Xerox Corporation | Detection of highlighted regions |
US5048109A (en) * | 1989-12-08 | 1991-09-10 | Xerox Corporation | Detection of highlighted regions |
US5119433A (en) * | 1990-03-12 | 1992-06-02 | International Business Machines Corporation | Method and system for locating the amount field on a document |
CA2037173C (en) * | 1990-03-30 | 1996-01-09 | Hirofumi Kameyama | Character recognizing system |
US5101439A (en) * | 1990-08-31 | 1992-03-31 | At&T Bell Laboratories | Segmentation process for machine reading of handwritten information |
JP2821285B2 (ja) * | 1991-07-23 | 1998-11-05 | キヤノン株式会社 | 画像処理方法及び装置 |
EP0539158A2 (de) * | 1991-10-21 | 1993-04-28 | Canon Kabushiki Kaisha | Verfahren und Gerät zur Zeichenerkennung |
US5305396A (en) * | 1992-04-17 | 1994-04-19 | International Business Machines Corporation | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms |
US6212299B1 (en) * | 1992-12-11 | 2001-04-03 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for recognizing a character |
US6587587B2 (en) * | 1993-05-20 | 2003-07-01 | Microsoft Corporation | System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings |
JPH07288722A (ja) * | 1994-04-15 | 1995-10-31 | Canon Inc | 撮像装置 |
US5600735A (en) * | 1994-05-10 | 1997-02-04 | Motorola, Inc. | Method of recognizing handwritten input |
GB2289969A (en) * | 1994-05-24 | 1995-12-06 | Ibm | Character segmentation |
US5675665A (en) * | 1994-09-30 | 1997-10-07 | Apple Computer, Inc. | System and method for word recognition using size and placement models |
DE69523567T2 (de) * | 1994-11-14 | 2002-06-27 | Motorola, Inc. | Verfahren zur handschrift-eingangsaufteilung |
US5737443A (en) * | 1994-11-14 | 1998-04-07 | Motorola, Inc. | Method of joining handwritten input |
JPH08235310A (ja) * | 1995-02-24 | 1996-09-13 | Nec Corp | 接触文字切り出し装置 |
JP3606500B2 (ja) * | 1997-01-31 | 2005-01-05 | 株式会社リコー | 矩形分類方法 |
SG71018A1 (en) * | 1997-03-01 | 2000-03-21 | Inst Of Systems Science Nat Un | Robust identification code recognition system |
GB9808712D0 (en) | 1997-11-05 | 1998-06-24 | British Aerospace | Automatic target recognition apparatus and process |
US6445834B1 (en) | 1998-10-19 | 2002-09-03 | Sony Corporation | Modular image query system |
US6256409B1 (en) | 1998-10-19 | 2001-07-03 | Sony Corporation | Method for determining a correlation between images using multi-element image descriptors |
JP2000163044A (ja) * | 1998-11-30 | 2000-06-16 | Sharp Corp | 画像表示装置 |
US6473517B1 (en) * | 1999-09-15 | 2002-10-29 | Siemens Corporate Research, Inc. | Character segmentation method for vehicle license plate recognition |
US6674915B1 (en) * | 1999-10-07 | 2004-01-06 | Sony Corporation | Descriptors adjustment when using steerable pyramid to extract features for content based search |
US7305617B2 (en) * | 2000-02-12 | 2007-12-04 | Adobe Systems Incorporated | Method for aligning text to baseline grids and to CJK character grids |
US6725218B1 (en) | 2000-04-28 | 2004-04-20 | Cisco Technology, Inc. | Computerized database system and method |
JP4613397B2 (ja) * | 2000-06-28 | 2011-01-19 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
CA2417663C (en) | 2000-07-28 | 2008-09-30 | Raf Technology, Inc. | Orthogonal technology for multi-line character recognition |
US8682077B1 (en) | 2000-11-28 | 2014-03-25 | Hand Held Products, Inc. | Method for omnidirectional processing of 2D images including recognizable characters |
US6735337B2 (en) * | 2001-02-02 | 2004-05-11 | Shih-Jong J. Lee | Robust method for automatic reading of skewed, rotated or partially obscured characters |
US8144988B2 (en) * | 2007-09-06 | 2012-03-27 | Ricoh Company, Ltd. | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program |
US8194982B2 (en) * | 2007-09-18 | 2012-06-05 | Ricoh Company, Ltd. | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program |
KR101035744B1 (ko) * | 2008-12-08 | 2011-05-20 | 삼성전자주식회사 | 카메라를 이용한 문자 인식 장치 및 방법 |
CN102081736B (zh) * | 2009-11-27 | 2014-11-26 | 株式会社理光 | 从可移植电子文档中提取字符外接矩形的设备和方法 |
JP5508953B2 (ja) * | 2010-06-28 | 2014-06-04 | 株式会社日立ソリューションズ | 文書処理装置及びプログラム |
TWI478074B (zh) * | 2010-12-01 | 2015-03-21 | Inst Information Industry | 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 |
US9082339B2 (en) * | 2011-11-04 | 2015-07-14 | Facebook, Inc. | Rendering texts on electronic devices |
US8818030B2 (en) * | 2011-12-13 | 2014-08-26 | Xerox Corporation | Post-processing a multi-spectral image for enhanced object identification |
JP6078953B2 (ja) * | 2012-02-17 | 2017-02-15 | オムロン株式会社 | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
JP6286866B2 (ja) * | 2013-05-20 | 2018-03-07 | オムロン株式会社 | 画像処理装置および画像処理方法 |
WO2019162970A1 (en) * | 2018-02-26 | 2019-08-29 | Videonetics Technology Private Limited | A system for real-time automated segmentation and recognition of vehicle's license plates characters from vehicle's image and a method thereof. |
CN112307820B (zh) * | 2019-07-29 | 2022-03-22 | 北京易真学思教育科技有限公司 | 文本识别方法、装置、设备和计算机可读介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3517387A (en) * | 1965-10-24 | 1970-06-23 | Ibm | Character isolation apparatus |
US3526876A (en) * | 1965-10-24 | 1970-09-01 | Ibm | Character separation apparatus for character recognition machines |
US3662341A (en) * | 1970-09-25 | 1972-05-09 | Ibm | Video-derived segmentation-gating apparatus for optical character recognition |
US3846752A (en) * | 1972-10-02 | 1974-11-05 | Hitachi Ltd | Character recognition apparatus |
NL160408C (nl) * | 1973-02-21 | 1979-10-15 | Nederlanden Staat | Inrichting voor het lezen van tekens, bij voorkeur van cijfers. |
FR2267590B1 (de) * | 1974-04-10 | 1977-05-20 | Ibm | |
JPS5156139A (en) * | 1974-11-13 | 1976-05-17 | Hitachi Ltd | Mojomitorisochi niokeru kiridashihoshiki |
US4087790A (en) * | 1977-08-22 | 1978-05-02 | Recognition Equipment Incorporated | Character presence processor |
US4379282A (en) * | 1979-06-01 | 1983-04-05 | Dest Corporation | Apparatus and method for separation of optical character recognition data |
JPS6043555B2 (ja) * | 1980-02-26 | 1985-09-28 | 株式会社トキメック | 印字文字切出し装置 |
US4377803A (en) * | 1980-07-02 | 1983-03-22 | International Business Machines Corporation | Algorithm for the segmentation of printed fixed pitch documents |
JPS5998283A (ja) * | 1982-11-27 | 1984-06-06 | Hitachi Ltd | パターン切出しおよび認識方法、ならびにそのシステム |
DE3480667D1 (de) * | 1983-03-01 | 1990-01-11 | Nec Corp | System zum bestimmen des zeichenabstandes. |
US4610025A (en) * | 1984-06-22 | 1986-09-02 | Champollion Incorporated | Cryptographic analysis system |
JPH0610829B2 (ja) * | 1984-06-29 | 1994-02-09 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 手書き文字認識方法 |
-
1985
- 1985-09-27 JP JP60213755A patent/JPS6274181A/ja active Pending
-
1986
- 1986-09-23 US US06/910,890 patent/US4850025A/en not_active Expired - Fee Related
- 1986-09-25 GB GB8623049A patent/GB2182796B/en not_active Expired - Lifetime
- 1986-09-25 CA CA000519051A patent/CA1273110A/en not_active Expired - Lifetime
- 1986-09-26 DE DE19863632832 patent/DE3632832A1/de not_active Withdrawn
- 1986-09-27 CN CN86107537A patent/CN1008022B/zh not_active Expired
- 1986-09-27 KR KR1019860008111A patent/KR870003439A/ko not_active Application Discontinuation
- 1986-09-29 FR FR868613524A patent/FR2588104B1/fr not_active Expired - Lifetime
-
1988
- 1988-10-14 GB GB8824148A patent/GB2208735B/en not_active Expired - Lifetime
- 1988-10-14 GB GB8824149A patent/GB2208736B/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19508135A1 (de) * | 1995-03-08 | 1996-09-12 | Licentia Gmbh | Verfahren zur Verbesserung der Erkennung von Maschinenschriften mit fester Schriftteilung |
DE19522394A1 (de) * | 1995-06-23 | 1997-01-02 | Licentia Gmbh | Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung |
Also Published As
Publication number | Publication date |
---|---|
FR2588104B1 (fr) | 1992-09-04 |
GB2208736A (en) | 1989-04-12 |
GB2208736B (en) | 1990-04-18 |
KR870003439A (ko) | 1987-04-17 |
US4850025A (en) | 1989-07-18 |
GB2208735A (en) | 1989-04-12 |
GB8824149D0 (en) | 1988-11-23 |
GB2182796A (en) | 1987-05-20 |
GB2208735B (en) | 1990-04-18 |
JPS6274181A (ja) | 1987-04-04 |
FR2588104A1 (fr) | 1987-04-03 |
GB8623049D0 (en) | 1986-10-29 |
CN1008022B (zh) | 1990-05-16 |
CN86107537A (zh) | 1987-04-22 |
CA1273110A (en) | 1990-08-21 |
GB2182796B (en) | 1990-04-18 |
GB8824148D0 (en) | 1988-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3632832A1 (de) | Zeichenerkennungssystem | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
DE69421255T2 (de) | Dokumentkopierabwehrverfahren | |
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE3850595T2 (de) | Dokumentverarbeitungssystem. | |
DE69722971T2 (de) | Automatisches sprachenerkennungssystem für die mehrsprachige optische zeichenerkennung | |
DE69332459T2 (de) | Verfahren und Vorrichtung zur Zeichenerkennung | |
DE69230633T2 (de) | Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich | |
DE3716787C2 (de) | ||
DE3851867T2 (de) | Zeichenerkennungsgerät. | |
DE69232493T2 (de) | Verfahren und Gerät zur Zeichenerkennung | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE69423254T2 (de) | Verfahren und Gerät zur automatischen Spracherkennung von Dokumenten | |
DE3916323A1 (de) | Verfahren zum erkennen eines zeichens und dabei verwendbares zeichenerkennungssystem | |
DE69329380T2 (de) | Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung | |
DE69132206T2 (de) | Verfahren und Gerät zur Bildverarbeitung | |
DE69230631T2 (de) | Verfahren zum Vergleichen von Wortgestalten | |
DE69231923T2 (de) | System mit Annäherungsmittel zur Erkennung von graphischen Elementen in einer Zeichnung | |
DE69226609T2 (de) | Verfahren und Gerät zur Dokumentbildverarbeitung | |
DE19814075B4 (de) | Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern | |
DE69230031T2 (de) | Mustererkennung und -echtheitsprüfung, insbesondere für handgeschriebene Unterschriften | |
DE69329330T2 (de) | Texterkennung | |
DE69721941T2 (de) | Gerät und Verfahren zum Extrahieren von Mustern | |
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE3342947C2 (de) | System zur Verarbeitung eines grafischen Musters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8139 | Disposal/non-payment of the annual fee |